| Отзывы покупателей Amazon | Более 150 млн отзывов покупателей о товарах Amazon |
| AMPLab Big Data Benchmark | Набор данных для бенчмарка, используемый для сравнения производительности решений для хранилищ данных. |
| Анализ данных Stack Overflow в ClickHouse | Анализ данных Stack Overflow в ClickHouse |
| Анонимизированная веб-аналитика | Набор данных из двух таблиц с анонимизированными данными веб-аналитики: hits и visits |
| Бенчмарк Университета Брауна | Новый аналитический бенчмарк для машинно-генерируемых лог-данных |
| Открытые данные по COVID-19 | COVID-19 Open-Data — это крупная открытая база эпидемиологических данных по COVID-19 и связанных факторов, таких как демография, экономика и меры реагирования властей |
| набор данных DBpedia | Набор данных, содержащий 1 миллион статей из Википедии и их векторные представления |
| данные датчиков окружающей среды | Более 20 миллиардов записей данных из Sensor.Community — глобальной сети датчиков, поддерживаемой сообществом и создающей Open Environmental Data. |
| Места Foursquare | Набор данных с более чем 100 миллионами записей, содержащий сведения об объектах на карте, таких как магазины, рестораны, парки, детские площадки и памятники. |
| Геоданные на основе набора данных о вышках сотовой связи | Узнайте, как загрузить данные OpenCelliD в ClickHouse, подключить Apache Superset к ClickHouse и создать панель мониторинга на основе этих данных |
| Набор данных событий GitHub | Набор данных, содержащий все события GitHub с 2011 года по 6 декабря 2020 года, общим объемом 3,1 млрд записей. |
| Набор данных Hacker News | Набор данных, содержащий 28 миллионов строк данных из Hacker News. |
| Набор данных Hacker News для векторного поиска | Набор данных, содержащий более 28 миллионов публикаций Hacker News и их векторные представления |
| Набор данных LAION 5B | Набор данных со 100 миллионами векторов из датасета LAION 5B |
| Датасет Laion-400M | Датасет с 400 миллионами изображений и англоязычными подписями к ним |
| Датасет New York Public Library “What’s on the Menu?” | Набор данных, содержащий 1,3 миллиона записей исторических данных о меню отелей, ресторанов и кафе, включая блюда и их цены. |
| Данные о такси Нью-Йорка | Данные о миллиардах поездок на такси и арендованных автомобилях с водителем (Uber, Lyft и т. д.), совершённых в Нью-Йорке с 2009 года |
| Глобальная историческая климатологическая сеть NOAA | 2,5 миллиарда строк климатических данных за последние 120 лет |
| Данные о жалобах в NYPD | Загрузка данных в формате Tab Separated Value и запросы к ним за 5 шагов |
| OnTime | Набор данных о пунктуальности авиарейсов |
| Star Schema Benchmark (SSB, 2009) | Набор данных и запросы для бенчмарка Star Schema Benchmark (SSB) |
| Наборы данных об исторической погоде на Тайване | 131 миллион строк с данными метеонаблюдений за последние 128 лет |
| Терабайт журналов кликов Criteo | Терабайт журналов кликов Criteo |
| Набор данных о ценах на недвижимость в Великобритании | Узнайте, как использовать проекции для повышения производительности часто выполняемых запросов на основе набора данных о недвижимости Великобритании, который содержит сведения о ценах, уплаченных за объекты недвижимости в Англии и Уэльсе |
| TPC-DS (2012) | Набор данных и запросы бенчмарка TPC-DS. |
| TPC-H (1999) | Набор данных и запросы бенчмарка TPC-H. |
| WikiStat | Ознакомьтесь с набором данных WikiStat, содержащим 0,5 триллиона записей. |
| Написание запросов в ClickHouse с использованием данных из GitHub | Набор данных, содержащий все коммиты и изменения в репозитории ClickHouse |
| Набор данных YouTube с дизлайками | Коллекция дизлайков видео на YouTube. |