52 відкриті датасети
Mall Customers Dataset — данные посетителей магазина: id, пол, возраст, доход, рейтинг трат. (Вариант применения: Customer Segmentation Project with Machine Learning)
https://www.kaggle.com/shwetabh123/mall-customers
https://data-flair.training/blogs/r-data-science-project-customer-segmentation/
Iris Dataset — датасет для новичков, содержащий размеры чашелистиков и лепестков для различных цветков.
https://archive.ics.uci.edu/ml/datasets/Iris
MNIST Dataset — датасет рукописных цифр. 60 000 тренировочных изображений и 10 000 тестовых изображений.
http://yann.lecun.com/exdb/mnist/
The Boston Housing Dataset — популярный датасет для распознавания паттернов. Содержит информацию о домах в Бостоне: количество квартир, стоимость аренды, индекс преступлений.
https://www.cs.toronto.edu/delve/data/boston/bostonDetail.html
Wine quality dataset — содержит информацию о вине: 4898 записей с 14 параметрами.
https://archive.ics.uci.edu/ml/datasets/wine+quality SOCR data – Heights and Weights Dataset — хороший вариант для старта. Содержит 25 000 записей о росте и весе 18-ти летних людей.
http://wiki.stat.ucla.edu/socr/index.php/SOCR_Data_Dinov_020108_HeightsWeights
Parkinson Dataset — 195 записей о пациентах с болезнью Паркинсона, с 25 параметрами анализов. Можно использовать для предварительной оценки отличия больных людей от здоровых. (Вариант применения с исходником на Python: Machine Learning Project on Detecting Parkinson’s Disease)
https://archive.ics.uci.edu/ml/datasets/parkinsons
https://data-flair.training/blogs/python-machine-learning-project-detecting-parkinson-disease/
Titanic Dataset — содержит информацию про пассажиров (возраст, пол, родственники на борту и пр) 891 в тренировочном сете и 418 — в тестовом.
https://web.stanford.edu/class/archive/cs/cs109/cs109.1166/problem12.html
Flickr 30k Dataset — более 30 000 изображений и подписей к ним. (Flickr 8k Dataset — 8000 изображений. Проект с исходником на Python: Image Caption Generator Python Project)
https://www.kaggle.com/hsankesara/flickr-image-dataset
https://forms.illinois.edu/sec/1713398
GTSRB (German traffic sign recognition benchmark) Dataset — 50 000 изображений 43 дорожных знаков. (Вариант применения с исходником на Traffic Signs Recognition Python Project)
http://benchmark.ini.rub.de/?section=gtsrb&subsection=dataset
https://data-flair.training/blogs/python-project-traffic-signs-recognition/
Data.gov Portal — портал открытых данных правительства США (сельское хозяйство, здравоохранение, климат, образование, энергетика, финансы, наука и исследования и т.д.).
https://www.data.gov/
Canada Government Open Data Portal — портал открытых данных о канадцах (сельское хозяйство, искусство, музыка, образование, правительство, здравоохранение и т.д.)
https://open.canada.ca/en/open-data
|