Главная страница

52 відкриті датасети. 52 відкриті датасети


Скачать 21.6 Kb.
Название52 відкриті датасети
Дата03.06.2022
Размер21.6 Kb.
Формат файлаdocx
Имя файла52 відкриті датасети.docx
ТипДокументы
#567587


52 відкриті датасети

  1. Mall Customers Dataset — данные посетителей магазина: id, пол, возраст, доход, рейтинг трат. (Вариант применения: Customer Segmentation Project with Machine Learning)

https://www.kaggle.com/shwetabh123/mall-customers

https://data-flair.training/blogs/r-data-science-project-customer-segmentation/


  1. Iris Dataset — датасет для новичков, содержащий размеры чашелистиков и лепестков для различных цветков.

https://archive.ics.uci.edu/ml/datasets/Iris


  1. MNIST Dataset — датасет рукописных цифр. 60 000 тренировочных изображений и 10 000 тестовых изображений.

http://yann.lecun.com/exdb/mnist/


  1. The Boston Housing Dataset — популярный датасет для распознавания паттернов. Содержит информацию о домах в Бостоне: количество квартир, стоимость аренды, индекс преступлений.

https://www.cs.toronto.edu/

delve/data/boston/bostonDetail.html


  1. Wine quality dataset — содержит информацию о вине: 4898 записей с 14 параметрами.

https://archive.ics.uci.edu/ml/datasets/wine+quality
SOCR data – Heights and Weights Dataset — хороший вариант для старта. Содержит 25 000 записей о росте и весе 18-ти летних людей.

http://wiki.stat.ucla.edu/socr/index.php/SOCR_Data_Dinov_020108_HeightsWeights


  1. Parkinson Dataset — 195 записей о пациентах с болезнью Паркинсона, с 25 параметрами анализов. Можно использовать для предварительной оценки отличия больных людей от здоровых. (Вариант применения с исходником на Python: Machine Learning Project on Detecting Parkinson’s Disease)

https://archive.ics.uci.edu/ml/datasets/parkinsons

https://data-flair.training/blogs/python-machine-learning-project-detecting-parkinson-disease/


  1. Titanic Dataset — содержит информацию про пассажиров (возраст, пол, родственники на борту и пр) 891 в тренировочном сете и 418 — в тестовом.

https://web.stanford.edu/class/archive/cs/cs109/cs109.1166/problem12.html


  1. Flickr 30k Dataset — более 30 000 изображений и подписей к ним. (Flickr 8k Dataset — 8000 изображений. Проект с исходником на Python: Image Caption Generator Python Project)

https://www.kaggle.com/hsankesara/flickr-image-dataset

https://forms.illinois.edu/sec/1713398


  1. GTSRB (German traffic sign recognition benchmark) Dataset — 50 000 изображений 43 дорожных знаков. (Вариант применения с исходником на Traffic Signs Recognition Python Project)

http://benchmark.ini.rub.de/?section=gtsrb&subsection=dataset

https://data-flair.training/blogs/python-project-traffic-signs-recognition/


  1. Data.gov Portal — портал открытых данных правительства США (сельское хозяйство, здравоохранение, климат, образование, энергетика, финансы, наука и исследования и т.д.).

https://www.data.gov/


  1. Canada Government Open Data Portal — портал открытых данных о канадцах (сельское хозяйство, искусство, музыка, образование, правительство, здравоохранение и т.д.)

https://open.canada.ca/en/open-data



написать администратору сайта