Главная страница

Данные. СРС1БД. Полагаю, что в мире людей, данные


Скачать 17.05 Kb.
НазваниеПолагаю, что в мире людей, данные
АнкорДанные
Дата23.09.2021
Размер17.05 Kb.
Формат файлаdocx
Имя файлаСРС1БД.docx
ТипДокументы
#235783

Вайгель З.В.

Полагаю, что в мире людей, данные – это жизнь. Все время мы получаем информацию, передаем её другим и создаем новую. Просто просмотрев видео или лайкнув пост в соцсети, человек оставляет информационный след. За последние пару лет данных было сгенерировано больше, чем за прошлый век, это не значит, что люди раньше думали меньше или не обменивались информацией, все дело в развитии технологий, с помощью которых данные можно обработать, пропуская через облачные сервисы и подвергая анализу. У этого явления есть свое определение и имя ему «Большие данные».

Большие данные (Big Data) – совокупность непрерывно увеличивающихся объемов информации одного контекста, но разных форматов представления, а также методов и средств для эффективной и быстрой обработки [1]. Основными принципами работы с ними являются: горизонтальная масштабируемость, отказоустойчивость и локальность. Для работы с данными в свою очередь используются языки программирования R и Python, MapReduce, Hadoop, NoSQL и аппаратные решения [2]. Хотя, на самом деле, анализировать данные можно и в Excel, в некоторых казахстанских компаниях использует его как один из инструментов для SQL-аналитиков. Однако, помимо визуализации данных в Excel, есть еще несколько подходов(методологий) анализа Big Data:

  • Машинное обучение

  • Краудсорсинг

  • Смешение и интеграция данных

  • Предиктивная аналитика

  • Имитационное моделирование

  • Статистический анализ

  • Майнинг данных

Изучением данных занимается «Наука о данных», в которой есть определение жизненного цикла данных в аналитике:

  • Capture (захват) — сбор данных, ввод данных, прием сигнала, извлечение данных)

  • Maintain (поддержка) — хранение данных, очистка данных, подготовка данных, обработка данных, архитектура данных)

  • Process (обработка) —интеллектуальный анализ данных, кластеризация/классификация, моделирование данных, обобщение данных)

  • Analyze (анализ) — поисковый/подтверждающий, прогнозный анализ, регрессия, анализ текста, качественный анализ)

  • Communicate (информирование о результатах) — передача данных, визуализация данных, бизнес-аналитика, принятие решений)[3].

В будущем, из-за больших данных, конфиденциальность коей мы ее сейчас знаем, станет недоступной и след, который сегодня можно скрыть с помощью анонимных браузеров и виртуальных частных сетей, будет доступен миру.

Список литературы

1. https://www.bigdataschool.ru/wiki/большие-данные-big-data

2. https://www.it.ua/ru/knowledge-base/technology-innovation/big-data-bolshie-dannye

3. https://www.it.ua/ru/knowledge-base/technology-innovation/data-science-nauka-o-dannyh


написать администратору сайта