Данные. СРС1БД. Полагаю, что в мире людей, данные
Скачать 17.05 Kb.
|
Вайгель З.В. Полагаю, что в мире людей, данные – это жизнь. Все время мы получаем информацию, передаем её другим и создаем новую. Просто просмотрев видео или лайкнув пост в соцсети, человек оставляет информационный след. За последние пару лет данных было сгенерировано больше, чем за прошлый век, это не значит, что люди раньше думали меньше или не обменивались информацией, все дело в развитии технологий, с помощью которых данные можно обработать, пропуская через облачные сервисы и подвергая анализу. У этого явления есть свое определение и имя ему «Большие данные». Большие данные (Big Data) – совокупность непрерывно увеличивающихся объемов информации одного контекста, но разных форматов представления, а также методов и средств для эффективной и быстрой обработки [1]. Основными принципами работы с ними являются: горизонтальная масштабируемость, отказоустойчивость и локальность. Для работы с данными в свою очередь используются языки программирования R и Python, MapReduce, Hadoop, NoSQL и аппаратные решения [2]. Хотя, на самом деле, анализировать данные можно и в Excel, в некоторых казахстанских компаниях использует его как один из инструментов для SQL-аналитиков. Однако, помимо визуализации данных в Excel, есть еще несколько подходов(методологий) анализа Big Data: Машинное обучение Краудсорсинг Смешение и интеграция данных Предиктивная аналитика Имитационное моделирование Статистический анализ Майнинг данных Изучением данных занимается «Наука о данных», в которой есть определение жизненного цикла данных в аналитике: Capture (захват) — сбор данных, ввод данных, прием сигнала, извлечение данных) Maintain (поддержка) — хранение данных, очистка данных, подготовка данных, обработка данных, архитектура данных) Process (обработка) —интеллектуальный анализ данных, кластеризация/классификация, моделирование данных, обобщение данных) Analyze (анализ) — поисковый/подтверждающий, прогнозный анализ, регрессия, анализ текста, качественный анализ) Communicate (информирование о результатах) — передача данных, визуализация данных, бизнес-аналитика, принятие решений)[3]. В будущем, из-за больших данных, конфиденциальность коей мы ее сейчас знаем, станет недоступной и след, который сегодня можно скрыть с помощью анонимных браузеров и виртуальных частных сетей, будет доступен миру. Список литературы 1. https://www.bigdataschool.ru/wiki/большие-данные-big-data 2. https://www.it.ua/ru/knowledge-base/technology-innovation/big-data-bolshie-dannye 3. https://www.it.ua/ru/knowledge-base/technology-innovation/data-science-nauka-o-dannyh |