Поручиков М.А. Анализ данных. А. поручиков
Скачать 2.76 Mb.
|
Научные исследованияВ сфере анализа данных ведутся активные научные исследования. Анализ публикаций, индексированных в реферативной базе данных SCOPUS, показывает устойчивый рост количества научных работ (табл. 1). Таблица 1. Количество публикаций в базе SCOPUS
В последнее время особый интерес в сфере анализа данных вызывают такие направления исследований, как «большие данные» (Big Data) и «глубокое обучение» (Deep Learning). Передовые разработки в сфере искусственного интеллекта поражают воображение. В 1997 году компьютер DeepBlue впервые выиграл матч из шести партий у чемпиона мира по шахматам [8]. В рамках проекта DeepQA разрабатывается система искусственного интеллекта, позволяющая воспринимать вопросы на естественных языках [9]. Ведется разработка беспилотных автомобилей, ядром системы управления которых является система искусственного интеллекта. Лидером в этой области можно считать компанию Google с проектом Google Self-Driving Car Project [10]. Программное обеспечениеВ основе систем анализа данных лежит программное обеспечение. При проектировании систем анализа данных могут быть использованы следующие подходы: использование «коробочного» программного обеспечения общего назначения (например Microsoft Excel); использование программного обеспечения, ориентированного на математические задачи (например Matlab, Octave, R); разработка специализированного программного обеспечения с использованием готовых библиотек, включающих наборы специальных функций обработки данных. При разработке специализированного ПО рекомендуется использовать готовые библиотеки функций обработки данных. Так, для нейросетевого анализа можно применить библиотеку FANN, имеющую версии для языков программирования С#, С++, Java, Python, R, Matlab [11], а для решения задач обработки изображений – библиотеку OpenCV, имеющую версии для языков Python, Java, Ruby, Matlab и др. [12]. |