Поручиков М.А. Анализ данных. А. поручиков
Скачать 2.76 Mb.
|
Вопросы для самоконтроля1 Перечислите факторы быстродействия систем анализа данных. 2 Дайте определение понятия «вычислительная сложность». 3 Приведите принцип сравнения вычислительной сложности алгоритмов. Приведите пример сравнения вычислительной сложности алгоритмов. Приведите алгоритм экспериментального определения вычислительной сложности. Приведите алгоритм прогнозирования быстродействия. ЗадачиСравните вычислительную сложность алгоритмов с O(n) nlog nи O(n) n2 . Решите задачу. Проведен ряд экспериментов по измерению времени, затрачиваемого на обработку массива данных (табл. 30). Таблица 30. Экспериментальные данные
Найдите функциональную зависимость времени обработки данных от размера массива данных. Решите задачу. Экспериментальным путем определено, что зависимость времени t (секунды), затрачиваемого на обработку файла данных объемом S Мбайт, подчиняется закону Определите: t 5,2 S2 . (25) время, которое будет затрачено на обработку файла объемом 5 Мбайт; объем файла, который будет обработан за 20 с. Лабораторная работа «Быстродействие систем анализа данных»Общиесведения Целью работы является приобретение навыка анализа быстродействия систем обработки данных. Задачи: Определение вычислительной сложности алгоритма. Прогнозирование затрат времени на обработку данных. В качестве инструментального средства используется программное обеспечение square_matrix_multiply, описанное ранее на с. 77. Исходныеданные Таблица 31. Варианты задания
Порядоквыполнения Подготовка: Выберите задание (табл. 31). Загрузите программное обеспечение square_matrix_multiply из курса «Анализ данных» СДО университета [2]. Опишите вычислительную систему: процессор, оперативная память, операционная система. Проведение эксперимента: Запустите программу square_matrix_multiply. Задайте условия эксперимента (размер матриц, количество вычислительных потоков) в соответствии с заданием. Установите число экспериментов, равное трём. Проведите эксперименты и сохраните их результаты. В ходе экспериментов сделайте копию экрана с изображением вкладок «Процессы» и «Быстродействие» диспетчера задач Windows. Выполните предварительную обработку экспериментальных данных – усреднение результатов по серии экспериментов. Предварительную обработку удобно проводить с помощью инструмента «Сводные таблицы» программного обеспечения Microsoft Excel. Постройте графики зависимости (для разного числа потоков) времени выполнения вычислений от размера матриц. Пример приведен ниже (рис. 56). Рис. 56. Зависимость времени вычислений от размера матриц Определите функцию, описывающую вычислительную сложность использованного в программе square_matrix_multiply алгоритма. Для этого можно воспользоваться инструментом «Линия тренда» при построении диаграмм в Microsoft Excel. Построить тренд для случая одного вычислительного потока. Пример приведен ниже (рис. 57). Рис. 57. Аппроксимация экспериментальных данных Анализ результатов: Сделайте выводы о влиянии объема исходных данных и фактора распараллеливания на время решения вычислительной задачи. Сделайте выводы о влиянии объема исходных данных и фактора распараллеливания на время решения вычислительной задачи. Сравните время, необходимое для решения задачи умножения матриц размером 10000x10000 при одном вычислительном потоке с помощью алгоритма, использованного в программе square_matrix_multiplyи c помощью алгоритма Штрассена ( O(n) n2,81 ). 3.2 Продемонстрируйте преподавателю полученные результаты. При наличии замечаний провести повторные эксперименты. Отчет о работе: Составьте отчет. Преобразуйте отчет в формат PDF. Создайте архив в формате ZIP, содержащий отчет и таблицу с расчетами и графиками (файл Excel). Прикрепите архив в раздел «Отчет по лабораторной работе №6» (быстродействие систем анализа данных) курса «Анализ данных» СДО университета [2]. При наличии замечаний от преподавателя скорректируйте отчет. Содержаниеотчета Отчет должен содержать: Титульный лист: наименование работы, вариант задания, ФИО студента, номер учебной группы, дата выполнения работы. Реферат. Оглавление. Задание. Описание выполненной работы. 6 Условия эксперимента: Исходные данные. Описание вычислительной системы. 7 Эксперименты: Копия экрана (диспетчер задач, вкладка «Процессы»). Копия экрана (диспетчер задач, вкладка «Быстродействие»). Экспериментальные данные. Обработка экспериментальных данных: Результаты усреднения экспериментальных данных. Графики зависимости времени выполнения вычислений от размера матриц, зависимости времени выполнения вычислений от количества вычислительных потоков. Функция, описывающая вычислительную сложность использованного алгоритма. Выводы. Список использованных источников (нормативные документы). 11 Приложения. Отчет должен быть оформлен в соответствии с действующими стандартами университета [18, 19]. |