Главная страница

Поручиков М.А. Анализ данных. А. поручиков


Скачать 2.76 Mb.
НазваниеА. поручиков
Дата25.10.2022
Размер2.76 Mb.
Формат файлаdocx
Имя файлаПоручиков М.А. Анализ данных.docx
ТипАнализ
#753011
страница19 из 20
1   ...   12   13   14   15   16   17   18   19   20

Вопросы для самоконтроля


1 Перечислите факторы быстродействия систем анализа данных. 2 Дайте определение понятия «вычислительная сложность».

3 Приведите принцип сравнения вычислительной сложности алгоритмов.

  1. Приведите пример сравнения вычислительной сложности алгоритмов.

  2. Приведите алгоритм экспериментального определения вычислительной сложности.

  3. Приведите алгоритм прогнозирования быстродействия.

Задачи


  1. Сравните вычислительную сложность алгоритмов с O(n) nlog nи O(n) n2 .

  2. Решите задачу.

Проведен ряд экспериментов по измерению времени, затрачиваемого на обработку массива данных (табл. 30).
Таблица 30. Экспериментальные данные


Размер массива данных, кбайт

Время обработки, с

10

6

20

10

30

19

40

26

50

36

60

48

70

62

80

88

90

96

100

115


Найдите функциональную зависимость времени обработки данных от размера массива данных.

  1. Решите задачу.

Экспериментальным путем определено, что зависимость времени t (секунды), затрачиваемого на обработку файла данных объемом S Мбайт, подчиняется закону



Определите:

t 5,2 S2 . (25)

  1. время, которое будет затрачено на обработку файла объемом 5 Мбайт;

  2. объем файла, который будет обработан за 20 с.

Лабораторная работа «Быстродействие систем анализа данных»


Общиесведения

Целью работы является приобретение навыка анализа быстродействия систем обработки данных.

Задачи:

    1. Определение вычислительной сложности алгоритма.

    2. Прогнозирование затрат времени на обработку данных.

В качестве инструментального средства используется программное обеспечение square_matrix_multiply, описанное ранее на с. 77.

Исходныеданные
Таблица 31. Варианты задания

Вариант

Размер матриц

Количество вычислительных потоков

Мин.

Макс.

Шаг

Мин.

Макс.

Шаг

1

100

1000

100

1

3

1

2

200

1100

100

1

4

1

3

400

1200

100

1

5

1

4

600

1300

100

1

3

1

5

800

1400

100

1

4

1

6

500

1800

200

1

5

1

7

300

1900

200

1

3

1

8

400

1900

200

1

4

1

9

500

2000

200

1

5

1

10

300

2000

200

1

3

1

Порядоквыполнения

  1. Подготовка:

    1. Выберите задание (табл. 31).

    2. Загрузите программное обеспечение square_matrix_multiply

из курса «Анализ данных» СДО университета [2].

    1. Опишите вычислительную систему: процессор, оперативная память, операционная система.

  1. Проведение эксперимента:

    1. Запустите программу square_matrix_multiply.

    2. Задайте условия эксперимента (размер матриц, количество вычислительных потоков) в соответствии с заданием. Установите число экспериментов, равное трём.

    3. Проведите эксперименты и сохраните их результаты. В ходе экспериментов сделайте копию экрана с изображением вкладок

«Процессы» и «Быстродействие» диспетчера задач Windows.

    1. Выполните предварительную обработку экспериментальных данных – усреднение результатов по серии экспериментов. Предварительную обработку удобно проводить с помощью инструмента «Сводные таблицы» программного обеспечения Microsoft Excel.

    2. Постройте графики зависимости (для разного числа потоков) времени выполнения вычислений от размера матриц. Пример приведен ниже (рис. 56).




Рис. 56. Зависимость времени вычислений от размера матриц


    1. Определите функцию, описывающую вычислительную сложность использованного в программе square_matrix_multiply алгоритма. Для этого можно воспользоваться инструментом «Линия

тренда» при построении диаграмм в Microsoft Excel. Построить тренд для случая одного вычислительного потока. Пример приведен ниже (рис. 57).




Рис. 57. Аппроксимация экспериментальных данных


  1. Анализ результатов:

    1. Сделайте выводы о влиянии объема исходных данных и фактора распараллеливания на время решения вычислительной задачи.

    2. Сделайте выводы о влиянии объема исходных данных и фактора распараллеливания на время решения вычислительной задачи.

    3. Сравните время, необходимое для решения задачи умножения матриц размером 10000x10000 при одном вычислительном потоке с помощью алгоритма, использованного в программе square_matrix_multiplyи c помощью алгоритма Штрассена ( O(n)  n2,81 ).

3.2 Продемонстрируйте преподавателю полученные результаты. При наличии замечаний провести повторные эксперименты.

  1. Отчет о работе:

    1. Составьте отчет.

    2. Преобразуйте отчет в формат PDF.

    3. Создайте архив в формате ZIP, содержащий отчет и таблицу с расчетами и графиками (файл Excel).

    4. Прикрепите архив в раздел «Отчет по лабораторной работе

№6» (быстродействие систем анализа данных) курса «Анализ данных» СДО университета [2].

    1. При наличии замечаний от преподавателя скорректируйте отчет.

Содержаниеотчета

Отчет должен содержать:

  1. Титульный лист: наименование работы, вариант задания, ФИО студента, номер учебной группы, дата выполнения работы.

  2. Реферат.

  3. Оглавление.

  4. Задание.

  5. Описание выполненной работы. 6 Условия эксперимента:

    1. Исходные данные.

    2. Описание вычислительной системы. 7 Эксперименты:

    1. Копия экрана (диспетчер задач, вкладка «Процессы»).

    2. Копия экрана (диспетчер задач, вкладка «Быстродействие»).

    3. Экспериментальные данные.

  1. Обработка экспериментальных данных:

    1. Результаты усреднения экспериментальных данных.

    2. Графики зависимости времени выполнения вычислений от размера матриц, зависимости времени выполнения вычислений от количества вычислительных потоков.

    3. Функция, описывающая вычислительную сложность использованного алгоритма.

  2. Выводы.

  3. Список использованных источников (нормативные документы). 11 Приложения.

Отчет должен быть оформлен в соответствии с действующими стандартами университета [18, 19].
1   ...   12   13   14   15   16   17   18   19   20


написать администратору сайта