Поручиков М.А. Анализ данных. А. поручиков
Скачать 2.76 Mb.
|
Вопросы для самоконтроляПриведите примеры непрерывных данных. Приведите примеры категориальных данных. Дайте определения понятию «источник данных». Приведите способы классификации источников данных. 5 Охарактеризуйте понятие «открытые данные». 6 Приведите примеры источников открытых данных. 7 Перечислите основные форматы хранения данных. Приведите алгоритм построения системы сбора данных на основе программного обеспечения Microsoft Excel. Обоснуйте необходимость подготовки данных. Охарактеризуйте операцию форматирования данных. 11 Приведите пример форматирования данных. 12 Охарактеризуйте операцию отбора данных. 13 Приведите пример отбора данных 14 Охарактеризуйте операцию нормализации данных. 15 Приведите пример нормализации данных. 16 Охарактеризуйте операцию кодирования данных. 17 Приведите пример кодирования данных. Лабораторная работа «Сбор и подготовка данных» Общиесведения Целями работы являются: ознакомление со структурой источников открытых данных, изучение способов хранения и представления данных; приобретение навыка построения системы сбора данных. Задачи: Исследование наборов данных, представленных на портале открытых данных data.gov.ru. Исследование наборов данных, представленных на портале data.worldbank.org. Построение автоматизированной системы сбора данных. В качестве инструментального средства используется программное обеспечение Microsoft Excel. Вариантызадания Таблица 5. Задания по части 1 «Исследование портала data.gov.ru»
Таблица 6. Задания по части 2 «Исследование портала data.worldbank.org»
Таблица 7. Задания по части 2 «Автоматизированный сбор данных»
Порядоквыполнения Исследование наборов данных на портале data.gov.ru: Выберите вариант задания (табл. 5). Найдите произвольный набор данных на портале data.gov.ru по тематике, указанной в выбранном варианте задания. Набор должен быть представлен в формате csv и кодировке Windows. Загрузите на компьютер найденный набор данных и его паспорт. Проведите анализ набора данных: определите количество записей и полей в наборе данных. Исследование наборов данных на портале data.worldbank.org: Выберите вариант задания (табл. 6). Найдите произвольный набор данных на портале data.worldbank.org по тематике, указанной в выбранном варианте задания. Загрузите на компьютер найденный набор данных в формате XLS. На основе набора данных подготовьте выборку, содержащую значения показателя за все годы для трёх произвольно выбранных стран мира. На основе подготовленной выборки постройте график, иллюстрирующий изменение показателя со временем для трёх стран мира. Сохраните файл. Построение системы автоматизированной системы сбора данных: Выберите вариант задания (табл. 7). Найдите интернет-сайт, содержащий указанные в задании данные. Запустите MicrosoftExcel. Выберите пункт «Из Веба» в меню «Данные». В адресной строке появившегося окна «Создание веб-запроса» наберите адрес найденной ранее веб-страницы. Выберите таблицу, содержащую искомые данные. Нажмите кнопку «Импорт». В появившемся окне «Импорт данных» нажмите кнопку «Свойства». В появившемся окне «Свойства внешнего диапазона» задайте параметр «Период обновления», равный 1 минуте, параметр «Обновление при открытии файла» - «Да». Нажмите кнопку «OK». В окне «Импорт данных» нажмите кнопку «OK». Сохраните файл. Отчет о работе: Составьте отчет о работе. Преобразуйте отчет в формат PDF. Запакуйте отчет (PDF) и все использованные и созданные в работе файлы в архив формата ZIP. Прикрепите архив в раздел «Отчет по лабораторной работе №1 (сбор и подготовка данных)» курса «Анализ данных» СДО университета [2]. Содержаниеотчета Отчет должен содержать: Титульный лист: наименование работы, вариант задания, ФИО студента, номер учебной группы, дата выполнения работы. Реферат. Оглавление. Часть 1 «Исследование наборов данных на портале data.gov.ru»: Задание. Копия экрана с набором данных, открытом в Microsoft Excel. Описание набора данных согласно нижеприведенной форме (табл. 8). Таблица 8. Форма описания набора данных
Часть 2 «Исследование наборов данных на портале data.worldbank.org»: Задание. Копия экрана с набором данных, открытом в Microsoft Excel. График изменения показателя со временем по трем произвольно выбранным странам мира. Часть 3 «Построение автоматизированной системы сбора данных»: Задание. Копия экрана с интернет-сайтом, содержащим данные. Копия экрана MicrosoftExcelпосле импорта данных. 7 Список использованных источников: Источники данных. Нормативные документы. Все представленные в отчете таблицы и рисунки должны иметь пояснения. Отчет должен быть оформлен в соответствии с действующими стандартами университета [18, 19]. |