Главная страница

Поручиков М.А. Анализ данных. А. поручиков


Скачать 2.76 Mb.
НазваниеА. поручиков
Дата25.10.2022
Размер2.76 Mb.
Формат файлаdocx
Имя файлаПоручиков М.А. Анализ данных.docx
ТипАнализ
#753011
страница6 из 20
1   2   3   4   5   6   7   8   9   ...   20

Вопросы для самоконтроля


  1. Приведите примеры непрерывных данных.

  2. Приведите примеры категориальных данных.

  3. Дайте определения понятию «источник данных».

  4. Приведите способы классификации источников данных. 5 Охарактеризуйте понятие «открытые данные».

6 Приведите примеры источников открытых данных. 7 Перечислите основные форматы хранения данных.

  1. Приведите алгоритм построения системы сбора данных на основе программного обеспечения Microsoft Excel.

  2. Обоснуйте необходимость подготовки данных.

  3. Охарактеризуйте операцию форматирования данных. 11 Приведите пример форматирования данных.

12 Охарактеризуйте операцию отбора данных. 13 Приведите пример отбора данных

14 Охарактеризуйте операцию нормализации данных. 15 Приведите пример нормализации данных.

16 Охарактеризуйте операцию кодирования данных. 17 Приведите пример кодирования данных.

Лабораторная работа «Сбор и подготовка данных»

Общиесведения

Целями работы являются:

  • ознакомление со структурой источников открытых данных, изучение способов хранения и представления данных;

  • приобретение навыка построения системы сбора данных. Задачи:

  1. Исследование наборов данных, представленных на портале открытых данных data.gov.ru.

  2. Исследование наборов данных, представленных на портале data.worldbank.org.

  3. Построение автоматизированной системы сбора данных.

В качестве инструментального средства используется программное обеспечение Microsoft Excel.

Вариантызадания
Таблица 5. Задания по части 1 «Исследование портала data.gov.ru»


Вариант

Тематика

Адрес в сети Интернет

1

Государство

http://data.gov.ru/rubriki/gosudarstvo

2

Экономика

http://data.gov.ru/rubriki/ekonomika

3

Образование

http://data.gov.ru/rubriki/education

4

Здоровье

http://data.gov.ru/rubriki/zdorove

5

Экология

http://data.gov.ru/rubrics/ecology

6

Транспорт

http://data.gov.ru/rubriki/transport

7

Культура

http://data.gov.ru/rubrics/culture

8

Спорт

http://data.gov.ru/rubrics/sport

9

Строительство

http://data.gov.ru/rubriki/stroitelstvo

10

Досуг и отдых

http://data.gov.ru/rubrics/leisure-and-entertainment

11

Торговля

http://data.gov.ru/rubriki/torgovlya

12

Туризм

http://data.gov.ru/rubrics/tourism

13

Электроника

http://data.gov.ru/rubrics/electronics

14

Картография

http://data.gov.ru/rubrics/cartography

15

Безопасность

http://data.gov.ru/rubriki/bezopasnost

16

Метеоданные

http://data.gov.ru/rubrics/weather


Таблица 6. Задания по части 2 «Исследование портала data.worldbank.org»

Вариант

Тематика

1

Agriculture & Rural Development

2

Aid Effectiveness

3

Climate Change

4

Economy & Growth

5

Education

6

Energy & Mining

7

Environment

8

External Debt

9

Financial Sector

10

Gender

11

Health

12

Infrastructure

13

Poverty

14

Private Sector

15

Public Sector

16

Science & Technology

17

Social Development

18

Social Protection & Labor

19

Trade

20

Urban Development



Таблица 7. Задания по части 2 «Автоматизированный сбор данных»


Вариант

Данные

1

Онлайн-табло какого-либо аэропорта/вокзала

2

Котировки акций / валют / драгоценных металлов / полезных ископаемых на какой-либо бирже

3

По предложению студента


Порядоквыполнения

    1. Исследование наборов данных на портале data.gov.ru:

      1. Выберите вариант задания (табл. 5).

      2. Найдите произвольный набор данных на портале data.gov.ru по тематике, указанной в выбранном варианте задания. Набор должен быть представлен в формате csv и кодировке Windows.

      3. Загрузите на компьютер найденный набор данных и его паспорт.

      4. Проведите анализ набора данных: определите количество записей и полей в наборе данных.

    2. Исследование наборов данных на портале data.worldbank.org:

      1. Выберите вариант задания (табл. 6).

      2. Найдите произвольный набор данных на портале data.worldbank.org по тематике, указанной в выбранном варианте задания.

      3. Загрузите на компьютер найденный набор данных в формате

XLS.

      1. На основе набора данных подготовьте выборку, содержащую значения показателя за все годы для трёх произвольно выбранных стран мира.

      2. На основе подготовленной выборки постройте график, иллюстрирующий изменение показателя со временем для трёх стран мира.

      3. Сохраните файл.

    1. Построение системы автоматизированной системы сбора данных:

      1. Выберите вариант задания (табл. 7).

      2. Найдите интернет-сайт, содержащий указанные в задании данные.

      3. Запустите MicrosoftExcel.

      4. Выберите пункт «Из Веба» в меню «Данные».

      5. В адресной строке появившегося окна «Создание веб-запроса» наберите адрес найденной ранее веб-страницы.

      6. Выберите таблицу, содержащую искомые данные.

      7. Нажмите кнопку «Импорт».

      8. В появившемся окне «Импорт данных» нажмите кнопку

«Свойства».

      1. В появившемся окне «Свойства внешнего диапазона» задайте параметр «Период обновления», равный 1 минуте, параметр

«Обновление при открытии файла» - «Да».

      1. Нажмите кнопку «OK».

      2. В окне «Импорт данных» нажмите кнопку «OK».

    1. Сохраните файл. Отчет о работе:

      1. Составьте отчет о работе.

      2. Преобразуйте отчет в формат PDF.

      3. Запакуйте отчет (PDF) и все использованные и созданные в работе файлы в архив формата ZIP.

      4. Прикрепите архив в раздел «Отчет по лабораторной работе №1 (сбор и подготовка данных)» курса «Анализ данных» СДО университета [2].

Содержаниеотчета

Отчет должен содержать:

  1. Титульный лист: наименование работы, вариант задания, ФИО студента, номер учебной группы, дата выполнения работы.

  2. Реферат.

  3. Оглавление.

  4. Часть 1 «Исследование наборов данных на портале data.gov.ru»:

    1. Задание.

    2. Копия экрана с набором данных, открытом в Microsoft Excel.

    3. Описание набора данных согласно нижеприведенной форме (табл. 8).


Таблица 8. Форма описания набора данных

Показатель

Значение

Наименование




Ссылка




Формат




Количество записей




Количество полей




в т.ч. числовых




в т.ч. текстовых







  1. Часть 2 «Исследование наборов данных на портале data.worldbank.org»:

    1. Задание.

    2. Копия экрана с набором данных, открытом в Microsoft Excel.

  2. График изменения показателя со временем по трем произвольно выбранным странам мира.

  3. Часть 3 «Построение автоматизированной системы сбора данных»:

    1. Задание.

    2. Копия экрана с интернет-сайтом, содержащим данные.

    3. Копия экрана MicrosoftExcelпосле импорта данных. 7 Список использованных источников:

    1. Источники данных.

    2. Нормативные документы.

Все представленные в отчете таблицы и рисунки должны иметь пояснения. Отчет должен быть оформлен в соответствии с действующими стандартами университета [18, 19].
1   2   3   4   5   6   7   8   9   ...   20


написать администратору сайта