Дерганая. Лекции Человечество и цифровой мир
Скачать 1.07 Mb.
|
процентном соотношении приблизительно так же, как и в реальной жизни называется … A) репрезентативной выборкой B) репрезентативной гипотезой C) генеральной выборкой D) генеральной гипотезой 2. Формирование репрезентативной выборки, проверка правдоподобности представленных данных и заполнение пропущенных значений осуществляются на этапе … A) разведочного анализа данных B) сбора и подготовки данных C) очистки данных от шумов и аномалий D) преобразования данных 3. Расставьте буквы в соответствии с хронологической последовательностью этапов анализа данных (например, ABCDEFGH). A) очистка данных от шумов и аномалий -5 B) преобразование данных -6 C) построение моделей -7 D) интерпретация-8 E) описание изучаемых объектов-1 F) формулировка гипотез -2 G) сбор и подготовка данных -3 H) разведочный анализ данных -4 4. Значения переменной: Пекин, Москва, Ханой, Париж, Лондон соответствуют … шкале измерений. A) номинальной B) порядковой C) интервальной D) относительной 5. Переменные, принимающие только два возможных значения, называют … A) унарными B) альтернативными C) дихотомическими (бинарными) D) взаимоисключающими 6. Числовой или символьный ряд значений, отражающий допустимые вариации измеряемой величины, называют … A) временным рядом B) шкалой измерений C) распределением значений D) вариационным рядом 7. Качественные шкалы измерений: A) номинальная B) интервальная C) порядковая D) относительная E) дихотомическая 8. Количественные шкалы измерений: A) номинальная B) интервальная C) порядковая D) относительная F) дихотомическая 9. Предназначена для классификации объектов и состоит из названий, имен или категорий – … шкала. A) интервальная B) порядковая C) относительная D) номинальная 10. Предназначена для обозначения относительных качественных позиций объектов – … шкала. A) интервальная B) порядковая C) относительная D) номинальная 11. Имеет единицу измерения и произвольно выбранное начало (условную нулевую точку) – … шкала. A) интервальная B) порядковая C) относительная D) номинальная 12. Имеет единицу измерения и обладает абсолютным нулем в качестве точки отсчета – … шкала. A) интервальная B) порядковая C) относительная D) номинальная 13. Агрегированные данные не содержат в себе такие виды данных, как … A) транзакции B) ряды C) таблицы D) фактоиды 14. Вид данных, в которых один вид информации (зависимая переменная) сопоставляется другому виду информации (независимой переменной), причем в качестве независимой переменной выступает время – это … A) временной ряд B) временной фактоид C) временная транзакция D) интервальный ряд 15. Позволяет значительно сократить объемы анализируемых данных и минимизировать время последующей обработки – … A) облачная технология B) метод агрегации C) параллельная обработка данных D) увеличенный объем памяти 16. Таблица содержит статистику сделанных прививок: Мужчины 15473 Женщины 9466 Студенты 3118 Пенсионеры 1000 Агрегации (подсчету общего количества) можно подвергнуть следующие категории данных: A) мужчины B) женщины C) студенты D) пенсионеры 17. Интерфейс для доступа к открытым данным социальной сети – … A) FTTP B) HTTP--- C) API+++ D) OSI 18. Источники данных, предоставляющие «сырые» транзакции без всякой агрегации – … A) структурированные документы B) результаты прямых измерений C) социологические опросы D) поисковые системы 19. Расставьте буквы в соответствии с хронологической последовательностью этапов объединения данных из разных источников. A) преобразование данных к одинаковым единицам измерения и унифицированной лексике-3 B) разделение данных-2 C) преобразование данных к единой структуре-4 D) загрузка исходных данных в единое хранилище-1 20. Таблица содержит сведения о временных перемещениях автобуса. На остановке «УЛИЦА СОДРУЖЕСТВА» датчик не зафиксировал время прибытия «Рейс 4». Остановка Время прибытия на остановки Рейс1 Рейс2 Рейс3 Рейс4 АВТОСТОЯНКА 10:17:20 12:32:10 15:47:40 17:02:20 УЛИЦА СОДРУЖЕСТВА 10:19:00 12:34:10 15:49:30 ЛЬВОВСКАЯ УЛИЦА 10:21:30 12:36:40 15:51:30 17:07:20 Методом аппроксимации пропущенных значений (на основании данных о прошлых прохождениях автобусом остановки «УЛИЦА СОДРУЖЕСТВА») будет получено расчетное время прибытия … A) 17:04:10 B) 17:04:20 C) 17:04:15 D) 17:04:32 21. Укажите этапы очистки данных: A) устранение дубликатов B) контроль диапазонов C) классификация данных D) сравнение с образцами (шаблонами/регулярными выражениями) 22. Расставьте буквы в соответствии с хронологической последовательностью стадий анализа данных для выявления скрытых закономерностей. A) 1)постановка задачи, выдвижение гипотез B) 2)сбор и предподготовка данных C) 3)выбор метода анализа данных D) 4)проверка найденных закономерностей и анализ исключений 23. В ходе Data Mining проекта (добычи и интеллектуального анализа данных) получают список влияющих факторов с экспертной оценкой их значимости на этапе … A) сбора и предподготовки данных B) постановки задачи и выдвижения гипотез++++ C) выбор метода анализа данных D)валидации полученной модели Тесты к лекции «Инструменты обработки_визуализация_ЦД» 1. Текстовый формат, предназначенный для представления табличных данных, в котором значения разделяются специальными символами-разделителями, называется - … A) CSV B) DOC C) XLS D) VGA 2. Перевод Excel в режим ввода формулы осуществляется после ввода в активную ячейку символа … A) > B) = C) «Enter» D) * 3. Процесс изменения адресов ячеек в формуле при ее копировании, называется - … A) автозаполнение B) автокопирование C) автоиндексация D) автоввод 4. Адрес ячейки в Excel, хранящий в себе не номер ее строки и имя столбца, а путь, который необходимо проделать из ячейки с формулой до адресуемой ячейки, называется - … A) смешанным B) относительным C) абсолютным D) индексируемым 5. Перед элементами адреса ячейки в Excel, которые не должны изменяться при копировании, необходимо ставить знак … A) $ B) = C) : D) ; 6. Автоиндексация в Excel не изменит номер строки в следующих адресах ячеек: A) A$1 B) $A1 C) $A$1 D) A1 7. Автоиндексация преобразует формулу Excel =A1+$A$2+A$3, скопированную из ячейки A4 в ячейку B5, к следующему виду … A) =B2+$A$2+B$3 B) =A2+$A$2+A$3 C) =B2+$B$2+B$3 D) =B5+$A$2+B$3 8. Ссылка на ячейку другого листа Excel содержит в себе, в качестве разделителя между именем листа и адресом на ячейку в этом листе, символ … A) $ B) ? C) ! D) ; 9. Примерами ссылок на диапазоны в Excel являются: A) N5:P8;E18:H25;I5:L22 B) A2:A2; F:F C) 1:1048576 D) А1:Я1 10. Выделенная в Excel прямоугольная область прилегающих ячеек – это … A) окно B) рамка C) маркер D) диапазон 11. Формула в Excel, при попытке сложить числовое и текстовое значения, вернет в качестве своего результата ошибку недопустимых данных … A) #Н/Д B) #ЗНАЧ! C) #ДЕЛ/0! D) #ИМЯ? 12. Формула в Excel, в случае наличия синтаксических ошибок в написании функций или ссылок на ячейки, вернет в качестве своего результата ошибку … A) #Н/Д B) #ЗНАЧ! C) #ДЕЛ/0! D) #ИМЯ? 13. Формула в Excel, при попытке получить корень из отрицательного числа, вернет в качестве своего результата ошибку … A) #ЧИСЛО! B) #ЗНАЧ! C) #ДЕЛ/0! D) #ИМЯ? 14. Среди перечисленных к реляционным СУБД, обрабатывающим структурированные данные, относятся: A) ORACLE B) PostgreSQL C) Redis D) Memcached 15. Представление абстрактной информации в графической форме – это … A) авторизация данных B) идентификация данных C) визуализация данных D) аутентификация данных 16. Объединение данных с целью анализа общей картины в целом, сравнения компонентов, составляющих процент от некоего целого – это … A) распределение данных B) авторизация данных C) композиция данных D) аутентификация данных 17. Объединяет линией набор точек, соответствующих значениям по осям – … A) линейный график B) линейчатая диаграмма C) пиктографическая диаграмма D) круговая диаграмма 18. Использует значки, чтобы придать занимательный оттенок обзору небольших наборов дискретных данных - … A) линейный график B) линейчатая диаграмма C) пиктографическая диаграмма D) круговая диаграмма 19. Использует декартовы координаты для отображения значений двух переменных в виде точек на плоскости - … A) линейный график B) линейчатая диаграмма C) пиктографическая диаграмма D) диаграмма рассеивания 20. Тип визуализации, в которой цвет выступает в качестве дополнительного измерения, называется … A) цветная раскраска B) тепловая карта C) глубинная схема D) диаграмма Ганта 21. Тип визуализации, при котором происходит структуризация информации с помощью пирамид, деревьев и карт, – это … A) метафорическая визуализация B) стратегическая визуализация C) пирамидальная визуализация D) схематичная визуализация 22. Способ визуального представления данных при помощи точек для представления вершин и отрезков (или ломаных) для отображения рёбер между связанными вершинами – это … A) граф B) схема C) график D) пузырьковая диаграмма 23. Методами визуализации многомерных наблюдений с произвольным числом измерений являются: A) лепестковая диаграмма B) линейный график C) пиктограмма «Лица Чернова» D) круговая диаграмма 24. Характеристиками центральной тенденции статистических параметров распределения данных являются: A) среднее значение (Mean) B) мода (Mo) C) медиана (Me) D) межквартильный размах (IQR) 25. Срединное значение вариационного ряда – это … A) среднее значение B) медиана C) мода D) дисперсия 26. Значение переменной, которое чаще других встречается в выборке, – это … A) среднее значение B) медиана C) мода D) дисперсия 27. Разность между наибольшим и наименьшим элементами выборки – это … A) дисперсия B) размах C) стандартное отклонение D) вариация 28. Разделяет вариационный ряд пополам (50 % элементов меньше этого значения и 50 % – больше) … A) первый квартиль B) третий квартиль C) медиана D) мода 29. Разделяет вариационный ряд пополам (50 % элементов меньше этого значения и 50 % – больше) … A) первый квартиль B) второй квартиль C) третий квартиль D) мода 30. Разбивают вариационный ряд на четыре части (по 25% в каждой части) … A) квартили B) медианы C) моды D) дисперсии 31. Число, разделяющее вариационный ряд на две части (25 % элементов меньше этого значения, а 75 % – больше) – это … A) первый квартиль B) второй квартиль C) третий квартиль D) четвертый квартиль 32. Число, разделяющее вариационный ряд на две части (75 % элементов меньше этого значения, а 25 % – больше) – это … A) первый квартиль B) второй квартиль C) третий квартиль D) четвертый квартиль 33. Разница между третьим и первым квартилем, характеризующая разброс данных – это … A) межквартильная дисперсия B) межквартильный размах C) стандартное отклонение D) межквартильная вариация 34. Устойчивыми к выбросам показателями являются: A) медиана B) среднее арифметическое C) межквартильный размах D) размах 35. Метод визуализации данных, позволяющий определить степень разброса (дисперсии) и асимметрии данных, – это … A) коробчатая диаграмма B) круговая диаграмма C) пузырьковая диаграмма D) лепестковая диаграмма 36. Среднее арифметическое квадратов отклонений значений от их среднего – это … A) дисперсия B) вариация C) среднее значение D) размах 37. Форма распределения данных, когда среднее значение и медиана совпадают, – это … A) симметричное распределение B) отрицательная асимметрия C) положительная асимметрия D) ассиметричное распределение 38. Форма распределения данных, когда медиана больше среднего значения, – это … A) симметричное распределение B) отрицательная асимметрия C) положительная асимметрия D) нулевая асимметрия 39. Форма распределения данных, когда медиана меньше среднего значения, – это … A) симметричное распределение B) отрицательная асимметрия C) положительная асимметрия D) нулевая асимметрия 40. Упорядоченные данные, расположенные в порядке возрастания значения переменной, либо в порядке убывания называют … рядом. A) вариационным B) числовым C) категориальным D) статистическим 41. Применение некоторой функции к каждой точке в наборе данных в целях уменьшения разброса значений и облегчения интерпретации и визуализации данных – это … A) преобразование данных B) заполнение пропусков в данных C) очистка данных D) шифрование данных 42. Функциями преобразования, часто применяемыми для визуализации данных с большим разбросом положительных значений, являются: A) логарифмирование B) умножение на коэффициент C) возведение в степень D) извлечение квадратного корня 43. Приведение значений переменных из различных шкал, имеющих различные единицы измерения и диапазоны значений, к единому виду, который позволит сравнивать их между собой или использовать для расчёта схожести объектов – это … A) преобразование данных B) нормировка данных C) заполнение пропусков в данных D) очистка данных 44. Вещественная или целочисленная функция нескольких переменных, подлежащая оптимизации (минимизации или максимизации) в целях решения некоторой оптимизационной задачи, – это … функция. A) целевая B) основная C) ключевая D) оптимизационная 45. Последовательность наблюдений, упорядоченная по времени – это … ряд. A) числовой B) категориальный C) статистический D) временной 46. Плавное, долгосрочное изменение уровня временного ряда – это … A) тренд B) сезонность C) фрактальность D) шум 47. Циклические изменения уровня временного ряда с постоянным периодом – это … A) тренд B) сезонность C) фрактальность D) шум 48. Непрогнозируемая, случайная компонента временного ряда – это … A) тренд B) сезонность C) фрактальность D) шум 49. Для проверки качества модели прогнозирования временного ряда используют … A) часть временного ряда (тестовую выборку)+ B) все имеющиеся значения временного ряда C) часть временного ряда (обучающую выборку) D) случайные числа нормального закона распределения 50. Метрика оценки качества прогнозирования временного ряда, получаемая как р езультат деления суммы абсолютных значений ошибок прогноза на количество точек тестовой выборки, – это … A) средняя абсолютная ошибка+ B) среднеквадратичная ошибка C) средняя абсолютная процентная ошибка D) средняя допустимая ошибка 51. Метрика оценки качества прогнозирования временного ряда, получаемая как сумма квадратов ошибок прогноза, деленная на количество точек тестовой выборки, – это … A) средняя абсолютная ошибка B) среднеквадратичная ошибка C) средняя абсолютная процентная ошибка D) средняя допустимая ошибка 52. Сглаживание данных применяется для … A) избавления от шумов B) агрегирования данных нескольких рядов C) сравнения нескольких переменных из различных шкал D) заполнения пропущенных значений 53. Процесс преобразования временного ряда методом экспоненциального |