тест большие данные. большие данные тест без ответов. Тест по дисциплине Большие данные с ответами
Скачать 15.26 Kb.
|
Тест по дисциплине «Большие данные» с ответами 1.Большие данные – это: -Данные объемом более 1Тб -Данные объемом более 10Тб -Данные объемом более 100Тб -Нет ограничений на минимальный объем 2.Наиболее редко на практике применяются методы машинного обучения, основанные на: -Алгоритмах обучения без учителя -Алгоритмах обучения с учителем -Алгоритмах обучения с подкреплением -Свёрточных нейронных сетях 3.Алгоритм k-средних предназначен для решения задачи: -Классификации -Кластеризации -Прогнозирования -Снижения размерности 4.Neo4j – это: -База данных -Архитектура нейронной сети -Платформа распределенных вычислений -Компилятор языка 5.Реализация метода обучения с учителем не нуждается в: -Обучающей выборке -Тестовой выборке -Оценочной выборке -Проверочной выборке 6. Какие из следующих технологий СУБД не используют принцип MapReduce Hadoop Cassandra Redis HDInsight 7. Какие вероятные разочарования тренда больших данных? из-за угрозы безопасности личной жизни (privacy) граждан будут упрощены процедуры сбора данных, что приведёт к падению ценности больших данных из-за угрозы безопасности личной жизни (privacy) граждан будут усложнены процедуры сбора данных, что приведёт к падению ценности больших данных нет 8. Отметьте те из вариантов, в которых данные структурированы: данные о продажах компании, представленные в виде помесячных отчётов в формате MS Word библиотека фильмов, представленных в формате mpeg4 на одном жестком диске таблица с ежедневными показаниями температуры помещения за год в файле формата csv текст педагогической поэмы А.С. Макаренко, представленный в формате PDF 9. Компания, проводящая социологические опросы получает анкеты от волонтеров, непосредственно опрашивающих респондентов. При каких условиях разумна постановка задачи цензурирования? Часть анкет пришла в негодность, что не позволяет считать информацию с них со 100% уверенностью многие анкеты заполнены не полностью стало известно, что волонтеры фальсифицируют результаты опроса, самостоятельно заполняя часть анкет от заказчика поступило требование уничтожить часть анкет, содержащих информацию о руководителях страны 10. К какому типу шкал относится шкала «очень плохо»-«плохо»-«средне»-«хорошо-«очень хорошо»? номинальная абсолютная порядковая Бинарная 11. Имеет ли Python аналог Data Frame из R да, библиотека Pandas да, библиотека SciPy нет да, библиотека NumPy 12. В чём состоит свойство расширяемости записей СУБД? СУБД не имеет чёткой структуры, поэтому любую запись можно расширить повышение отказоустойчивости системы при добавлении новых записей в СУБД в любую таблицу СУБД можно добавить новую колонку, предварительно изменив структуру этой таблицы СУБД имеет чёткую, но расширяемую структуру, в каждую запись можно добавить новую колонку, также как и узнать значение любой записи по добавленной колонке 13. Отметьте причины создания NoSQL баз данных: дороговизна лицензий RDBMS высокая стоимость горизонтальной масштабируемости RDBMS при сохранении требования высокой доступности недостаточная гибкость языка запросов SQL невозможность хранить большие объёмы данных 14. Начиная с каких размеров данных обоснованно применение кластера Hadoop для хранения данных? 100Тб 1Пб 100Гб 1Тб 15. Инвестиционный фонд интересуется тем, почему часть финансируемых им проектов успешно переходят на второй год, а часть — нет. К какому типу относится эта задача анализа данных? построение решающего правила классификация поиск информативных признаков цензурирование 16. Компания, проводящая социологические опросы, испытывает сложности с верификацией данных, поступающих от волонтеров непосредственно опрашивающих респондентов: многие анкеты заполнены не полностью; волонтеры фальсифицируют результаты опроса, самостоятельно заполняя часть анкет. К какому типу задач анализа данных здесь прибегать не придётся? классификация цензурирование прогнозирование заполнение пробелов 17. Коммерческая клиника желает установить структуру своих клиентов с точки зрения вклада в доход клиники. К какому типу относится эта задача анализа данных? прогнозирование кластеризация цензурирование классификация |