Главная страница
Навигация по странице:

  • 7. Какие вероятные разочарования тренда больших данных

  • 10. К какому типу шкал относится шкала «очень плохо»-«плохо»-«средне»-«хорошо-«очень хорошо»

  • 12. В чём состоит свойство расширяемости записей СУБД

  • 14. Начиная с каких размеров данных обоснованно применение кластера Hadoop для хранения данных

  • тест большие данные. большие данные тест без ответов. Тест по дисциплине Большие данные с ответами


    Скачать 15.26 Kb.
    НазваниеТест по дисциплине Большие данные с ответами
    Анкортест большие данные
    Дата17.05.2022
    Размер15.26 Kb.
    Формат файлаdocx
    Имя файлабольшие данные тест без ответов.docx
    ТипДокументы
    #534008

    Тест по дисциплине «Большие данные» с ответами
    1.Большие данные – это:

    -Данные объемом более 1Тб

    -Данные объемом более 10Тб

    -Данные объемом более 100Тб

    -Нет ограничений на минимальный объем

    2.Наиболее редко на практике применяются методы машинного обучения, основанные на:

    -Алгоритмах обучения без учителя

    -Алгоритмах обучения с учителем

    -Алгоритмах обучения с подкреплением

    -Свёрточных нейронных сетях

    3.Алгоритм k-средних предназначен для решения задачи:

    -Классификации

    -Кластеризации

    -Прогнозирования

    -Снижения размерности

    4.Neo4j – это:

    -База данных

    -Архитектура нейронной сети

    -Платформа распределенных вычислений

    -Компилятор языка

    5.Реализация метода обучения с учителем не нуждается в:

    -Обучающей выборке

    -Тестовой выборке

    -Оценочной выборке

    -Проверочной выборке
    6. Какие из следующих технологий СУБД не используют принцип MapReduce

    Hadoop

    Cassandra

    Redis

    HDInsight


    7. Какие вероятные разочарования тренда больших данных?

    из-за угрозы безопасности личной жизни (privacy) граждан будут упрощены процедуры сбора данных, что приведёт к падению ценности больших данных

    из-за угрозы безопасности личной жизни (privacy) граждан будут усложнены процедуры сбора данных, что приведёт к падению ценности больших данных

    нет

    8. Отметьте те из вариантов, в которых данные структурированы:

    данные о продажах компании, представленные в виде помесячных отчётов в формате MS Word

    библиотека фильмов, представленных в формате mpeg4 на одном жестком диске

    таблица с ежедневными показаниями температуры помещения за год в файле формата csv

    текст педагогической поэмы А.С. Макаренко, представленный в формате PDF

    9. Компания, проводящая социологические опросы получает анкеты от волонтеров, непосредственно опрашивающих респондентов. При каких условиях разумна постановка задачи цензурирования?

    Часть анкет пришла в негодность, что не позволяет считать информацию с них со 100% уверенностью

    многие анкеты заполнены не полностью

    стало известно, что волонтеры фальсифицируют результаты опроса, самостоятельно заполняя часть анкет

    от заказчика поступило требование уничтожить часть анкет, содержащих информацию о руководителях страны


    10. К какому типу шкал относится шкала «очень плохо»-«плохо»-«средне»-«хорошо-«очень хорошо»?

    номинальная

    абсолютная

    порядковая

    Бинарная

    11. Имеет ли Python аналог Data Frame из R

    да, библиотека Pandas

    да, библиотека SciPy

    нет

    да, библиотека NumPy


    12. В чём состоит свойство расширяемости записей СУБД?

    СУБД не имеет чёткой структуры, поэтому любую запись можно расширить

    повышение отказоустойчивости системы при добавлении новых записей в СУБД

    в любую таблицу СУБД можно добавить новую колонку, предварительно изменив структуру этой таблицы

    СУБД имеет чёткую, но расширяемую структуру, в каждую запись можно добавить новую колонку, также как и узнать значение любой записи по добавленной колонке

    13. Отметьте причины создания NoSQL баз данных:

    дороговизна лицензий RDBMS

    высокая стоимость горизонтальной масштабируемости RDBMS при сохранении требования высокой доступности

    недостаточная гибкость языка запросов SQL

    невозможность хранить большие объёмы данных


    14. Начиная с каких размеров данных обоснованно применение кластера Hadoop для хранения данных?

    100Тб

    1Пб

    100Гб

    1Тб

    15. Инвестиционный фонд интересуется тем, почему часть финансируемых им


    проектов успешно переходят на второй год, а часть — нет. К какому типу относится эта задача анализа данных?

    построение решающего правила

    классификация

    поиск информативных признаков

    цензурирование

    16. Компания, проводящая социологические опросы, испытывает сложности с верификацией данных, поступающих от волонтеров непосредственно опрашивающих респондентов: многие анкеты заполнены не полностью; волонтеры фальсифицируют результаты опроса, самостоятельно заполняя часть анкет. К какому типу задач анализа данных здесь прибегать не придётся?

    классификация

    цензурирование

    прогнозирование

    заполнение пробелов

    17. Коммерческая клиника желает установить структуру своих клиентов с


    точки зрения вклада в доход клиники. К какому типу относится эта задача анализа данных?

    прогнозирование

    кластеризация

    цензурирование

    классификация


    написать администратору сайта