Методы анализа данных. Вопрос 1. Теория вероятностей раздел математики, посвященный
Скачать 21.65 Kb.
|
Вопрос №1. Теория вероятностей – раздел математики, посвященный: Изучению закономерностей случайных явлений Вопрос №2. Значение вероятности события заключено между: 0 и 1 Вопрос №3. Аналитик это …специалист в области анализа и моделирования Вопрос №4. Эксперт это …специалист в предметной области Вопрос №5. Задача классификации сводится к … определению класса объекта по его характеристикам Вопрос №1. База данных – предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений и единого места сбора и хранения данных организации Вопрос №2. Случайная величина называется дискретной, если она может принимать только конечное или счетное число значений Вопрос №3. Иерархические процедуры кластеризации состоят в пошаговом осуществлении: на каждом шаге объединяются 2 или несколько единиц или кластера выборе произвольных кластеров и их объединении том, что на каждом шаге обрабатывается небольшая часть единиц, и полученная картина сопоставляется с предыдущим результатом том, что оперируют сразу со всеми единицами Вопрос №4. Коэффициент корреляции может принимать значение: от -1 до +1 Вопрос №5. Случайная величина X называется непрерывной, если ее функция распределения непрерывна в любой точке и дифференцируема всюду, кроме, быть может, отдельных точек Вопрос №1. Банк данных – предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений и единого места сбора и хранения данных организации Вопрос №2. К описательным относятся следующие модели данных: Варианты ответов: модели классификации и последовательностей регрессионные, кластеризации, исключений, итоговые и ассоциации классификации, кластеризации, исключений, итоговые и ассоциации модели классификации, последовательностей и исключений Вопрос №3.Упорядочить этапы статистического исследования Тип ответа: Упорядочивание Варианты ответов: Определение проблемы Разработка подхода к решению проблемы Разработка плана исследования Полевые работы или сбор данных Подготовка данных и их анализ Подготовка отчета и его презентация Вопрос №4. Data Mining – Варианты ответов: предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений и единого места сбора и хранения данных организации процесс обнаружения в исходных данных ранее неизвестных, нетривиальных, практически полезных и доступных для интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности система программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного использования данных организованная в соответствии с определенными правилами и поддерживаемая в памяти компьютера именованная совокупность данных, отображающая состояние объектов и их отношений в рассматриваемой предметной области и используемая для удовлетворения информационных потребностей пользователей Вопрос №5. Корреляционный анализ определяет: Варианты ответов: интеграл(xdx)+интеграл(ydy) форму связи между X и Y тесноту связи между X и Y производную Y'x Вопрос №1. Сколько трехзначных чисел можно составить из цифр 1, 2, 3, 4, 5, если все цифры в числе различны? 60 Вопрос №2. Бросают два кубика. Какие из следующих событий случайные? Тип ответа: Многие из многих Варианты ответов: А={на кубиках выпало одинаковое число очков} В={сумма очков на кубиках не превосходит 12} С={сумма очков на кубиках равна 11} D={произведение очков на кубиках равно 11} Вопрос №3. В коробке 3 красных, 3 желтых, 3 зеленых шара. Вытащили наугад 4 шара. Какие из следующих событий невозможные? Тип ответа: Многие из многих Варианты ответов: Все вынутые шары одного цвета. Все вынутые шары разных цветов. Среди вынутых шаров есть шары разных цветов. Среди вынутых есть шары всех трех цветов. Вопрос №4. В партии из 10 деталей имеются 4 бракованных. Какова вероятность того, что среди наудачу отобранных 5 деталей окажутся 2 бракованные? Варианты ответов: 0,25 0,476 0,5 0,235 Вопрос №5. Стрелок попадает в десятку с вероятностью 0,05, в девятку – с вероятностью 0,2, в восьмерку – с вероятностью 0,5. Сделан один выстрел. Какова вероятность того, что будет выбито менее 8 очков? Варианты ответов: 0,1 0,75 0,25 0,9 1. Аналитик это … а)специалист в области анализа имоделирование 2 Эксперт это … б) специалист в предметной области;. 3 Задача классификации сводится к … б) определения класса объекта по его характеристиками; 4 Задача регрессии сводится к … в) определение по известным характеристиками объекта значение некоторого его параметра; 5 Задача кластеризации заключается в … г) поиска независимых групп и их характеристик в всем множестве анализируемых данных. 6 Целью поиска ассоциативных правил является … а) нахождения частых зависимостей между объектами или событиями; 7 До предполагаемых моделей относятся такие модели данных: а) модели классификации и последовательностей; 8 В описательных моделей относятся следующие модели данных: б) регрессивные, кластеризации, исключений, итоговые и ассоциации; 9 Модели классификации описывают … а) правила или набор правил в соответствии с которыми можно отнести описание любого нового объекта к одному из классов; 10Модели последовательностей описывают … б) функции, которые позволяют прогнозировать изменения непрерывных числовых параметров; 11 Регрессивные модели описывают … в) функциональные зависимости между зависимыми и независимыми показателями и переменными в понятной человеку форме; 12. Виды лингвистической неопределенности: б) неопределенность значений слов (Многозначность, размытость, непонятность, нечеткость); неоднозначность смысла фраз (Синтаксическая и семантическая); 13. Модели исключений описывают … а) исключительные ситуации в записях, которые резко отличаются произвольной признаку от основной множества записей; 14 Итоговые модели обнаружат … б) ограничения на данные анализируемого массива; 15 Модели ассоциации проявляют … в) закономерности между связанными событиями; 16 Виды физической неопределенности данных: а) неточность измерений значений определенной величины, выполняемых физическими приборами; случайность (или наличие в внешней среде нескольких возможностей, каждая из которых случайным образом может стать действительностью) 17 Очистка данных — … а) комплекс методов и процедур, направленных на устранение причин, мешающих корректной обработке: аномалий, пропусков, дубликатов, противоречий, шумов и т.д. 18 Обогащение — … б) процесс дополнения данных некоторой информацией, позволяющей повысить эффективность развязку аналитических задач 19 Консолидация — … г) комплекс методов и процедур, направленных на извлечение данных из различных источников, обеспечение необходимого уровня их информативности и качества, преобразования в единый формат, в котором они могут быть загружены в хранилище данных или аналитическую систему 20 Транзакция — … а) некоторый набор операций над базой данных, который рассматривается как единственное завершено, с точки зрения пользователя, действие над некоторой информацией, обычно связано с обращением к базе данных 21 Метаданные — … в) высокоуровневые средства отражения информационной модели и описания структуры данных 22 Классификация — … г) это установление зависимости дискретной выходной переменной от входных переменных 23 Регрессия — … а) это установление зависимости непрерывной выходной переменной от входных переменных 24 Кластеризация — … б) эта группировка объектов (Наблюдений, событий) на основе данных, описывающих свойства объектов 25 Ассоциация — … в) выявление закономерностей между связанными событиями 26 Машинное обучение — … г) подразделение искусственного интеллекта изучающий методы построения алгоритмов, способных обучаться на данных 27 Аналитическая платформа — … а) специализированный программный решение (или набор решений), который включает в себя все инструменты для извлечения закономерностей из сырых данных 28 Обучающая выборка — … б) набор данных, каждая запись которого представляет собой учебный пример, содержащего заданный входной влияние, и соответствующий ему правильный выходной результат 29 Ошибка обучения — … а) это ошибка, допущенная моделью на учебной множества. 30 Ошибка обобщения — … б) это ошибка, полученная на тестовых примерах, то есть, что вычисляется по тем же формулам, но для тестовой множества |