Главная страница
Навигация по странице:

  • «Северный (Арктический) федеральный университет имени М.В. Ломоносова» Кафедра

  • ФОНД ОЦЕНОЧНЫХ СРЕДСТВ ПО УЧЕБНОЙ ДИСЦИПЛИНЕ Машинное обучение

  • Паспорт фонда оценочных средств 09.04.02 Информационные системы и технологии Магистерская программа Геоинформационные технологии

  • «Северный (Арктический) федеральный университет имени М.В. Ломоносова»

  • Комплект примерных тем для собеседования

  • Уровень освоения компетенций: ПК-1, ПК-5

  • Комплект примерных заданий для решения проблемных задач

  • Задания для выполнения курсового проекта по дисциплине «Машинное обучение» на тему «Применение машинного обучения для решения прикладной задачи» Задания

  • Критерии оценки: Студенту ставится оценка «отлично

  • Контрольные вопросы к зачету

  • нейросети. Протокол 6 Заведующий кафедрой Е. А. Деменкова (подпись)


    Скачать 50.8 Kb.
    НазваниеПротокол 6 Заведующий кафедрой Е. А. Деменкова (подпись)
    Анкорнейросети
    Дата19.11.2019
    Размер50.8 Kb.
    Формат файлаdocx
    Имя файлаMashinnoe_Obuchenie_Fos_2019.docx
    ТипПротокол
    #96056

    Министерство науки И ВЫСШЕГО ОБРАЗОВАНИЯ Российской Федерации

    федеральное государственное автономное образовательное учреждение высшего образования

    «Северный (Арктический) федеральный университет имени М.В. Ломоносова»

    Кафедра информационных систем и технологий



    УтверждЕН

    на заседании кафедры

    «14» января 2019 г.,
    протокол №6

    Заведующий кафедрой

    ___________________ Е.А. Деменкова

    (подпись)

    ФОНД ОЦЕНОЧНЫХ СРЕДСТВ

    ПО УЧЕБНОЙ ДИСЦИПЛИНЕ
    Машинное обучение

    ________09.04.02 Информационные системы и технологии _________

    (код и наименование направления подготовки )
    Магистерская программа «Геоинформационные технологии»

    (наименование профиля подготовки /специализации)

    __________________магистр_____________________

    (квалификация выпускника)


    Составитель ________________________ И.С. Васендина

    (подпись)

    «14» января 2019 г.

    Согласовано:

    Председатель УМК ВШ ИТАС _______________ _Р.П. Овчинникова_.

    (подпись) (расшифровка подписи)

    «29» января 2019 г.

    Паспорт фонда оценочных средств

    09.04.02 Информационные системы и технологии

    Магистерская программа Геоинформационные технологии

    по дисциплине «Машинное обучение»




    п/п

    Контролируемые разделы (темы) дисциплины

    Код контролируемой компетенции

    Наименование оценочного средства

    4 семестр

    1

    Основные понятия, принципы и задачи машинного обучения. Библиотеки и инструменты для машинного обучения

    ПК-1, ПК-5

    Темы собеседований, решение проблемных задач

    2

    Методы машинного обучения с учителем

    ПК-1, ПК-5

    Темы собеседований, решение проблемных задач

    3

    Методы машинного обучения без учителя и предварительная обработка данных.

    ПК-1, ПК-5

    Темы собеседований, решение проблемных задач

    4

    Типы данных и конструирование признаков

    ПК-1, ПК-5

    Темы собеседований, решение проблемных задач

    5

    Оценка и улучшение качества модели

    ПК-1, ПК-5

    Темы собеседований, решение проблемных задач




    Все темы

    ПК-1, ПК-5

    Вопросы к зачету, курсовой проект


    Министерство НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ Российской Федерации

    федеральное государственное автономное образовательное учреждение высшего образования

    «Северный (Арктический) федеральный университет имени М.В. Ломоносова»


    Высшая школа информационных технологий и автоматизированных систем

    Кафедра информационных систем и технологий

    09.04.02 Информационные системы и технологии


    Комплект примерных тем для собеседования
    по дисциплине«Машинное обучение»
    4 семестр

    Раздел 1. Основные понятия, принципы и задачи машинного обучения. Библиотеки и инструменты для машинного обучения.

    1. Основные понятия машинного обучения.

    2. Задачи, которые можно решать с помощью машинного обучения.

    3. Основные библиотеки и инструменты.

    4. Преимущества машинного обучения по сравнению с традиционным подходом.

    5. Сбор и подготовка данных.

    6. Обучение модели на данных.

    7. Оценка производительности модели.

    8. Оптимизация производительности модели.

    9. Усовершенствованные способы повышения эффективности.


    Раздел 2. Методы машинного обучения с учителем.

    1. Классификация.

    2. .Регрессия.

    3. Обобщающая способность, переобучение и недообучение.

    4. Зависимость между сложностью модели и размером набора данных.

    5. Известные набора данных.

    6. Метод k ближайших соседей.

    7. Линейные модели.

    8. Наивные байесовские классификаторы.

    9. Деревья решений.

    10. Ансамбли деревьев решений.

    11. Ядерный метод опорных векторов.

    12. Нейронные сети.

    13. Оценки неопределнности для классификаторов.


    Раздел 3. Методы машинного обучения без учителя и предварительная обработка данных.

    1. Типы машинного обучения без учителя.

    2. Проблемы машинного обучения без учителя.

    3. Виды предварительной обработки данных.

    4. Применение преобразований данных.

    5. Масштабирование обучающего и тестового набора данных.

    6. Снижение размерности, выделение признаков и множественное обучение.

    7. Кластеризация k-средних.

    8. Агломеративная кластеризация.

    9. DBSCAN.

    10. Сравнение методов кластеризации.

    Раздел 4. Типы данных и конструирование признаков

    1. Решение проблемы пропущенных данных.

    2. Категориальные переменные. Кодирование.

    3. Биннинг, дискретизация, линейные модели и деревья.

    4. Одномерные нелинейные преобразования для конструирования признаков.

    5. Автоматический отбор признаков. Одномерные статистики.

    6. Отбор признаков на основе модели.

    7. Итеративный отбор признаков.

    8. Применение экспертных знаний при отборе признаков.


    Раздел 5. Оценка и улучшение качества модели.

    1. Перекрестная проверка модели в scikit-learn. Преимущества перекрестной проверки.

    2. Стратифицированная k-блочная перекрестная проверка и другие стратегии

    3. Простой решетчатый поиск.

    4. Опасность переобучения параметров и проверочный набор данных.

    5. Решетчатный поиск с перекрестной проверкой.

    6. Метрики качества модели и их вычисление. Описание и назначение.

    7. Метрики для бинарной классификации.

    8. Метрики для мультиклассовой классификации.

    9. Метрики регрессии.

    10. Использование метрик оценки для отбора модели.



    Критерии оценки:
    - оценка «отлично» выставляется студенту, если студент демонстрирует уверенные знания по теме собеседования, ответил на все вопросы без замечаний;

    - оценка «хорошо» выставляется студенту, если он демонстрирует уверенные знания по теме собеседования, ответил на все вопросы, допустил одну ошибку.

    - оценка «удовлетворительно» выставляется студенту, если он при ответе допустил две ошибки;

    - оценка «неудовлетворительно» выставляется студенту, если он не имеет представлений по теме собеседования.
    Уровень освоения компетенций: ПК-1, ПК-5– повышенный.

    Составитель: И.С. Васендина «___» _____________ 20__ г.
    Министерство НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ Российской Федерации

    федеральное государственное автономное образовательное учреждение высшего образования

    «Северный (Арктический) федеральный университет имени М.В. Ломоносова»


    Высшая школа информационных технологий и автоматизированных систем

    Кафедра информационных систем и технологий

    09.04.02 Информационные системы и технологии


    Комплект примерных заданий для решения проблемных задач
    по дисциплине«Машинное обучение»
    4 семестр

    на тему «Основные понятия, принципы и задачи машинного обучения. Библиотеки и инструменты для машинного обучения.»

    Задание:

    1 Настройте программное окружение для работы с машинным обучением. Необходимо установить Python 3, Jupyter Notebook, NumPy, SciPy, matplotlib, pandas. Установка других библиотек по мере требования.

    2. Необходимо простроить простую модель машинного обучения, которая сможет обучиться на основе характеристик ирисов, уже классифицированных по сортам, и затем предскажет сорт для нового цветка ириса.

    Для этого загрузить набор данных Iris, просмотреть признаки, метки классов, форматы данных, разделить набор на обучающий и тестовый, построить матрицу рассеяния для признаков. Построить модель по методу k ближайших соседей. Обучить, сделать прогноз, интерпретировать результат.
    на тему «Методы машинного обучения с учителем.»
    Задание:

    1. Изучить синтетические наборы данных forge для классификации и wave для регрессии, построить диаграмму рассеяния. Проанализировать признаки наборов данных и распределение в наборе.

    2. Исследовать наборы данных по раку молочной железы cancer(для классификации) и набор данных о стоимости недвижимости Boston Housing (для регрессии). Сделать выводы о распределениях признаков в наборах.

    3. Разделить данные из наборов п.2 на обучающее и тестовое множество.

    4. Построить классификатор на наборе данных cancer по методы k ближайших соседей, обучите модель, проведите предсказание на тестовом наборе. Постройте границу приняти решений для разного числа соседей. Проанализируйте результат, сделайте выводы.

    5. Проделайте действия п.4 для задачи регрессии на наборе Boston Housing.

    6. Примените метод линейной регрессии для предсказания стоимости недвижимости на наборе Boston Housing. Сделайте предсказания, сравните разные методы машинного обучения.

    7. Рассмотрите подобным образом метод гребневой регрессии, лассо. Сравните, сделайте выводы.

    8. Приметите методы логистической регрессии, опорных векторов для задачи классификации. Сравните, сделайте выводы.

    9. Примените различные методы наивного байесовского классификатора. Сравните, сделайте выводы.

    10. Решите задачи классификации и регрессии с помощью деревьев решений, варьируя параметры. Сравните с другими методами, сделайте выводы.

    11. Проделайте п.10 с использованием случайного леса, сравните результаты.

    12. Проделайте п.10 с использованием градиентного бустинга, сравните результаты.

    13. Проделайте п.10 с использованием ядерного метода опорных векторов, сравните результаты.

    14. Проделайте п.10 с использованием многослойного персептрона, сравните результаты

    на тему «Методы машинного обучения без учителя и предварительная обработка данных.»

    Задание:

    1. Рассмотреть различные виды преобразования данных в библиотеке scikit-learn, примените к набору cancer.

    2. Снизьте размерность признаков в наборе с использованием PCA.

    3. Используя make_blobs создайте набор, решите задачу кластеризации методом k-средних. Проанализируйте результат, сделайте выводы.

    4. Выполните п.3, используя метод алгомеративной кластеризациии и иерархической кластеризации. Визуализируйте результат, сравните и сделайте выводы.

    5. Выполните п.3, используя алгоритм DBSCAN. Сравните все алгоритмы кластеризации.

    6. Оцените качество кластеризации без использования метрик, предполагающих знание истинной кластеризации.

    на тему «Типы данных и конструирование признаков»

    Задание:

    1. Рассмотрите набор данных adult, проанализируйте признаки.

    2. Закодируйте категориальные признаки методом прямого кодирования.

    3. Решите задачу методом логистической регрессии.

    4. Проанализируйте какие из числовых признаков можно закодировать как категориальные. Вновь решите задачу методом логистической регрессии. Сравните результат.

    5. На наборе данных wave отработать приемы биннинга, дискретизации, линейных моделей и деревьев для конструирования признаков. Сделать вывод о возможности применения.

    6. Обогатите пространство признаков с использованием добавления взаимодействий признаков и полиномиальных признаков.

    7. На наборе Boston Housing продемонстируйте автоматический отбор признаков.

    на тему «Оценка и улучшение качества модели»

    Задание:

    1. Для задачи классификации провести оценку построенной модели методом перекрестной проверки.

    2. На наборе данных iris продемонстрировать стратифицированную k-блочную перекрестную проверку и другие стратегии. Сделать выводы о достоинствах и недостатках способов оценки модели.

    3. Улучшите качество модели методом решетчатого поиска (grid search). Предусмотрите опасность переобучения параметров и введите проверочный набор данных.

    4. Улучшите качество модели методом решетчатого поиска с перекрестной проверкой. Проанализируйте полученный результат.

    5. Оцените качество модели, подберите необходимые метрики для оценки. Обоснуйте выбор.

    Критерии оценки:
    - оценка «отлично» выставляется студенту, если студент решил проблемную задачу без замечаний;

    - оценка «хорошо» выставляется студенту, если студент решил проблемную задачу, допустил незначительные ошибки.

    - оценка «удовлетворительно» выставляется студенту, если он решил проблемную задачу, допустил две ошибки, но понимает как их исправить;

    - оценка «неудовлетворительно» выставляется студенту, если он не решил проблемную задачу.

    Уровень освоения компетенций: ПК-1, ПК-5– повышенный.
    Составитель: И.С. Васендина «___» _____________ 20__ г.
    Министерство НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ Российской Федерации

    федеральное государственное автономное образовательное учреждение высшего образования

    «Северный (Арктический) федеральный университет имени М.В. Ломоносова»


    Высшая школа информационных технологий и автоматизированных систем

    Кафедра информационных систем и технологий

    09.04.02 Информационные системы и технологии


    Задания для выполнения курсового проекта
    по дисциплине«Машинное обучение»
    на тему «Применение машинного обучения для решения прикладной задачи»

    Задания:

    1. Описать проблемную задачу.

    В рамках курсового проекта по дисциплине «Машинное обучение» необходимо описать проблемную задачу, определить входные и выходные данные, обосновать возможность решения данной задачи методами машинного обучения. Для задач классификации определить и охарактеризовать классы, для задачи регрессии – диапазон возможных получаемых значений.

    2. Определить обучающую выборку.

    Разработать или найти в сети Internet готовый набор данных. Если датасет создавался студентом, то описать процесс сбора данных. Для набора данных описать каждую характеристику, тип данных, возможные принимаемые значения. Провести исследование значений признаков и, исходя из анализа, заполнить пропуски.

    3. Анализ типов данных и конструирование признаков.

    Предусмотрите разделение всей выборки на обучающую, валидационную и тестовую.

    Проанализировать типы данных признаков, выделить категориальные и числовые признаки. Исследовать распределения каждого признака в наборе данных, кореляции признаков между собой и целевой переменной. Проанализировать возможность переопределения категориальных и числовых признаков. Провести дальнейшее исследование признаков на возможность создания новых признаков из уже имеющихся или удаления из рассмотрения части признаков, вносящих дополнительный шум в данные. Обосновать выбор каждого действия. Провести предобработку значений признаков. Если есть необходимость, попробовать снизить пространство признаков.

    4. Определение модели машинного обучения и подбор её параметров.

    В зависимости от решаемой задачи, подобрать вид классификатора, возможно исследовать несколько разных классификаторов для данной задачи. Провести обучение моделей, собрать статистику результатов обучения, подобрать параметры модели, чтобы улучшить качество результата. Проанализируйте результаты, сделайте выводы. Попробуйте улучшиьт результат проработав ещё раз этап исследования и конструирования признаков.

    5. Оценка модели машинного обучения.

    Получить предсказания модели на тестовой выборке. Провести тестирование обученной модели на примерах, не присутствующих в датасете. Охарактеризовать результат, сделать выводы о широте применения полученной модели. Описать, какие дальше можно делать шаги, чтобы получить выше точность.
    Пояснительная записка должна состоять из следующих структурных элементов:

    1. Титульный лист

    2. Лист задания

    3. Лист для замечаний

    4. Содержание

    5. Введение

    6. Глава 1. Описание проблемной задачи.

    7. Глава 2. Описание обучающей выборки.

    8. Глава 3. Анализ типов данных и конструирование признаков.

    9. Глава 4. Определение модели машинного обучения и подбор её параметров.

    10. Глава 5. Оценка модели машинного обучения.

    11. Заключение (выводы, рекомендации).

    12. Список использованных источников (не менее 5 источников).

    13. Приложение А. Пример тренировочного и тестового датасета.

    Подготовить выступление в форме презентации PowerPoint и выступить с этим докладом перед аудиторией по результатам проведенного исследования.

    Критерии оценки:

    Студенту ставится оценка «отлично», если при решении поставленной задачи проведен анализ предметной области, верно определен и обоснован тип решаемой задачи, проведен расширенный анализ признаков,предложены подходы к конструированию новых признаков, исследовано несколько моделей машинного обучения, проведено исследование при подборе параметров модели, точность выше 75%, при защите свободно владеет материалом и готов предложить пути повышения точности и усовершенствования при решении подобной задачи. Пояснительная записка оформлена в соответствие с правилами оформления студенческих работ, сдана в срок, работа защищена преподавателю. Подготовлено выступление и сделан доклад.

    Студенту ставится оценка «хорошо», если при решении поставленной задачи проведен анализ предметной области, верно определен тип решаемой задачи, выполнена предобработка данных, проведены исследования при подборе параметров модели, проведена некоторая работа по конструированию признаков, точность не менее 70%. Пояснительная записка оформлена в соответствие с правилами оформления студенческих работ, сдана в срок, работа защищена преподавателю. Подготовлено выступление и сделан доклад. Были допущены незначительные замечания.

    Студенту ставится оценка «удовлетворительно», если при решении поставленной задачи проведен анализ предметной области и поставлена корректно задача, применен один из классификаторов без обоснования выбора, выполнена не в достаточном объеме предобработка данных, слабо проработан подбор параметров модели, точность ниже 60%. Пояснительная записка оформлена в соответствие с правилами оформления студенческих работ, работа сдана не в срок, защищена преподавателю. Были допущены грубые ошибки. Подготовлено выступление и сделан доклад.

    Студенту ставится оценка «неудовлетворительно», если студент не получил практических результатов работы или не защитил проект преподавателю.

    Если курсовой проект оформлен не в соответствие с правилами оформления студенческих работ, к защите не допускается.


    Уровень освоения компетенций: ПК-1, ПК-5 – повышенный.

    .
    Составитель: И.С. Васендина «__» __________ 201_ г.
    Министерство НАУКИ И ВЫСШЕГО Российской Федерации

    федеральное государственное автономное образовательное учреждение

    высшего образования

    «Северный (Арктический) федеральный университет имени М.В. Ломоносова»


    Высшая школа информационных технологий и автоматизированных систем

    Кафедра информационных систем и технологий

    09.04.02 «Информационные системы и технологии»


    Контрольные вопросы к зачету
    по дисциплине«Машинное обучение»


    1. Основные понятия машинного обучения.

    2. Задачи, которые можно решать с помощью машинного обучения.

    3. Основные библиотеки и инструменты.

    4. Преимущества машинного обучения по сравнению с традиционным подходом.

    5. Сбор и подготовка данных.

    6. Обучение модели на данных.

    7. Оценка производительности модели.

    8. Оптимизация производительности модели.

    9. Усовершенствованные способы повышения эффективности.

    10. Классификация.

    11. Регрессия.

    12. Обобщающая способность, переобучение и недообучение.

    13. Зависимость между сложностью модели и размером набора данных.

    14. Известные набора данных.

    15. Метод k ближайших соседей.

    16. Линейные модели.

    17. Наивные байесовские классификаторы.

    18. Деревья решений.

    19. Ансамбли деревьев решений.

    20. Ядерный метод опорных векторов.

    21. Нейронные сети.

    22. Оценки неопределнности для классификаторов.

    23. Типы машинного обучения без учителя.

    24. Проблемы машинного обучения без учителя.

    25. Виды предварительной обработки данных.

    26. Применение преобразований данных.

    27. Масштабирование обучающего и тестового набора данных.

    28. Снижение размерности, выделение признаков и множественное обучение.

    29. Кластеризация k-средних.

    30. Агломеративная кластеризация.

    31. DBSCAN.

    32. Сравнение методов кластеризации.

    33. Решение проблемы пропущенных данных.

    34. Категориальные переменные. Кодирование.

    35. Биннинг, дискретизация, линейные модели и деревья.

    36. Одномерные нелинейные преобразования для конструирования признаков.

    37. Автоматический отбор признаков. Одномерные статистики.

    38. Отбор признаков на основе модели.

    39. Итеративный отбор признаков.

    40. Применение экспертных знаний при отборе признаков.

    41. Перекрестная проверка модели в scikit-learn. Преимущества перекрестной проверки.

    42. Стратифицированная k-блочная перекрестная проверка и другие стратегии

    43. Простой решетчатый поиск.

    44. Опасность переобучения параметров и проверочный набор данных.

    45. Решетчатный поиск с перекрестной проверкой.

    46. Метрики качества модели и их вычисление. Описание и назначение.

    47. Метрики для бинарной классификации.

    48. Метрики для мультиклассовой классификации.

    49. Метрики регрессии.

    50. Использование метрик оценки для отбора модели.


    Критерии оценки:
    - оценка «отлично» выставляется студенту, если студент демонстрирует уверенные знания по вопросам зачета, ответил на два вопросы без замечаний;

    - оценка «хорошо» выставляется студенту, если он демонстрирует уверенные знания по теме зачета, ответил на два вопросы, допустил одну ошибку.

    - оценка «удовлетворительно» выставляется студенту, если он при ответе допустил две ошибки;

    - оценка «неудовлетворительно» выставляется студенту, если он не имеет представлений по вопросам к зачету.
    Уровень освоения компетенций: ПК-1, ПК-5 – повышенный.
    Составитель: И.С. Васендина «__» __________ 201_ г.


    написать администратору сайта