Компьютерная лингвистика. Программа дисциплины Компьютерная лингвистика
Скачать 0.55 Mb.
|
Рабочая программа дисциплины «Компьютерная лингвистика» составлена в соответствии с федеральным государственным образовательным стандартом высшего образования (ФГОС ВО) по направлению подготовки 45.03.03 Фундаментальная и прикладная лингвистика Программу составил(и): Шульженко М.Ю. к.ф.н., доцент Шульженко М.Ю. Рабочая программа дисциплины «Компьютерная лингвистика» утверждена на заседании кафедры прикладной лингвистики и новых информационных технологий протокол № 12 15 мая 2020 г. Заведующий кафедрой (разработчика) Бодоньи М.А. Бодоньи М.А. Рабочая программа дисциплины «Компьютерная лингвистика» обсуждена на заседании кафедры прикладной лингвистики и новых информационных технологий протокол № 12 15 мая 2020 г. Заведующий кафедрой (выпускающей) Бодоньи М.А. Бодоньи М.А. Утверждена на заседании учебно-методической комиссии факультета романо-германской филологии протокол № 7 21 мая 2020 г. Председатель УМК факультета Бодоньи М.А. Бодоньи М.А. Рецензенты: Кулинцева Н.А. кандидат филологических наук, доцент кафедры западноевропейских языков и культур ФГБОУ ВО «Пятигорский государственный университет» Прима А.М, к.ф.н., доцент кафедры английской филологии ФГБОУ ВО «КубГУ» 1. Цель и задачи изучения дисциплины (модуля) 1.1 Цель освоения дисциплины Цель данной дисциплины – дать студентам общее представление о задачах компьютерной лингвистики, а также заложить базу для дальнейшего освоения курсов, относящихся к теории и практике языковых технологий 1.2 Задачи дисциплины В процессе освоения дисциплины реализуются следующие задачи: - способствовать теоретическому осмыслению и систематизации основных понятий и категории современной лингвистики, а также основных направлений и задач компьютерной лингвистики; - изучить основные типы систем, использующих модули лингвистического анализа; - овладеть основными методами, способами и средствами получения, хранения, переработки информации; - расширять знания студентов об типах, характеристиках и особенностях основных доступных в Интернете лингвистических ресурсов; - сформировать умения использовать основные принципы и методы компьютерного моделирования лингвистических задач. 1.3 Место дисциплины (модуля) в структуре образовательной программы Дисциплина «Компьютерная лингвистика» относится к части, формируемой участниками образовательных отношений Блока 1 "Дисциплины (модули)" учебного плана. 1.4 Перечень планируемых результатов обучения по дисциплине (модулю), соотнесенных с планируемыми результатами освоения образовательной программы Изучение данной учебной дисциплины направлено на формирование у обучающихся следующей компетенции № п.п. Индекс компет енции Содержание компетенции (или её части) В результате изучения учебной дисциплины обучающиеся должны знать уметь владеть 1. ПК-4 владением основ- ными методами создания и работы с информацион- ными базами дан- ных, в том числе лингвистически- ориентирован- ными -основные направления и задачи компью- терной лингви- стики; -сущность и значения ин- формации в раз- витии современ- ного общества; - основные ме- тоды, способы и средства полу- чения, хране- ния, перера- ботки информа- ции; -основные принципы и ме- тоды компью- терного моде- лирования лингвистиче- -анализировать работу различ- ных систем об- работки текста, для выявления основных линг- вистических компонентов и основных типов обработки текста, исполь- зуемых в данных системах; - подбирать не- обходимые лингвистические ресурсы для различных задач лингви- стического обеспечения систем; -строить про- -умениями работы с ком- пьютером как средством управления информацией -необходимы- ми формальными методами мо- делирования задач лингви- стического анализа; -основными методами, способами и средствами получения, хранения, пе- реработки ин- формации № п.п. Индекс компет енции Содержание компетенции (или её части) В результате изучения учебной дисциплины обучающиеся должны знать уметь владеть ских задач; -основные поня- тия и категории современной лингвистики стейший конеч- ный автомат для моделирования морфонологи- ческих явлений при автоматическом морфоло- гическом ана- лизе; -использовать язык регулярных выражений для простейших задач обработки текста; -работать с ин- формацией в глобальных компьютерных сетях 2. ПК-7 владением основ- ными методами фонологического, морфологического, синтаксического, дискурсивного и семантического анализа с учетом языковых и экстра- лингвистических факторов особенности применения методов линг- вистического анализа при- менительно к компьютерной лингвистике как предмету анализа использовать ме- тоды лингвисти- ческого анализа применительно к предмету иссле- дования компьютерной лингвистики умениями применять методы линг- вистического анализа для изучения лингвистиче- ской системы английского языка с уче- том языко- вых и экстра- лингвистиче- ских факто- ров 2. Структура и содержание дисциплины. 2.1 Распределение трудоёмкости дисциплины по видам работ с формой контроля Общая трудоёмкость дисциплины составляет 4 зач. ед. (144 часов), их распределение по видам работ представлено в таблице Вид учебной работы Всего часов Семестры (часы) V сем Контактная работа, в том числе: 36 36 Аудиторные занятия (всего): Занятия лекционного типа 16 16 Занятия семинарского типа (семинары, практические занятия 18 18 Лабораторные занятия Иная контактная работа: 4,3 4,3 Контроль самостоятельной работы (КСР) 4 4 Промежуточная аттестация (ИКР) 0,3 0,3 Самостоятельная работа, в том числе: 70 70 Проработка учебного (теоретического) материала 40 40 Выполнение индивидуальных заданий (подготовка сообщений, презентаций) 20 20 Реферат 10 10 Подготовка к текущему контролю Контроль: 35,7 35,7 Подготовка к экзамену Промежуточная аттестация (экзамен) Общая трудоемкость час 144 144 в том числе контактная работа 70,3 70,3 зач.ед. 4 4 2.2 Структура дисциплины: Распределение видов учебной работы и их трудоемкости по разделам (темам) дисциплины. Разделы (темы) дисциплины, изучаемые в V семестре (очная форма) № Наименование разделов (тем) Количество часов Всего Аудиторная работа Внеаудито рная работа Л ПЗ ЛР СРС 1 2 3 4 5 6 7 1 Введение. Предмет компьютерной лингвистики. Области исследования. Подходы. История. 12 2 2 - 8 2 Основные направления автоматической обработки текстов. Теоретические и прикладные направления автоматической обработки текстов. 12 2 2 - 8 3 Машинная морфология 13 2 2 - 9 4 Основные типы компьютерных лингвистических ресурсов. Корпуса текстов. Лингвистическая дешифровка. 13 2 2 - 9 5 Компьютерные словари, тезаурусы, онтологии. 13 2 2 - 9 6 Моделирование в компьютерной лингвистике. 13 2 2 - 9 7 Язык регулярных выражений. Понятие регулярного выражения. Синтаксис регулярных выражений. Использование языка регулярных выражений для разбиения текста на слова. Использование языка регулярных выражений для поиска в тексте. 14 2 3 - 9 8 Автоматический морфологический анализ и применение конечных преобразователей морфологическом анализе. Основные проблемы автоматического семантического анализа. 14 2 3 - 9 ИТОГО по разделам дисциплины 104 16 18 - 70 Контроль самостоятельной работы (КСР) 4 Промежуточная аттестация (ИКР) 0,3 Подготовка к текущему контролю 35,7 Общая трудоемкость по дисциплине 144 Примечание: Л – лекции, ПЗ – практические занятия / семинары, ЛР – лабораторные занятия, СРС – самостоятельная работа студента 2.3 Содержание разделов (тем) дисциплины: 2.3.1 Занятия лекционного типа № Наименование раздела (темы) Содержание раздела (темы) Форма текущего контроля 1 2 3 4 1. Введение. Предмет компьютерной лингвистики. Области исследования. Подходы. История. O термине «информатика». Область возникновения лингвистических проблем информатики. Совершенствование массовой и индивидуальной коммуникации. Информатика и компьютерная лингвистика. - 2. Основные направления автоматической обработки текстов. Теоретические и прикладные направления автоматической обработки текстов. Ввод текста в компьютер. Человеко-компьютерное взаимодействие. Компьютерная лингвистика. Обработка лингвистической информации на уровне словоформ, слов, словосочетаний, предложений, текста. - 3. Машинная морфология Автоматический морфологический анализ. Виды автоматического морфологического анализа. Современное состояние морфологического анализа. - 4. Основные типы компьютерных лингвистических ресурсов. Корпуса текстов. Лингвистическая дешифровка. Лингвистическая дешифровка как прикладная дисциплина. Статистические методы. Графематический уровень. Дериватология. - 5. Компьютерные словари, тезаурусы, онтологии. Традиционная и машинная лексикография. Отличия машинного словаря от обычного. Вычислительная лексикография. Словарно-центрический подход. Лемматизация. Машиночитаемые словари. Лемматизация. Составление машинных словарей. - 6. Моделирование в компьютерной лингвистике. Моделирование языковых сущностей и человеческого мышления. Связь языка с мышлением. Элементы системы искусственного интеллекта. Как мыслит человек. Искусственный интеллект. Модель механизма мышления. - 7. Язык регулярных выражений. Понятие регулярного выражения. Синтаксис Автоматический синтаксический анализ. Современное состояние автоматического синтаксического анализа. Синтаксическая структура. Анализ по частям речи и членам предложения. Перспективы автоматического синтаксического анализа. - регулярных выражений. Использование языка регулярных выражений для - разбиения текста- на слова.- Использование языка регулярных выражений для поиска в тексте. 8. Автоматический морфологический анализ и применение конечных преобразователей морфологическом анализе. Основные проблемы автоматического семантического анализа Автоматический морфологический анализ. Виды автоматического морфологического анализа. Современное состояние морфологического анализа. - 2.3.2 Занятия семинарского типа № Наименование раздела (темы) Тематика практических занятий (семинаров) Форма текущего контроля 1 2 3 4 1. Предмет компьютерной лингвистики Что такое компьютерная лингвистика? Основные направления компьютерной лингвистики. Контрольная работа №1 2. Инструментарий компьютерной лингвистики Словари. Корпуса текстов. Реферат 3. Понимание текста Компьютерный анализ текста. Задачи лингвистических информационных технологий. Контрольная работа № 2 4. Автоматический анализ текста Морфологический уровень. Синтаксический уровень. Анафора и кореферентность. Контрольная работа № 3 5. Классификация Закон Ципфа. Модель TF*IDF. Классификация документов. Классификация с обучением. Оценка результатов классификации. Контрольная работа № 4 6. Кластеризация Кластеризация. Контент-анализ. Эссе 7. Машинный перевод как центральная проблема искусственного интеллекта Значение идеи машинного перевода. Машинный перевод и теория языка. К истории машинного перевода. Современное состояние машинного перевода. О преодолении языковых барьеров. Основные проблемы современного машинного перевода. Проблемы современного машинного перевода. Собеседование 8. Представление знаний Семантические сети и фреймы. Знание как объект моделирования. Лингвистический аспект представления знаний. Тест 9. Терминология, терминоведение. Термин как лингвистическая проблема информатики. Лексика современных текстов. Терминоведение и лингвистика Многозначность термина. Проект 2.3.3 Лабораторные занятия Лабораторные занятия – не предусмотрены 2.3.4 Примерная тематика курсовых работ (проектов) Курсовые работы – не предусмотрены 2.4 Перечень учебно-методического обеспечения для самостоятельной работы обучающихся по дисциплине (модулю) № Вид СРС Перечень учебно-методического обеспечения дисциплины по выполнению самостоятельной работы 1 2 3 1 Проработка учебного (теоретического) материала Методические указания по организации самостоятельной работы по дисциплине «Компьютерная лингвистика», утвержденные кафедрой прикладной лингвистики и новых информационных технологий, протокол № 10 от «27» мая 2019 г. 2 Выполнение индивидуальных заданий Методические указания по организации самостоятельной работы по дисциплине «Компьютерная лингвистика», утвержденные кафедрой прикладной лингвистики и новых информационных технологий, протокол № 10 от «27» мая 2019 г. 3 Реферат Методические указания по организации самостоятельной работы по дисциплине «Компьютерная лингвистика», утвержденные кафедрой прикладной лингвистики и новых информационных технологий, протокол № 10 от «27» мая 2019 г. Учебно-методические материалы для самостоятельной работы обучающихся из числа инвалидов и лиц с ограниченными возможностями здоровья (ОВЗ) предоставляются в формах, адаптированных к ограничениям их здоровья и восприятия информации: Для лиц с нарушениями зрения: – в печатной форме увеличенным шрифтом, – в форме электронного документа, Для лиц с нарушениями слуха: – в печатной форме, – в форме электронного документа. Для лиц с нарушениями опорно-двигательного аппарата: – в печатной форме, – в форме электронного документа. Данный перечень может быть конкретизирован в зависимости от контингента обучающихся. 3. Образовательные технологии. В рамках семинарских занятий студентам предлагается подготовить презентации и доклады по современным грамматическим концепциям, что предполагает развитие навыка самостоятельной работы с научной литературой. В ходе обучения активно используются задания не только на основе отдельных предложений, но и полноценных связных текстов, что способствует усвоению не только языковых теоретических особенностей системы, но их речевых воплощений. Студентам предлагаются проблемные вопросы, предполагающие различные решения с позиций разных концепций, что развивает способность учитывать многогранность языковых и речевых явлений и уметь аргументировано отстаивать свою позицию в научном споре, уметь принимать во внимание контраргументы. Для лиц с ограниченными возможностями здоровья предусмотрена организация консультаций с использованием электронной почты. 4. Оценочные методические материалы 4.1 Оценочные средства для текущего контроля успеваемости и промежуточной аттестации Оценочные средства предназначены для контроля и оценки образовательных достижений обучающихся, освоивших программу учебной дисциплины «Компьютерная лингвистика». Оценочные средства включает контрольные материалы для проведения текущего контроля в форме тестовых заданий, контрольных работ, написание рефератов и эссе по актуальным вопросам в рамках изучаемой дисциплины, подготовки проекта и промежуточной аттестации в форме вопросов и заданий к экзамену. Оценочные средства для инвалидов и лиц с ограниченными возможностями здоровья выбираются с учетом их индивидуальных психофизических особенностей. – при необходимости инвалидам и лицам с ограниченными возможностями здоровья предоставляется дополнительное время для подготовки ответа на экзамене; – при проведении процедуры оценивания результатов обучения инвалидов и лиц с ограниченными возможностями здоровья предусматривается использование технических средств, необходимых им в связи с их индивидуальными особенностями; – при необходимости для обучающихся с ограниченными возможностями здоровья и инвалидов процедура оценивания результатов обучения по дисциплине может проводиться в несколько этапов. Процедура оценивания результатов обучения инвалидов и лиц с ограниченными возможностями здоровья по дисциплине (модулю) предусматривает предоставление информации в формах, адаптированных к ограничениям их здоровья и восприятия информации: Для лиц с нарушениями зрения: – в печатной форме увеличенным шрифтом, – в форме электронного документа. Для лиц с нарушениями слуха: – в печатной форме, – в форме электронного документа. Для лиц с нарушениями опорно-двигательного аппарата: – в печатной форме, – в форме электронного документа. Данный перечень может быть конкретизирован в зависимости от контингента обучающихся. Структура оценочных средств для текущей и промежуточной аттестации № п/п Контролируемые разделы (темы) дисциплины* Код контролируемой компетенции (или ее части) Наименование оценочного средства Текущий контроль Промежуточная аттестация 1 Предмет компьютерной лингвистики ПК-4: Знает основные направления и задачи компьютерной лингвистики; умеет подбирать необходимые лингвистические ресурсы для различных задач лингвистического обеспечения систем; владеет навыками работы с компьютером как средством управления информацией ПК-7: Знает особенности применения методов лингвистического анализа применительно к компьютерной лингвистике как предмету анализа; умеет использовать методы лингвистического анализа применительно к предмету иссле- дования компьютерной лингвистики; владеет умениями применять методы лингвисти- ческого анализа для изучения лингвистической системы англий- ского языка с учетом языковых и экстралингвистических факторов Контрольная Работа № 1 Вопросы на экзамене 1-5 2 Инструментарий компьютерной лингвистики ПК-4: Знает основные методы, способы и средства получения, хранения, переработки информации; -основные принципы и методы компьютерного моделирования лингвистических задач; умеет анализировать работу различных систем обработки текста, для выявления основных лингвистиче- ских компонентов и основных ти- пов обработки текста, исполь- зуемых в данных системах; работать с информацией в глобальных компьютерных сетях; владеет умениями работы с ком- пьютером как средством управления информацией, способами и средствами получения, хранения, переработки ин- формации; ПК-7: Знает особенности применения методов лингвистического анализа применительно к компьютерной лингвистике как предмету анализа; умеет использовать методы лингвистического анализа применительно к предмету иссле- дования компьютерной лингвистики; владеет умениями Реферат Вопросы на экзамене 6-12 применять методы лингвисти- ческого анализа для изучения лингвистической системы англий- ского языка с учетом языковых и экстралингвистических факторов 3 Понимание текста ПК-4: Знает основные принципы и ме- тоды компьютерного моде- лирования лингвистических задач; основные понятия и категории современной лингвистики; умеет анализировать работу различ- ных систем обработки текста, для выявления основных лингвистиче- ских компонентов и основных типов обработки текста, используемых в данных системах; подбирать не- обходимые лингвистические ресурсы для различных задач линг- вистического обеспечения систем; строить простейший конеч- ный автомат для моделирования морфонологических явлений при автоматическом морфологическом анализе; владеет умениями работы с компьютером как средством управления информацией; необходимыми формальными методами моделирования задач лингвистического анализа; ПК-7: Знает особенности применения методов лингвистического анализа применительно к компьютерной лингвистике как предмету анализа; умеет использовать методы лингвистического анализа применительно к предмету иссле- дования компьютерной лингвистики; владеет умениями применять методы лингвисти- ческого анализа для изучения лингвистической системы англий- ского языка с учетом языковых и экстралингвистических факторов Контрольная Работа № 2 Вопросы на экзамене 13-20 4 Автоматический анализ текста ПК-4: Знает основные направления и задачи компьютерной лингвистики; способы и средства получения, хранения, переработки информа- ции; основные принципы и методы компьютерного моделирования лингвистических задач; основные понятия и категории современной лингвистики; умеет анализировать работу различных систем об- работки текста, для выявления основных лингвистических компонентов и основных типов обработки текста, используемых в данных системах; подбирать необходимые лингвистические ресурсы для Контрольная Работа № 3 Вопросы на экзамене 20-25 различных задач лингвистического обеспечения систем; использовать язык регулярных выражений для простейших задач обработки текста; работать с информацией в глобальных компьютерных сетях владеет умениями работы с ком- пьютером как средством управления информацией необходимыми формальными методами моделирования задач лингвистического анализа; основными методами, способами и средствами получения, хранения, переработки информации; ПК-7: Знает особенности применения методов лингвистического анализа применительно к компьютерной лингвистике как предмету анализа; умеет использовать методы лингвистического анализа применительно к предмету иссле- дования компьютерной лингвистики; владеет умениями применять методы лингвисти- ческого анализа для изучения лингвистической системы англий- ского языка с учетом языковых и экстралингвистических факторов 5 Классификация ПК-4: Знает основные методы, способы и средства получения, хранения, переработки информации; основные понятия и категории современной лингвистики; умеет анализировать работу различных систем обработки текста, для выявления основных лингвистиче- ских компонентов и основных типов обработки текста, используемых в данных системах; подбирать не- обходимые лингвистические ресурсы для различных задач линг- вистического обеспечения систем; владеет умениями работы с компьютером как средством управления информацией основными методами ин- струментального анализа звучащей речи; необходимыми формальными методами моделирования задач лингвистического анализа; ПК-7: Знает особенности применения методов лингвистического анализа применительно к компьютерной лингвистике как предмету анализа; умеет использовать методы лингвистического анализа применительно к предмету иссле- дования компьютерной лингвистики; владеет умениями Контрольная Работа № 5 Вопросы на экзамене 26-32 применять методы лингвисти- ческого анализа для изучения лингвистической системы англий- ского языка с учетом языковых и экстралингвистических факторов 6 Кластеризация ПК-4: Знает основные направления и задачи компьютерной лингвистики; основные методы, способы и сред- ства получения, хранения, перера- ботки информации; умеет анализировать работу различных систем обработки текста, для выявления основных лингвистиче- ских компонентов и основных ти- пов обработки текста, исполь- зуемых в данных системах; работать с информацией в глобальных компьютерных сетях; владеет основными методами, способами и средствами получения, хранения, переработки информации; ПК-7: Знает особенности применения методов лингвистического анализа применительно к компьютерной лингвистике как предмету анализа; умеет использовать методы лингвистического анализа применительно к предмету иссле- дования компьютерной лингвистики; владеет умениями применять методы лингвисти- ческого анализа для изучения лингвистической системы англий- ского языка с учетом языковых и экстралингвистических факторов Эссе Вопросы на экзамене 33-38 7 Машинный перевод как центральная проблема ис- кусственного ин- теллекта ПК-4: Знает основные направления и задачи компьютерной лингвистики; основные методы, способы и сред- ства получения, хранения, перера- ботки информации; основные принципы и методы компью- терного моделирования лингвистических задач; основные понятия и категории современной лингвистики; умеет анализировать работу различных систем обработки текста, для выявления основных лингвистиче- ских компонентов и основных типов обработки текста, используемых в данных системах; подбирать необ- ходимые лингвистические ресурсы для различных задач лингви- стического обеспечения систем; строить простейший конечный автомат для моделирования морфо- нологических явлений при автоматическом морфологическом анализе; использовать язык регуляр- Собеседование Вопросы на экзамене 39-42 ных выражений для простейших задач обработки текста; работать с информацией в глобальных компьютерных сетях; владеет умениями работы с ком- пьютером как средством управления информацией, формальными методами моделирования задач лингвистического анализа; ос- новными методами, способами и средствами получения, хранения, переработки информации; ПК-7: Знает особенности применения методов лингвистического анализа применительно к компьютерной лингвистике как предмету анализа; умеет использовать методы лингвистического анализа применительно к предмету иссле- дования компьютерной лингвистики; владеет умениями применять методы лингвисти- ческого анализа для изучения лингвистической системы англий- ского языка с учетом языковых и экстралингвистических факторов 8 Представление знаний ПК-4: Знает основные направления и задачи компьютерной лингвистики; сущность и значения информации в развитии современного общества; основные методы, способы и сред- ства получения, хранения, перера- ботки информации; умеет анализировать работу различ- ных систем обработки текста, для выявления основных лингвистиче- ских компонентов и основных типов обработки текста, используемых в данных системах; подбирать не- обходимые лингвистические ресурсы для различных задач линг- вистического обеспечения систем; владеет умениями работы с ком- пьютером как средством управления информацией, основными методами, способами и средствами получения, хранения, переработки информации; ПК-7: Знает особенности применения методов лингвистического анализа применительно к компьютерной лингвистике как предмету анализа; умеет использовать методы лингвистического анализа применительно к предмету иссле- дования компьютерной лингвистики; владеет умениями применять методы лингвисти- ческого анализа для изучения лингвистической системы англий- Тест Вопросы на экзамене 43-46 ского языка с учетом языковых и экстралингвистических факторов 9 Терминология, терминоведение ПК-4: Знает основные направления и задачи компьютерной лингвистики; основные методы, способы и сред- ства получения, хранения, перера- ботки информации; умеет строить простейший конечный автомат для моделирования морфонологических явлений при автоматическом морфологическом анализе; использовать язык регулярных выражений для простейших задач обработки текста; владеет основными методами, способами и средствами получения, хранения, переработки информации; ПК-7: Знает особенности применения методов лингвистического анализа применительно к компьютерной лингвистике как предмету анализа; умеет использовать методы лингвистического анализа применительно к предмету иссле- дования компьютерной лингвистики; владеет умениями применять методы лингвисти- ческого анализа для изучения лингвистической системы англий- ского языка с учетом языковых и экстралингвистических факторов Проект Вопросы на экзамене 47-50 |