Компьютерная лингвистика. Программа дисциплины Компьютерная лингвистика
Скачать 0.55 Mb.
|
3) Реферат 1. Обзор сетевых ресурсов по корпусной лингвистике 2. Характеристика ресурсов по компьютерной лингвистике (www.dialog-21 .га, www. computer, org) 3. Специальные возможности программы MS Word для лингвистов (проверка правописания, рецензирование, автореферирование, использование шаблонов и т.д.) 4. Правильное использование заимствованных терминов и обозначений (правописание, склонение, спряжение, ударение) компьютерной лингвистики 5. Особенности электронных переводческих словарей Lingvo nMultitran и их отличия от онлайн-переводчиков (Google, Yandex и т.п.) 6. Сравнение программ переводческой памяти (TRADOS, Deja ш и т.п.) 7. Сравнение программ автоматического перевода (ПРОМТ, Сократ и т.п.) 8. Средства обеспечения и поддержки локализации (Multilizer, Passolo и т.п.) 9. Краудсорсинг или модель «Википедии» в переводе 10. Сравнение мультимедийных программ по обучению иностранным языкам (English DeLuxe, «РЕПЕТИТОР English) и т.п.) 11. Технология подкастинга в обучении языкам 12. ВебКвесты в обучении языкам 13. Возможности электронного письма в обучении языкам 14. Сетевые формы коммуникации (электронная почта, чаты, форумы) и их влияние на язык 15. Ресурсы Всемирной паутины для обучения языкам 16. Сравнительный анализ составления поисковых запросов в популярных русскоязычных поисковых системах (Google, Yandex, Rambler, Mail.ru, AltaVista, Yahoo, MSN, AOL) Перечень части компетенций, проверяемых оценочным средством: ПК-4: знание основных направлений и задач компьютерной лингвистики; основных ме- тодов, способов и средств получения, хранения, переработки информации; основных принципов и методов компьютерного моделирования лингвистических задач; основных понятия и категории современной лингвистики; умение анализировать работу различных систем обработки текста, для выявления основных лингвистических компонентов и основных типов обработки текста, используемых в данных системах; владение умениями работы с компьютером как средством управления информацией, необходимыми формальными методами моделирования задач лингвистического анализа; основными методами, способами и средствами получения, хранения, переработки информации ПК-7: знание особенностей применения методов лингвистического анализа применительно к компьютерной лингвистике как предмету анализа, умение использовать методы лингвистического анализа применительно к предмету исследования компьютерной лингвистики, владение умениями применять методы лингвистического анализа для изучения лингвистической системы английского языка с учетом языковых и экстралингвистических факторов. 4) Проект Найдите в Интернете текст Alice's Adventures in Wonderland by Lewis Carroll (например, на сайте www.gutenberg.org/ebooks/ll). Сохраните его на свой компьютер в формате MS Word. Выполните задания на простой поиск в этом документе и внесите результаты поиска в таблицу. Задание Ответ 1. Сколько раз в тексте встречается слово child (в разных формах)? 2. Сколько раз в тексте встречается слово child именно в этой форме? 3. Приведите один из контекстов использования в тексте слова beautiful 4. В какой орфографии (британской или американской) представлен текст? Ответ: Проверочное слово: Поиск с подстановочными знаками Выполните поиск с подстановочными знаками по тексту Alice's Adventures in Wonderland. Внесите результаты поиска в таблицу. Задание Формула поиска Ответ 1. Найдите в тексте первые пять слов, состоящих из пяти букв 2. Сколько в тексте шестибуквенных слов, начинающихся на букву s и заканчивающиеся на букву г? 3. Найдите в тексте первые пять трёхбуквенных слов, начинающиеся на гласную букву 4. Сколько в тексте слов, состоящих из двенадцати букв? По каким формальным признакам их можно сгруппировать? Приведите пример из каждой группы слов. Ответ: Группы: 5. Сколько в тексте слов с суффиксом -tion? Приведите пример использования такого слова в контексте Ответ: Пример: 6. Есть ли в тексте слова, включающие четыре согласные буквы подряд? 7. Сколько раз в тексте встречаются пассивные конструкции единственного числа прошедшего времени? Перечень части компетенций, проверяемых оценочным средством: ПК-4: знание основных направлений и задач компьютерной лингвистики; основных ме- тодов, способов и средств получения, хранения, переработки информации; основных принципов и методов компьютерного моделирования лингвистических задач; основных понятия и категории современной лингвистики; умение анализировать работу различных систем обработки текста, для выявления основных лингвистических компонентов и основных типов обработки текста, используемых в данных системах; владение умениями работы с компьютером как средством управления информацией, необходимыми формальными методами моделирования задач лингвистического анализа; основными методами, способами и средствами получения, хранения, переработки информации ПК-7: знание особенностей применения методов лингвистического анализа применительно к компьютерной лингвистике как предмету анализа, умение использовать методы лингвистического анализа применительно к предмету исследования компьютерной лингвистики, владение умениями применять методы лингвистического анализа для изучения лингвистической системы английского языка с учетом языковых и экстралингвистических факторов. 5) Собеседование 1.Что такое лингвистика? Назовите ее разделы. В каком разделе лингвистика имеет дело с информационными технологиями? 2. Можно ли считать синонимами прикладную и компьютерную лингвистику? Аргументируйте свой ответ. 3. Перечислите основные направления компьютерной лингвистики. Расскажите об одном из направлений. 4. Сравните разные определения языка. Выделите в них ключевые слова. Составьте на основе повторяющихся ключевых слов свое определение языка. 5. Подумайте, с естественным или искусственным языком имеет дело компьютерная лингвистика? 6. Какие виды естественных и искусственных языков вам известны? Приведите примеры естественных и искусственных языков разных видов. 7. Сопоставьте разные определения информации. Какое из определений, на ваш взгляд, лучше всего подходит к лингвистике? 8. Сравните свойства информации, выделяемые в разных источниках. 9. Как соотносятся информация, сообщение и данные? 10. Назовите основные этапы развития информационных технологий. 11. В чем ученые видят будущее информационных технологий? Что вы думаете по этому поводу? 12. Что такое задача и правило? Как эти понятия связаны с алгоритмом? 13. Каковы свойства алгоритмов? Опишите строение компьютера и охарактеризуйте периферийные устройства. 14. Дайте определение системному и прикладному программному обеспечению. Определите понятия операционной системы, утилиты и драйвера. 15. Приведите классификацию прикладных компьютерных программ. Дайте их краткую характеристику и приведите примеры основных видов прикладных компьютерных программ. 16. Охарактеризуйте текстовый процессор и его лингвистические функции. 17. Охарактеризуйте специальные компьютерные программы, разработанные для лингвистических целей. 18. Опишите лингвистические ресурсы компьютерной лингвистики (lingware). Перечень части компетенций, проверяемых оценочным средством: ПК-4: знание основных направлений и задач компьютерной лингвистики; основных ме- тодов, способов и средств получения, хранения, переработки информации; основных принципов и методов компьютерного моделирования лингвистических задач; основных понятия и категории современной лингвистики; умение анализировать работу различных систем обработки текста, для выявления основных лингвистических компонентов и основных типов обработки текста, используемых в данных системах; владение умениями работы с компьютером как средством управления информацией, необходимыми формальными методами моделирования задач лингвистического анализа; основными методами, способами и средствами получения, хранения, переработки информации ПК-7: знание особенностей применения методов лингвистического анализа применительно к компьютерной лингвистике как предмету анализа, умение использовать методы лингвистического анализа применительно к предмету исследования компьютерной лингвистики, владение умениями применять методы лингвистического анализа для изучения лингвистической системы английского языка с учетом языковых и экстралингвистических факторов. 6) Эссе 1. Задачи и методы компьютерной лингвистики. 2. Корпусная лингвистика. Основные характеристики корпуса. 3. Представление знаний. Основные идеи теории фреймов М. Минского. Система FrameNet. 4. Тезаурусы и онтологии. WordNet. 5. Основы статистического анализа текстов. Частотные словари. Анализ коллокаций. 6. Понятие машинного обучения. Перечень части компетенций, проверяемых оценочным средством: ПК-4: знание основных направлений и задач компьютерной лингвистики; основных ме- тодов, способов и средств получения, хранения, переработки информации; основных принципов и методов компьютерного моделирования лингвистических задач; основных понятия и категории современной лингвистики; умение анализировать работу различных систем обработки текста, для выявления основных лингвистических компонентов и основных типов обработки текста, используемых в данных системах; владение умениями работы с компьютером как средством управления информацией, необходимыми формальными методами моделирования задач лингвистического анализа; основными методами, способами и средствами получения, хранения, переработки информации ПК-7: знание особенностей применения методов лингвистического анализа применительно к компьютерной лингвистике как предмету анализа, умение использовать методы лингвистического анализа применительно к предмету исследования компьютерной лингвистики, владение умениями применять методы лингвистического анализа для изучения лингвистической системы английского языка с учетом языковых и экстралингвистических факторов. Вопросы для подготовки к экзамену № Вопросы для подготовки к экзамену Код компетенции или её части 1 Компьютерная лингвистика как направление научной деятельности, ее цели и задачи. ПК-4, ПК-7 2 Связь компьютерной лингвистики с другими областями человеческого знания. ПК-4, ПК-7 3 Искусственный интеллект как область знаний. Основные направления исследований. ПК-4, ПК-7 4 Лингвистические базы знаний. Принципы формирования и использования. ПК-4, ПК-7 5 Структура лингвистической базы знаний. ПК-4, ПК-7 6 Соотношение прикладной лексикографии с общей лексикологией и другими смежными дисциплинами. Задачи прикладной лексикографии. ПК-4, ПК-7 7 Словарь словоформ, его достоинства и недостатки, принципы разработки. ПК-4, ПК-7 8 8. Словарь типа «машинная основа + машинная флексия», его достоинства и недостатки, принципы разработки ПК-4, ПК-7 9 Концепция матричного гнездового (словообразовательного) словаря как один из способов снятия неполноты словарей. ПК-4, ПК-7 10 Системное кодирование информации различного рода на уровне словаря. Основные требования к кодам. ПК-4, ПК-7 11 Системное кодирование морфологической информации о именных частях речи в системах автоматической обработки текстов. ПК-4, ПК-7 12 Системное кодирование морфологической информации о глаголе в системах автоматической обработки текстов. ПК-4, ПК-7 13 Системное кодирование морфологической информации о служебных частях речи в системах автоматической обработки текстов. ПК-4, ПК-7 14 Синтаксический словарь как компонент лингвистической базы знаний. ПК-4, ПК-7 15 Синтаксическая модель управления глагола. ПК-4, ПК-7 16 Семантический классификатор как компонент лингвистической базы знаний. ПК-4, ПК-7 17 Семантическая классификация понятий, семантическая модель управления различных частей речи ПК-4, ПК-7 18 Структура словарной статьи машинного словаря. ПК-4, ПК-7 19 Словари ударений, сокращений, омонимов, синонимов, имен собственных, идиом в системах автоматической обработки языка. Разработка и использование. ПК-4, ПК-7 20 Исходные понятия корпусной лингвистики: проблемная область, корпус данных, корпус текстов. ПК-4, ПК-7 21 Параллельный многоязычный корпус текстов, его структура и сфера применения. ПК-4, ПК-7 22 Требования к корпусу текстов с точки зрения пользователя. ПК-4, ПК-7 23 Аннотированные корпусы текстов, автоматизация их создания и коррекции. ПК-4, ПК-7 24 Практическое использование аннотированных корпусов текстов в системах автоматической обработки текстов. ПК-4, ПК-7 25 Перевод как вид языковой деятельности. Общая формальная модель переводческой деятельности человека как основа ее моделирования в системах машинного перевода ПК-4, ПК-7 26 Классификация переводов по различным признакам. Виды переводов в зависимости от степени автоматизации. ПК-4, ПК-7 27 Машинный перевод как одно из направлений искусственного интеллекта. История возникновения и развития. ПК-4, ПК-7 28 Подходы к моделированию процесса перевода в системах машинного перевода. ПК-4, ПК-7 29 Оценка эффективности системы машинного перевода. ПК-4, ПК-7 30 Основные компоненты системы машинного перевода. ПК-4, ПК-7 31 Общий алгоритм задачи машинного перевода. ПК-4, ПК-7 32 Лингвистические проблемы машинного перевода: проблемы на уровне машинного словаря. ПК-4, ПК-7 33 Лингвистические проблемы машинного перевода: неточности перевода на уровне морфологии. ПК-4, ПК-7 34 Лингвистические проблемы машинного перевода: неточности перевода на уровне синтаксиса. ПК-4, ПК-7 35 Концептуальное поле омонимии. Системная классификация омонимов в устных и письменных текстах ПК-4, ПК-7 36 Грамматическая омонимия как системная категория языка. ПК-4, ПК-7 37 Пути возникновения омонимии. Межъязыковая омонимия ПК-4, ПК-7 38 Способы снятия омонимии при автоматической обработке текстов. Алгоритм разрешения омонимии «глагол – имя существительное». ПК-4, ПК-7 39 Способы снятия омонимии при автоматической обработке текстов. Алгоритм разрешения омонимии «именительный падеж – винительный падеж имени существительного». ПК-4, ПК-7 40 Автоматический синтаксический анализ предложения. Основные этапы алгоритма синтаксического анализа. ПК-4, ПК-7 41 Выделение именных групп в структуре предложения. Свойство проективности на уровне синтаксиса. ПК-4, ПК-7 42 Алгоритм выделения простого предложения при автоматической обработке языка. Метод фильтров. ПК-4, ПК-7 43 Автоматический семантический анализ предложения. Основные этапы. ПК-4, ПК-7 44 Семантическая обработка слов, имеющих модель управления. Классификация предикатов и слов без модели управления. ПК-4, ПК-7 45 Структурирование семантического графа. Группы кванторных слов. ПК-4, ПК-7 46 Автоматическая обработка дискурса. Основные проблемы обработки связного текста. Интерпретация текста ПК-4, ПК-7 47 Определение лингвистической взаимосвязи предложений дискурса. Установление соответствия референта и ссылки на него. ПК-4, ПК-7 48 Восстановление эллипсиса при автоматической обработке дискурса. ПК-4, ПК-7 49 Автоматический синтез предложений на естественном языке. Этапы лингвистического синтеза текста. ПК-4, ПК-7 50 Автоматический синтез предложений на естественном языке. Задачи внелингвистического синтеза дискурса. ПК-4, ПК-7 4.2 Методические материалы, определяющие процедуры оценивания знаний, умений, навыков и (или) опыта деятельности, характеризующих этапы формирования компетенций Методические рекомендации, определяющие процедуры оценивания контрольных работ: Оценка «зачтено (отлично)» выставляется, если студент при выполнении упражнений показал высокий уровень знания лексико-грамматического и страноведческого материала по заданной тематике, проявил творческий подход при ответе на вопросы, умение глубоко анализировать проблему и делать обобщающие выводы; выполнил работу грамотно с точки зрения поставленной задачи, т.е. без ошибок и недочетов или допустил не более одного недочета. Оценка «зачтено (хорошо)» выставляется, если студент выполнил работу полностью, но допустил в ней: а) не более одной негрубой ошибки и одного недочета б) или не более двух недочетов. Оценка «зачтено (удовлетворительно)» выставляется, если студент показал достаточные знания по основным темам контрольной работы; выполнил не менее половины работы или допустил в ней: а) не более двух грубых ошибок, б) или не более одной грубой ошибки и одного недочета, в) или не более двух-трех негрубых ошибок, г) или одной негрубой ошибки и трех недочетов, д) или при отсутствии ошибок, но при наличии 4-5 недочетов. Оценка «не зачтено (неудовлетворительно)» выставляется если студент не приступал к выполнению работы или правильно выполнил не более 10 процентов всех заданий. Методические рекомендации, определяющие процедуры оценивания тестов: Это вид самостоятельной работы студента по закреплению изученной информации путем ее дифференциации, конкретизации, сравнения и уточнения в контрольной форме (вопроса, ответа). Студент должен составить как сами тесты, так и эталоны ответов к ним. Тесты могут быть различных уровней сложности, целесообразно предоставлять студенту в этом свободу выбора, главное, чтобы они были в рамках темы. Количество тестов (информационных единиц) можно определить либо давать произвольно. Контроль качества тестов можно вынести на обсуждение ("Кто их больше составил?", "Чьи тесты более точны, более интересны?" и т. д.) непосредственно на практическом занятии. Оценку их качества также целесообразно провести в рамках занятия. Тестирование знаний студентов осуществляется в письменной форме в виде ответов на вопросы по теме лекционных и семинарских занятий. Цель тестирование заключается в более глубоком знакомстве с некоторыми ключевыми вопросами соответствующего раздела изучаемой дисциплины; развитии навыков научного анализа изучаемого материала; развитию общекультурных и профессиональных компетенций курса. Теоретические задания по своему содержанию делятся на задания, предусматривающие:1) знание основных направлений изучения английского языка и тех или иных представителей лингвистических школ; 2) владение определенными лексикографическими концепциями; 3) знание конкретных дефиниций; 4) умение анализировать теоретические положения; 5) владение конкретными классификациями. Практические задания по своему содержанию делятся на задания, предусматривающие: 1) обнаружение среди предлагаемых лексикографических единиц тех, которые обладают названным признаком или свойством; 2) характеристику данной единицы; 3) выбор правильного варианта. |