Рабочая программа дисциплины Информационные технологии в лингвистике Направление подготовки Лингвистика Код 45. 03. 02
Скачать 0.93 Mb.
|
Автономная некоммерческая организация высшего образования «МОСКОВСКИЙ МЕЖДУНАРОДНЫЙ УНИВЕРСИТЕТ» Кафедра естественно-научных дисциплин Рабочая программа дисциплины Информационные технологии в лингвистике Направление подготовки Лингвистика Код 45.03.02 Направленность (профиль) Перевод и переводоведение Квалификация выпускника бакалавр Москва 2020 ДОКУМЕНТ ПОДПИСАН УСИЛЕННОЙ КВАЛИФИЦИРОВАННОЙ ЭЛЕКТРОННОЙ ПОДПИСЬЮ Сертификат 01C0DA760080ABC1BD444508BAA22AE73F Действителен с 16.03.2020 по 16.03.2021 Владелец: Ректор Манюшис Альгирдас Юозо Дата: 2021-03-3 1. Перечень планируемых результатов обучения по дисциплине (модулю), соотнесенных с планируемыми результатами освоения образовательной программы Компетенция Планируемые результаты обучения по дисциплине ОПК-12 способностью работать с различными носителями информации, распределенными базами данных и знаний, с глобальными компьютерными сетями Знать:_-_принципы_работы_с_различными_носителями_информации,_распределенными_базами_данныхУметь'>Знать: - принципы работы с различными носителями информации, распределенными базами данных Уметь: - работать с различными носителями информации, распределенными базами данных Владеть: - способностью работать с различными носителями информации, распределенными базами данных и знаний, с глобальными компьютерными сетями ОПК-13 способностью работать с электронными словарями и другими электронными ресурсами для решения лингвистических задач Знать: - принципы работы с электронными словарями Уметь: - работать с электронными словарями и другими электронными ресурсами для решения лингвистических задач Владеть: -навыками работы с электронными словарями и другими электронными ресурсами ОПК-16 владением стандартными методиками поиска, анализа и обработки материала исследования Знать: - принципы получения, обработки и управления информацией Уметь: - применять навыки работы с компьютером как средством получения, обработки и управления информацией информации, Владеть: - стандартными методиками поиска, анализа и обработки материала исследования ОПК-20 способностью решать стандартные задачи профессиональной деятельности на основе информационной и библиографической культуры с применением информационно- лингвистических технологий и с учетом основных требований информационной безопасности Знать: - принципы получения, обработки и управления информацией Уметь: - применять навыки работы с компьютером как средством получения, обработки и управления информацией информации, Владеть: - навыками работы с компьютером 2. Место дисциплины (модуля) в структуре образовательной программы Дисциплина относится к базовой части учебного плана ОПОП. Дисциплина находится во взаимосвязи с такими дисциплинами, как: «Безопасность жизнедеятельности», «Основы языкознания», «Информационные технологии в переводе». Изучение дисциплины позволит обучающимся реализовывать общепрофессиональные компетенции в профессиональной деятельности. В частности, выпускник, освоивший программу бакалавриата, в соответствии с переводческой деятельностью, должен быть готов решать следующие профессиональные задачи: - обеспечение межкультурного общения в различных профессиональных сферах; - выполнение функций посредника в сфере межкультурной коммуникации; - использование видов, приемов и технологий перевода с учетом характера переводимого текста и условий перевода для достижения максимального коммуникативного эффекта; - проведение информационно-поисковой деятельности, направленной на совершенствование профессиональных умений в области перевода; - составление словников, методических рекомендаций в профессионально ориентированных областях перевода. 3. Объем дисциплины Виды учебной работы Формы обучения Очная Общая трудоемкость: зачетные единицы/часы 2/72 Контактная работа: Занятия лекционного типа 20 Занятия семинарского типа 20 Промежуточная аттестация: Зачет / зачет с оценкой / экзамен / 0,1 Самостоятельная работа (СРС) 31,9 4. Содержание дисциплины (модуля), структурированное по темам / разделам с указанием отведенного на них количества академических часов и видов учебных занятий 4.1. Распределение часов по разделам/темам и видам работы 4.1.1. Очная форма обучения № п/п Раздел/тема Виды учебной работы (в часах) Контактная работа Самостоят ельная работа Занятия лекционного типа Занятия семинарского типа Лекции Иные учебные занятия Практи ческие занятия Семи нары Лабор аторн ые раб. Иные заняти я 1. Основные понятия ИТ в лингвистике 6 3 3 10 2. Области применения информационных технологий в лингвистике. 7 3 3 10 3. Прикладные разделы компьютерной лингвистики 7 4 4 11,9 Промежуточная аттестация 0,1 Итого 72 4.2. Программа дисциплины, структурированная по темам / разделам 4.2.1. Содержание лекционного курса № п/ п Наименование темы (раздела) дисциплины Содержание лекционного занятия 1. Основные понятия ИТ в лингвистике Лингвистика. Язык. Информация. Информационные технологии. Аппаратное и программное обеспечение информационных технологий в лингвистике 2. Области применения информационных технологий в лингвистике. Автоматический анализ и синтез звучащей речи Автоматическое распознавание текста Автоматическое аннотирование и реферирование текста Автоматический анализ и синтез текста 3. Прикладные разделы компьютерной лингвистики Корпусная лингвистика Компьютерная лексикография Компьютерная терминография Машинный перевод Компьютерное обучение языкам Информационно-поисковые системы 4.2.2. Содержание практических занятий № п/ п Наименование темы (раздела) дисциплины Содержание практического занятия 1. Основные понятия ИТ в лингвистике Лингвистика. Язык. Информация. Информационные технологии. 2. Области применения информационных технологий в лингвистике. Автоматический анализ и синтез звучащей речи Автоматическое распознавание текста 3. Прикладные разделы компьютерной лингвистики Корпусная лингвистика Компьютерная лексикография Компьютерная терминография 4.2.3. Содержание лабораторных занятий № п/ п Наименование темы (раздела) дисциплины Содержание лабораторного занятия 1. Основные понятия ИТ в лингвистике Аппаратное и программное обеспечение информационных технологий в лингвистике 2. Области применения информационных технологий в Автоматическое аннотирование и реферирование текста Автоматический анализ и синтез текста 2. информационных технологий в лингвистике ОПК-13 ОПК-16 ОПК-20 тестирование, интерактивное занятие 3. Прикладные разделы компьютерной лингвистики ОПК-12; ОПК-13 ОПК-16 ОПК-20 Опрос, проблемно-аналитическое задание, эссе, контрольная работа 5.2 Типовые контрольные задания или иные материалы, необходимые для оценки знаний, умений, навыков и (или) опыта деятельности в процессе текущего к о нтроля Типовые вопросы 1. Что такое лингвистика? Назовите ее разделы. В каком разделе лингвистика имеет дело с информационными технологиями? 2. Можно ли считать синонимами прикладную и компьютерную лингвистику? Аргументируйте свой ответ. 3. Перечислите основные направления компьютерной лингвистики. Расскажите об одном из направлений. 4. Сравните разные определения языка. Выделите в них ключевые слова. Составьте на основе повторяющихся ключевых слов свое определение языка. 5. Подумайте, с естественным или искусственным языком имеет дело компьютерная лингвистика? 6. Сопоставьте разные определения информации. Какое из определений, на ваш взгляд, лучше всего подходит к лингвистике? 7. Сравните свойства информации, выделяемые в разных источниках. 8. Как соотносятся информация, сообщение и данные? 9. Назовите основные этапы развития информационных технологий. 10. В чем ученые видят будущее информационных технологий? Что вы думаете по этому поводу? 11. Что такое задача и правило? Как эти понятия связаны с алгоритмом? 12. Каковы свойства алгоритмов? 13.Опишите строение компьютера и охарактеризуйте периферийные устройства. 14.Дайте определение системному и прикладному программному обеспечению. Определите понятия операционной системы, утилиты и драйвера. 15.Приведите классификацию прикладных компьютерных программ. Дайте их краткую характеристику и приведите примеры основных видов прикладных компьютерных программ. 16. Охарактеризуйте текстовый процессор и его лингвистические функции. 17. Охарактеризуйте специальные компьютерные программы, разработанные для лингвистических целей. 18.Что такое знак? В чем различие между знаками языка и знаками речи? 19.В каких сферах ограничениями пословного распознавания звучащей речи можно пренебречь? Для каких сфер эти ограничения будут принципиально важными? 20.Какие артикуляционные признаки звуков вам известны? 21. Представители каких профессий должны быть задействованы в создании сложных систем анализа звучащей речи? 22.Охарактеризуйте основные возможности OCR-программ. 23.Каковы перспективы развития OCR-программ? 24. Охарактеризуйте особенности одной из систем автоматического распознавания текста. 25.Опишите этапы составления реферата текста. 26. Какие задачи являются перспективными для систем автоматического реферирования и Британский национальный корпус ( www.natcorp.ox.ac.uk) , Американский национальный корпус ( www.americannationalcorpus.org) , Банк английского языка (Bank of English) ( www.collins.co.uk/Corpus/ Corpus S earch. aspx) Национальный корпус русского языка ( www.ruscorpora.ru) , Национальный корпус русского литературного языка ( www.narusco.ru) , Компьютерный корпус текстов русских газет конца XX века (www. philol.msu.ru/lex/corpus ) Словарь-корпус языка А.С. Грибоедова ( www.inforeg.ru/electron/concord/ concord.htm) Корпус института немецкого языка в Мангейме ( www.ids-mannheim. de/kl/). 6. Составьте глоссарий по теме «Корпусная лингвистика». Используйте для этого рекомендуемые источники литературы и сетевые ресурсы. Включите в глоссарий определения следующих понятий: конкорданс, рандомизация, коллокация, подмассив, парсинг, лемматизация, корпус-менеджер. Темы исследовательских, информационных, творческих проектов Подготовка исследовательских проектов по темам: 1. Лингвистические ресурсы компьютерной лингвистики (lingware). 2. Виды естественных и искусственных языков. 3. «Интеллектуальное распознавание». 4. Системы автоматического реферирования и аннотирования текстов. 5. Системы компьютерного моделирования диалогов. Робот-автоответчик. 6. Составьте глоссарий по теме «Корпусная лингвистика». Используйте для этого рекомендуемые источники литературы и сетевые ресурсы. Включите в глоссарий определения следующих понятий: конкорданс, рандомизация, коллокация, подмассив, парсинг, лемматизация, корпус-менеджер. 7. Особенности электронных переводческих словарей ABBYY Lingvo nMultitran. онлайн- переводчики (Google, Yandex и т.п.)? 8. Связь процесса машинного перевода и дешифровки текстов. 9. Этапы развития МП. Будущее МП. 10. Преимущества и недостатки дистанционного обучения. 11. Виды веб-ресурсов: образовательные порталы, электронные библиотеки, журналы в электронной версии. 12. Обзор сетевых ресурсов по корпусной лингвистике 13. Характеристика ресурсов по компьютерной лингвистике ( www.dialog-21 . ru, www. computer, org) 14. Специальные возможности программы MS Word для лингвистов (проверка правописания, рецензирование, автореферирование, использование шаблонов и т.д.) 15. Правильное использование заимствованных терминов и обозначений (правописание, склонение, спряжение, ударение) компьютерной лингвистики 16. Особенности электронных переводческих словарей Lingvo nMultitran и их отличия от онлайн-переводчиков (Google, Yandex и т.п.) 17. Сравнение программ переводческой памяти (TRADOS, Deja vu и т.п.) 18. Сравнение программ автоматического перевода (ПРОМТ, Сократ и т.п.) 19. Средства обеспечения и поддержки локализации (Multilizer, Passolo и т.п.) 20. Краудсорсинг или модель «Википедии» в переводе 21. Сравнение мультимедийных программ по обучению иностранным языкам (English DeLuxe, «РЕПЕТИТОР English» и т.п.) 22. Технология подкастинга в обучении языкам 23. ВебКвесты в обучении языкам 24. Возможности электронного письма в обучении языкам 25. Сетевые формы коммуникации (электронная почта, чаты, форумы) и их влияние на язык 26. Ресурсы Всемирной паутины для обучения языкам 27. Сравнительный анализ составления поисковых запросов в популярных русскоязычных поисковых системах {Google, Yandex, Rambler, Mail.ru, AltaVista, Yahoo, MSN, AOL) Типовые задания к интерактивным занятиям Задания выполняются на компьютере. 1. Какому языку соответствует средняя длина слов текста смешанного типа, приведенного в задании 1? Для выполнения задания вычислите среднюю длину слов русского языка из приведенного текста и среднюю длину слов в латинской графике. 2. Определите, каким языкам соответствуют следующие специфические буквы, буквосочетания и слова: 3. Создайте диагностический словарь для определения языка на материале текстов на двух разных языках (на ваш выбор). Для этого заполните следующую таблицу. Таблица Критерий Язык 1: Язык 2: Типичные артикли Указательные местоимения Местоимения 3-го лица Отдельные формы вспомогательных Основные предлоги и союзы Другие частотные слова 4. Дополните таблицу встречаемости букв в распространенных европейских языках [Всеволодова 2007: 64], добавив в нее данные по русскому языку. Используйте для этого любой текст на русском языке объемом не менее 100 символов. 5. Прочитайте несколько фраз на эсперанто. Назовите морфологические диагностические показатели этого языка, учитывая, что существительные и прилагательные на эсперанто всегда имеют одни и те же окончания. Рус. Эсперанто зеленое дерево verda arbo старый человек maljuna viro хороший друг bela amiko 6.Найдите лишнее в приведенном ниже списке. Решите данную задачу с точки зрения компьютерной семантики и компьютерной грамматики. Ландыш, левкой, лаватера, лютик, люпин, ромашка, липа. 7. Перейдите по ссылке http :// rssradio . ru . Протестируйте различные возможности автоматического озвучивания новостей российских интернет-порталов. Насколько полезной вы считаете функцию автоматического озвучивания новостей? 8. Перейдите по ссылке http :// mp 3 book 2005. ru /3. htm Прослушайте примеры аудиозаписей книг, предлагаемые на сайте. Оцените возможности использования программы. 9. Определите исходную форму выделенных словоформ в примере ниже. Какие виды омонимии иллюстрирует данный текст? Я траву косил косой, Дождик вдруг пошел косой. Бросил я тогда косить И на Стешу стал косить. Ну а Стеша, ох, краса, Какогонъ её коса! ( www . stihi . ru /2011/06/03/8515) 10. Выберите текст одного из СМИ на иностранном языке объемом до 1 страницы и составьте список слов для словаря словоформ. Укажите частотность появления каждой словоформы в проанализированном тексте. 11. Опишите через элементарные семантические смыслы «сам», «кто-то», «иметь», «заставлять», «переставать», «начинать» и «не» слова русского языка: приобретать, утрачивать, сохранять, лишать. 12. Сравните результаты перевода текстов разной функциональной принадлежности (темы), выполненного в онлайн-переводчике www . translate . ru Для этого наберите или скопируйте предлагаемые ниже фрагменты текстов в окно ввода, выберите в верхнем меню соответствующую тему, языки перевода (английский —> русский) и нажмите «Перевести». Прокомментируйте, какие недостатки содержит результат перевода, внеся ваши комментарии в таблицу. 1) Техника: Компьютеры Despite big changes in technology over the past couple of decades, IT departments and the duties of their staff have stayed pretty consistent. The classic model involves helpdesk agents, desktop support staff, systems and network administrators, DBAs and developers, and managers at various levels reporting to a CIO or technology director. (Faas R. How Mobile, В YOD and Younger Workers Are Reinventing IT //PC World. 24.02.2012. www.pcworld.com) 2) Бизнес In the early days of starting a business, you might be tempted to gloss over ownership structure, equity stakes, and other seemingly boring details. After all, you might think, as long as you keep taxes low, paperwork uncomplicated, and partners motivated, better to deal with the big stuff first. But these decisions can have a significant cost down the road, particularly for entrepreneurs who seek outside investors. (Mehta M. Structuring a Business with Investors in Mind // BusinessWeek. 22.02.2012. www.businessweek.com) 3) Прочее: Здоровье Data from more than 250,000 men and women in 18 cohort studies were used to calculate the lifetime risk of cardiovascular events, stratified according to risk-factor burden, with adjustment for the competing risk of death from noncardiovascular causes. (Berry J.D. et al. Lifetime Risks of Cardiovascular Disease // The New England Journal of Medicine. 26.01.2012 www.nejm.org) |
3.
Прикладные разделы компьютерной лингвистики
Корпусная лингвистика
Компьютерная лексикография
Компьютерная терминография
4.2.4. Содержание самостоятельной работы
№ п/
п
Наименование темы
(раздела) дисциплины
Содержание самостоятельной работы
1.
Основные понятия ИТ в лингвистике
Лингвистика. Язык.
Информация. Информационные технологии.
Аппаратное и
программное обеспечение информационных технологий в лингвистике
2.
Области применения информационных технологий в лингвистике.
Автоматический анализ и синтез звучащей речи
Автоматическое распознавание текста
Автоматическое аннотирование и реферирование текста
Автоматический анализ и синтез текста
3.
Прикладные разделы компьютерной лингвистики
Корпусная лингвистика
Компьютерная лексикография
Компьютерная терминография
Машинный перевод
Компьютерное обучение языкам
Информационно-поисковые системы
5. Фонд оценочных средств для проведения промежуточной аттестации
обучающихся по дисциплине (модулю)
Предусмотрены следующие виды контроля качества освоения конкретной дисциплины:
- текущий контроль успеваемости
- промежуточная аттестация обучающихся по дисциплине
Фонд оценочных средств для проведения промежуточной аттестации обучающихся по дисциплине оформлен в ПРИЛОЖЕНИИ к РАБОЧЕЙ ПРОГРАММЕ ДИСЦИПЛИНЫ
Текущий контроль успеваемости обеспечивает оценивание хода освоения дисциплины в процессе обучения.
5.1 Паспорт фонда оценочных средств для проведения текущей аттестации по дисциплине (модулю)
№
п/п
Контролируемые
разделы (темы)
Код
контроли
руемой
компетенц
ии
Наименование оценочного средства
1.
Основные понятия
ИТ в лингвистике
ОПК-12;
ОПК-13
ОПК-16
ОПК-20
Опрос, проблемно-аналитическое задание
Области применения ОПК-12;
Опрос, проблемно-аналитическое задание,
Типовые проблемно-аналитические задания
1. Определите статистические показатели приведенного ниже текста смешанного языкового типа.
Проекты Cibola/Oleada реализуют обширные компьютерные системы лингвистического анализа текстов, представленных в Unicode. Компоненты системы включают средства работы с мультиязыковыми текстами (MUTT), построения конкорданса (XConcord) для текстов на более чем 16 языках, статистического анализа, автоматического перевода,
различные словари и тезаурусы. Некоторые версии этих компонентов доступны для бесплатной загрузки после процедуры формальной регистрации. Все компоненты реализованы в среде XII Window System для SunOs и Solaris (источник: Проекты
Cibola/Oleada
http
://
rvb
. ru
/ soft
/ catalogue
/ c 01.
html
).
Слов
Символов (без пробелов)
Символов (с пробелами)
Символов в латинской графике
Чисел
Средняя длина слов
2. Определите машинные основы следующих слов:
Слово
Машинная
основа
Слово
Машинная
основа
семья
окружать
весна
сидеть
дело
друг
пианино
ты
стремительн
ый
желтый
развивать
петь
3. Приведите примеры совпадения машинных основ для слов русского языка и запишите их ниже:
основе лож# соответствуют типовые парадигмы для описания слов ложь и
ложиться;
_________________________________________;
_________________________________________.
4. Определите, какие фразы во фрагменте диалога ниже — собеседника А или Б —
смоделированы машиной. Приведите аргументы в пользу вашего выбора.
А Говорите!
Б Меня волнует погода.
А Как давно вас волнует погода?
Б С тех пор, как умерла моя мать.
А Расскажите больше о Вашей семье.
Б Они все в области компьютеров.
А Машины пугают вас.
Б Нет.
5. Выберите один из корпусов из списка ниже и охарактеризуйте его по следующим критериям: количество словоупотреблений, вид корпуса (по разным признакам).