Компьютерная лингвистика. Программа дисциплины Компьютерная лингвистика
Скачать 0.55 Mb.
|
Показатели, критерии и шкала оценки сформированных компетенций Код и наименование компетенций Соответствие уровней освоения компетенции планируемым результатам обучения и критериям их оценивания пороговый базовый продвинутый оценка Удовлетворительно/ зачтено Хорошо/ зачтено Отлично/ зачтено ПК-4 владением основными методами создания и работы с информацион- ными базами данных, в том числе лингвистически- ориентирован- ными Имеет общее представление об основных направлениях и задачах компью- терной лингвистики; Знает в целом об основных понятиях и категориях современной лингвистики Знает в полном объеме основные ме- тоды, способы и сред- ства получения, хранения, перера- ботки информации; основные принципы и методы компью- терного моде- лирования лингвистических задач Умеет частично анализировать работу различных систем обработки текста, для выявления основных лингвистических компонентов и основных типов обработки текста, используемых в данных системах; Умеет в целом подбирать необходимые лингвистические ресурсы для различных задач лингвистического обеспечения систем; строить простейший конечный автомат для моделирования морфонологических явлений при автоматическом морфологическом анализе; Умеет на достаточно высоком уровне использовать язык регулярных выражений для простейших задач обработки текста; работать с информацией в глобальных компьютерных сетях; использовать методы лингвистического анализа применительно к предмету исследования компьютерной лингвистики Владеет в общих чертах умениями работы с ком- пьютером как средством управления информацией Владеет в целом умениями необходимыми формальными методами моделирования задач лингвистического анализа Владеет свободно и на высоком уровне основными методами, способами и средствами получения, хранения, переработки ин- формации ПК-7 владением основными мето- дами фоноло- гического, морфологиче- ского, синтак- сического, дискурсивного и семантического анализа с учетом языковых и экстралингви- стических факто- ров Имеет общее представление об особенностях применения методов лингвистического анализа при- менительно к компьютерной лингвистике как предмету анализа Знает в целом особенности применения методов лингвистического анализа при- менительно к компьютерной лингвистике как предмету анализа Знает в полном объемеособенности применения методов лингвистического анализа при- менительно к компьютерной лингвистике как предмету анализа Умеет частично использовать методы лингвистического анализа Умеет в целом использовать методы лингвистического анализа Умеет на достаточно высоком профессиональном уровне использовать применительно к предмету иссле- дования компьютерной лингвистики применительно к предмету иссле- дования компьютерной лингвистики методы лингвисти- ческого анализа применительно к предмету иссле- дования компьютерной лингвистики Владеет в общих чертах умениями применять методы лингвистического анализа для изучения лингвистической системы английского языка с учетом языковых и экстралингвистиче- ских факторов Владеет в целом умениями применять методы лингвисти- ческого анализа для изучения лингвистической системы английского языка с учетом языковых и экстралингвистиче- ских факторов Владеет свободно и на высоком уровне умениями применять методы лингвисти- ческого анализа для изучения лингвистической системы английского языка с учетом языковых и экстралингвистиче- ских факторов Типовые контрольные задания или иные материалы, необходимые для оценки знаний, умений, навыков и (или) опыта деятельности, характеризующих этапы формирования компетенций в процессе освоения образовательной программы 1) Тест В каждом задании — 1 правильный ответ, за каждый правильный ответ дается 1 балл 1. Какое из высказываний является определением прикладной лингвистики? a) область языкознания, направленная на объективное установление состояния отдельного языка, его истории и закономерностей; b) область языкознания, связанная с использованием компьютерных инструментов — про- грамм, технологий организации и обработки данных — для моделирования функциониро- вания языка в тех или иных условиях; c) область языкознания, связанная с разработкой методов решения практических задач ис- пользования языка; d) область языкознания, связанная с применением компьютерных моделей языка в лингви- стике и в смежных с ней дисциплинах. 2. К направлениям компьютерной лингвистики не относится a) компьютерная лексикография; b) компьютерно-опосредованная коммуникация; c) системы обработки естественного языка; d) машинный перевод. 3. Информатика — это a) наука об управлении, связи и переработке информации; b) наука о накоплении, обработке и передаче информации с помощью ЭВМ; c) наука о накоплении, обработке и передаче информации о строении языка с помощью ЭВМ; d) наука об использовании компьютерных инструментов для моделирования функционирования языка в тех или иных условиях. 4. Разное количество информации в одном и том же сообщении для разных людей зависит не от... a) накопленных ими знаний; b) уровня понимания сообщения; c) их интереса к сообщению; d) их уровня владения компьютерной техникой. 5. Следствие третьей информационной революции состоит в том, что... a) информация становится общедоступной; b) информацию можно автоматически обрабатывать и передавать с большой скоростью; c) информацию можно легко найти с помощью инструментов поиска и совместно производить; d) информация может накапливаться. 6. Для современного человека преобладающей является... a) звуковая информация; b) визуальная (символьная) информация; c) вкусовая и тактильная информация; d) визуальная (образная) информация. 7. Адекватность информации — это ... a) степень соответствия информации объективной реальности окружающего мира; b) степень соответствия информации, полученной потребителем, тому, что автор вложил в ее содержание; c) достаточность информации для принятия решения; d) степень соответствия информации текущему моменту времени. 8.Машинный синтаксис — это ... a) правила строения имен; b) правила построения слов в более сложные структуры; c) соотношение слова и его значения; d) правила перевода письменного символа в устный. 9.Естественный язык — это ... a) знаковая система, используемая человеком с момента рождения; b) знаковая система, используемая человеком в непринужденной обстановке; c) знаковая система, созданная для естественных наук; d) знаковая система, стихийно возникшая и закрепившаяся в обществе. 10. Волапюк — это... a) специализированный язык науки; b) родной язык одного из малочисленных племен; c) неспециализированный искусственный язык; d) система символического кодирования. 11. Какие из следующих приложений не являются текстовыми редакторами? a) MS Excel; b) Corel WordPerfect; c) MS Works; d) Adobe InCopy. 12. Microsoft Word не включает... a) функции настольных издательских систем; b) функцию удалённого доступа; c) функцию редактирования графических объектов; d) шаблоны типовых таблиц. 13. К устройствам ввода данных не относится a) сканер; b) принтер; c) клавиатура; d) цифровой фотоаппарат. 14. OCR —это ... a) система автоматического распознавания символов; b) система переводческой памяти; c) система машинного перевода; d) функция текстового процессора. 15. Реферат — это... a) связный текст, который кратко выражает тему, предмет, цель, методы и результаты исследования; b) процесс составления содержания документа (книги, статьи, патента на изобретение и др.); c) краткое изложение содержания документа, дающее общее представление о его теме; d) краткий текст, выполняющий сигнальную функцию (информирует о том, что есть публикация на определенную тему). 16. Слово, относящееся к основному содержанию текста и повторяющееся в нем несколько раз, в автоматическом реферировании называется ... a) лейтмотивом; b) термином; c) символом; d) ключевым словом. 17. Метод автоматического аннотирования, при котором важные слова выделяются в заголовке, подзаголовке, начале и конце текста, называется ... a) статистическим; b) логико-семантическим; c) позиционным; d) функциональным. 18. Совокупность специально отобранных текстов, размеченных по различным лингвистическим параметрам и обеспеченных системой поиска, называется ... a) базой данных; b) словарем; c) информационным массивом; d) корпусом. 19. Разметка бывает ... a) морфологической; синтаксической; семантической и просодической; b) полнотекстовой и фрагментной; c) синхронической и диахронической; d) звуковой, письменной, смешанной. 20. УНК —это... a) корпус естественного языка, представительный по отношению ко всему языку; b) универсальный национальный код; c) собрание текстов, которое существует в Интернете; d) собрание текстов, размеченных по различным лингвистическим пара метрам и обеспеченных системой поиска. 21. Требования к корпусам a) полнота, адекватность, актуальность, компьютерная поддержка; b) устойчивость, тиражируемость, адаптируемость, оптимальность временных параметров, комфорт пользователя; c) репрезентативность, полнота, экономичность, структуризация, компьютерная поддержка; d) полнота, экономичность, достоверность, структуризация, компьютерная поддержка. 22. Корпусный менеджер ... a) обеспечивает сортировку результатов поиска, статистические подсчеты, составление списков слов на основе корпуса; b) это специальная программа поиска по корпусу; c) это человек, составляющий корпуса и управляющий ими; d) это специальная программа подготовки текстов к их включению в корпус. 23. ПОД —это ... a) вид информационно-поисковой системы; b) специальная программа поиска по корпусу; c) поисковый образ документа; d) поисковая оценка данных. 24. Одна из основных проблем компьютерного анализа речи состоит в том, что ... a) невозможно создать искусственный интеллект; b) компьютер не умеет работать со смыслом; c) у компьютера нет дополнительных источников информации (ситуация, контекст, прошлый опыт в данной области и т.п.); d) разработчики не желают делиться своими профессиональными секретами. 25. Электронный словарь — это ... a) введенный в компьютер бумажный словарь, снабженный средствами поиска и отображения информации; b) организованное собрание слов с комментариями, в которых описываются особенности структуры и/или функционирования этих слов; c) организованное собрание слов с описанием их значения, особенностей употребления, структурных свойств, сочетаемости, соотношения с лексическими системами других языков и т.д.; d) словарь в специальном машинном формате, предназначенный для применения на ЭВМ пользователем или компьютерной программой. 26. К зонам словарной статьи не относится a) лексический вход (вокабула, лемма); b) зона грамматической информации; c) зона стилистических помет; d) словник. 27. Что включает в себя понятие АСПОТ? a) словарь в специальном машинном формате, предназначенный для применения на ЭВМ пользователем; b) компьютерные версии хорошо известных словарей (Вебстер, Коллинз, Ожегов...); c) словарь в специальном машинном формате, предназначенный для применения на ЭВМ компьютерной программой; d) словари, предназначенные для обычного пользователя. 28. Что не относится к понятию термина? a) слово (словосочетание) метаязыка науки, а также областей конкретной практической деятельности человека; b) понятие задается через свойства, реализуемые в системе; c) использование основывается не на интуиции, а на четких определениях; d) сопоставляется, как правило, несколько значений. 29. Что не относится к процессу и понятию машинного перевода? a) междисциплинарность; b) использование машинных средств; c) принципиальное сходство этапов понимания и синтеза текста; d) учет языковых и экстралингвистических знаний. 30. Типовая парадигма лексемы в автоматическом морфологическом анализе — это ... а) последовательность букв от начала словоформы, общая для всех словоформ; b) элементы, описывающие формоизменение конкретной лексемы, c) совокупность наборов машинных окончаний; d) совпадение основ разных слов. 31. Требования к системам МП включают ... a) устойчивость, тиражируемость, адаптируемость, оптимальность временных параметров, комфорт пользователя; b) полнота, адекватность, актуальность, достоверность; c) репрезентативность, полнота, экономичность, адекватность, компьютерная поддержка; d) репрезентативность, полнота, экономичность, структуризация, компьютерная поддержка. 32. Аббревиатура CALL относится к ... a) науке об использовании компьютерных инструментов для моделирования функционирования языка в тех или иных условиях; b) обучению иностранному языку; c) обучению языку с помощью компьютера; d) использованию компьютеров в обучении. 33. Сущность когнитивно-интеллектуального подхода в компьютерном обучении состоит в том, что ... a) программы ориентированы на обучающегося, дают свободу выбора уровня и типа действий; b) программы построены по формуле стимул — реакция; c) обучающемуся отводится роль объекта обучения; d) в нем используются программы-тренажеры обучению языку с помощью компьютера. 34. К обучающим программным средствам не относятся ... a) тестирующие программы; b) энциклопедии; c) программы-ассемблеры; d) учебные игры. 3 5. Компьютерный учебник — это ... а) программа, предлагающая пользователю вопрос и несколько вариантов ответов на него; b) программа формирования автоматического навыка выполнения определенных коммуникативных действий путем многочисленных повторов; c) программы, предназначенные для представления учебного материала; d) программно-методический комплекс, позволяющий самостоятельно освоить учебный курс или его большой раздел. 36. Что не относится к компьютерным обучающим программам? a) заменяют преподавателя; b) организация и выполнение рутинной работы; c) повышение активности обучаемого; d) создание возможностей для самообразования. Перечень части компетенций, проверяемых оценочным средством: ПК-4: знание основных направлений и задач компьютерной лингвистики; основных ме- тодов, способов и средств получения, хранения, переработки информации; основных принципов и методов компьютерного моделирования лингвистических задач; основных понятия и категории современной лингвистики; умение анализировать работу различных систем обработки текста, для выявления основных лингвистических компонентов и основных типов обработки текста, используемых в данных системах; владение умениями работы с компьютером как средством управления информацией, необходимыми формальными методами моделирования задач лингвистического анализа; основными методами, способами и средствами получения, хранения, переработки информации ПК-7: знание особенностей применения методов лингвистического анализа применительно к компьютерной лингвистике как предмету анализа, умение использовать методы лингвистического анализа применительно к предмету исследования компьютерной лингвистики, владение умениями применять методы лингвистического анализа для изучения лингвистической системы английского языка с учетом языковых и экстралингвистических факторов. 2) Контрольная работа 1. Определите статистические показатели приведенного ниже текста смешанного языкового типа. Проекты Cibola/Oleada реализуют обширные компьютерные системы лингвистического анализа текстов, представленных в Unicode. Компоненты системы включают средства работы с мультиязыковыми текстами (MUTT), построения конкорданса (XConcord) для текстов на более чем 16 языках, статистического анализа, автоматического перевода, различные словари и тезаурусы. Некоторые версии этих компонентов доступны для бесплатной загрузки после процедуры формальной регистрации. Все компоненты реализованы в среде XI I Window System для SunOs и Solaris (источник: Проекты Cibola/Oleada http://rvb.ru/soft/catalogue/c01.htm Слов Символов (без пробелов) Символов (с пробелами) Символов в латинской графике Чисел Средняя длина слов 2. Какому языку соответствует средняя длина слов текста смешанного типа, приведенного в задании 1? Для выполнения задания вычислите среднюю длину слов русского языка из приведенного текста и среднюю длину слов в латинской графике. 3. Определите, каким языкам соответствуют следующие специфические буквы, буквосочетания и слова: а) 0 б В р со ёis, б) th sch sc. в) et, the, der, och, icin. 4. Создайте диагностический словарь для определения языка на материале текстов на двух разных языках (на ваш выбор). Для этого заполните следующую таблицу: Критерий Язык 1: Язык 2: Типичные артикли Указательные местоимения Местоимения 3-го лица Отдельные формы вспомогательных глаголов Основные предлоги и союзы Другие частотные слова 5. Дополните таблицу встречаемости букв в распространенных европейских языках добавив в нее данные по русскому языку. Используйте для этого любой текст на русском языке объемом не менее 100 символов. 6. Прочитайте несколько фраз на эсперанто. Назовите морфологические диагностические показатели этого языка, учитывая, что существительные прилагательные на эсперанто всегда имеют одни и те же окончания. Рус. Эсперанто зеленое дерево verda arbo старый человек maljuna viro хороший друг bela amiko 7. Найдите лишнее в приведенном ниже списке. Решите данную задачу с точки зрения компьютерной семантики и компьютерной грамматики. Ландыш, левкой, лаватера, лютик, люпин, ромашка, липа. 8. Определите, к какому виду прикладных программ относятся перечисленные ниже программные продукты. 1) Текстовые редакторы 2) Графические редакторы 3) Электронные таблицы 4) Веб-редакторы 5) Веб-браузеры Opera, MS Excel, MS FrontPage, Adobe Photoshop, Corel WordPerfect Перечень части компетенций, проверяемых оценочным средством: ПК-4: знание основных направлений и задач компьютерной лингвистики; основных ме- тодов, способов и средств получения, хранения, переработки информации; основных принципов и методов компьютерного моделирования лингвистических задач; основных понятия и категории современной лингвистики; умение анализировать работу различных систем обработки текста, для выявления основных лингвистических компонентов и основных типов обработки текста, используемых в данных системах; владение умениями работы с компьютером как средством управления информацией, необходимыми формальными методами моделирования задач лингвистического анализа; основными методами, способами и средствами получения, хранения, переработки информации ПК-7: знание особенностей применения методов лингвистического анализа применительно к компьютерной лингвистике как предмету анализа, умение использовать методы лингвистического анализа применительно к предмету исследования компьютерной лингвистики, владение умениями применять методы лингвистического анализа для изучения лингвистической системы английского языка с учетом языковых и экстралингвистических факторов. |