ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ЛИНГВИСТИКЕ. практические зад. Информационные технологии в лингвистике
Скачать 21.82 Kb.
|
ВЫПОЛНЕНИЕ ПРАКТИЧЕСКИХ ЗАДАНИЙ ПО ДИСЦИПЛИНЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ЛИНГВИСТИКЕГруппа Го20Л171 Студент Лаута М. А. МОСКВА 2021 Практическое занятие к теме 1 «Основные понятия ИТ в лингвистике» Задание №1.
Практическое занятие 2 по теме 2 «Области применения информационных технологий в лингвистике» Задание 1.
Практическое занятие 3 теме 3 «Прикладные разделы компьютерной лингвистики» Задание 1. Глоссарий по теме «Корпусная лингвистика». Конкорданс – это список всех употреблений заданного языкового выражения (например, слова) в контексте, возможно, со ссылками на источник. В этом значении данный термин широко используется в корпусной лингвистике. Рандомизация - Статистический прием, при котором решение принимается случайным образом. Коллокация - в корпусной лингвистике под коллокацией понимается последовательность слов или терминов, частотность совместного появления которых в корпусе выше, чем ожидаемая вероятность их совместного появления. Примерами коллокаций являются: средний класс, кристально честный, пластическая операция и т. п. Подмассив - это любая последовательность чисел в массиве (непрырывная) Парсинг – это синтаксический анализ, который автоматически производится парсером – специальной программой или скриптом. Характер парсинга определяется заданием получить определенную информацию со страниц сайта, параметры анализа заранее задаются. Собранная информация предоставляется в определенном виде и проводится на одном из языков программирования. Лемматизация- процесс привода словоформы к лемме — её нормальной (словарной) форме Примеры кошками → кошка бежал → бежать боязненных → боязненный корпус-менеджер - конкорданс и корпус менеджер - это программное обеспечение для корпуса, конкорданс - проще, потому что подсчитывает только частоту слова, морфемы, символа, а корпус-менеджер - намного сложнее, потому что подсчитывает конкретные словоформы, группы словосочетаний. . и также может выводить результаты статистики, представить в виде диаграммы.. |