Лабораторная 5. лаб5. 1. Корпус текстов
Скачать 15.84 Kb.
|
Задание 1 1. Корпус текстов - это вид корпуса данных, единицами которого являются тексты или их достаточно значительные фрагменты, включающие, например, какие-то полные фрагменты макроструктуры текстов данной проблемной области. 2. а) Исследовательские корпусы создаются с целью изучения различных аспектов функционирования языка. Этот тип корпусов ориентирован на широкий класс лингвистических задач. Неспецифицированность задачи требует при построении исследовательских корпусов использовать пропорциональное сужение, являющееся наиболее простым способом обеспечения репрезентативности. Как правило, такие корпусы текстов содержат от нескольких десятков миллионов до сотен миллионов словоупотреблений. б) Статические корпусы содержат тексты какого-то небольшого временнóго промежутка. Типичными представителями этого вида корпусов являются авторские корпусы – коллекции текстов писателей. в) Параллельные корпусы можно разделить на два основных типа: 1) корпусы, представляющие множество текстов-оригиналов, написанных на каком-либо исходном языке, и текстов-переводов этих исходных текстов на один или несколько других языков; 2) корпусы, объединяющие тексты из одной и той же тематической области, независимо написанные на двух или нескольких языках Задание 2
Задание 3
Тема: “Компьютерная лексикография” Задание 1
Задание 2
Задание 3
|