Главная страница

эссе Институт Пушкина. Фаизова_эссе. Корпусная лингвистика вчера, сегодня, завтра. Какие перспективы есть у корпусной лингвистики


Скачать 12.77 Kb.
НазваниеКорпусная лингвистика вчера, сегодня, завтра. Какие перспективы есть у корпусной лингвистики
Анкорэссе Институт Пушкина
Дата20.04.2023
Размер12.77 Kb.
Формат файлаdocx
Имя файлаФаизова_эссе.docx
ТипДокументы
#1077604

Корпусная лингвистика: вчера, сегодня, завтра.

Какие перспективы есть у корпусной лингвистики?»

Как работал лингвист раньше? В докорпусную, докомпьютерную эпоху? Это почти синонимы. Появление корпуса, появление Интернета, появление персональных компьютеров – это почти одновременное событие.

Поскольку основной наш объект – это тексты, никаким другим образом изучать язык мы не можем. Так вот, если я намерена изучить, например, прошедшее время, я должна найти как можно больше текстов, где есть как можно больше примеров прошедшего времени, и их проанализировать. Как это делали лингвисты в докорпусную эпоху? Открывали книгу, находили, прочитывали, находили форму, выписывали ее, одну, другую, третью, сотую, на это уходило много дней, недель, месяцев. Иногда даже лет, иногда можно было услышать рассказ о таких подвижниках от науки, о человеке, который всю жизнь что-то откуда-то выписывал – и ему был почет, уважение коллег. Даже если он ничего потом с этим не сделал, он уже оставил человечеству много сотен карточек, на которых было его рукой что-то написано.

В корпусе такая задача решается за секунды, если он у нас, конечно, правильно размечен. Например, формы прошедшего времени, если придерживаться этого примера, в действительно существующих корпусах. За секунды можно найти десятки, сотни, тысячи, десятки тысяч примеров, настолько много, что даже не очень понятно исследователям становится, что же делать с таким богатством. То есть для традиционных задач лингвисты получили в свое распоряжение очень мощный современный инструмент, типа передвижения на самолете по сравнению с передвижением пешком.


написать администратору сайта