БД. Решение прикладных задач. Это связано с появлением таких вещей в современном мире как информационные запросы общества
Скачать 17.75 Kb.
|
ИНФОРМАТИКА ДЛЯ ГУМАНИТАРИЕВ БАЗЫ ДАННЫХ В РАБОТЕ ЛИНГВИСТА Современная лингвистика обладает направленностью множества исследований на решение прикладных задач. Это связано с появлением таких вещей в современном мире как: информационные запросы общества; решение проблем коммуникативного взаимодействия; разработка информационных и телекоммуникационных новых технологий. Информация приобретает статус ресурса на первых этапах развития информационного общества, и, следовательно, неизбежно влечет за собой необходимость хранения больших объемов информации, что, в свою очередь, приводит к возникновению новой проблемы, связанной с ее организацией, структуризацией и систематизацией. При разработке любого достаточно крупного современного программного продукта используются технологии баз данных (в дальнейшем - БД), позволяющих решать эту проблему с применением компьютерных технологий. Сама по себе БД — это лишь совокупность материалов, представленная в систематизированной форме. На современном этапе развития лингвистической науки БД представляются незаменимым инструментом систематизации и структурирования трудно формализуемой информации о языке. Исследователи кратко и точно обозначили особенности лингвистической информации, представленной в лингвистических БД: 1) неточный характер информации, обусловленный вариативностью и подвижностью границ языковой нормы, статистическим характером отдельных видов информации, сложностью процесса формализации описываемых языком явлений на семантическом уровне; 2) неполнота информации, обусловленная открытостью и постоянным развитием естественного языка, а также наличия языковых особенностей отдельных носителей; 3) наличие ошибочной информации ввиду её устаревания, ошибок ручного ввода, несогласованность работы экспертов из-за ошибок автоматизированного формирования. Технология создания БД используется при создании как традиционных, так и современных электронных словарей. В настоящее время также активно разрабатываются словарные БД специальной и терминологической лексики. В России разработка теоретических основ создания баз данных впервые была осуществлена в рамках создания информационно-поисковых систем для информационно-библиографического поиска. В современной лингвистике компьютерное представление информации на основе технологии БД используется в самых разных областях, например: в типологических и сравнительных, фонетических, лексических, грамматических исследованиях; лексикографии; семантических исследованиях, включая составление тезаурусов - словарь, стремящийся дать описание лексики данного языка во всём её объёме и полноте; в компьютерной лингвистике для решения прикладных лингвистических задач (лингводидактических, автоматизированного перевода, автоматического распознавания и синтеза речи). Несмотря на активные и результативные исследования и разработки, работа в создании БД, к сожалению, далека от совершенства. Это связано с тем, что язык сам по себе принципиально безграничен и многомерен в силу ряда специфических свойств: элементы языковой системы неоднородны и количественно необозримы; языковые структуры конструктивны, то есть множество порождаемых высказываний потенциально бесконечно; языковой знак динамичен, то есть в процессе функционирования происходит трансформация его формальной и содержательной сторон; языковые структуры связаны с умственными процессами, поэтому семантика достаточно сложно формализуется. Каждое из этих свойств показывает, с одной стороны, неограниченный информационный потенциал языковой системы, а с другой – что информация необычайно сложно структурируется даже на уровне отдельных языковых элементов. Можно описать теоретические и прикладные перспективы использования БД в лингвистике. Теоретические перспективы видятся в использовании технологии БД в лингвистических, а в частности лингвокогнитивных исследованиях. Применение этой технологии в данной сфере связано с изучением концептуальности действительности. В данном случае на первый план выступают принципы представления информации в БД, принципы, лежащие в основе когнитивного моделирования данных. БД, ориентированные на описание лексической семантики, позволяют получать данные о способах осмысления действительности в том или ином языке, использующиеся в системах текстового анализа и машинного перевода, а также в лингводидактике – общей теории обучения языкам, основанной на лингвистических данных и законах обучения, дидактики. Следует добавить, что современные системы управления БД дополнены возможностями интеграции мультимедийных объектов. Это означает, что появилась возможность включить в БД данные другого типа: аудио- или видеоматериалы, показывающие тип звучания, его субъект и действие, с ним связанное. |