Главная страница
Навигация по странице:

  • Практическое задание № 9

  • Практическая работа Задание Знакомство с работой программы Wordstat


    Скачать 405.52 Kb.
    НазваниеПрактическая работа Задание Знакомство с работой программы Wordstat
    Дата05.01.2022
    Размер405.52 Kb.
    Формат файлаdocx
    Имя файла8-10.docx
    ТипПрактическая работа
    #324648
    страница3 из 4
    1   2   3   4

    Практическое задание № 8
    Лингвистические информационные ресурсы.

    Корпусная лингвистика

    Задание 1 - Откройте веб-страницу Русского национального корпуса (РНК) (www.ruscorpora.ru), Корпуса русского литературного языка (КРЛЯ) (https://narusco.ru/) и Британского национального корпуса (БНК) (www.natcorp.ox.ac.uk).

    Введите в строку поиска этих корпусов слово русский /Russian. Заполните таблицу.





    РНК

    КРЛЯ

    БНК

    Количество вхождений

    35 146 вхождений.

    94

    13 456



    Как вы можете прокомментировать полученные результаты?

    Русский национальный корпус (РНК) по введенному в строку поиска слова русский нашел наибольшее количество вхождений (35146), а Корпус русского литературного языка (КРЛЯ) нашел наименьшее количество вхождений для этого же слова – 94. Поиск слова в литературном аспекте сузил количество вхождений, в то время как национальный язык отобразил гораздо большее количество вхождений, а, значит, он гораздо более объемный.
    Задание 2. - Выпишите 3 любых контекста использования слова русский / Russian в трех рассмотренных корпусах.

    Укажите источник каждого примера

    № примера

    РНК

    КРЛЯ

    БНК

    1.

    С каждым годом набирает обороты специальность «Русский язык как иностранный» (РКИ). [коллективный. Форум: Были вы в стране преподаваемого языка? (2008-2011)]

    Не открывает контексты, выдает ошибку.

    Russian history. Here you will find all the resources identified by our tutors as useful for the study of this topic, arranged in ascending alphabetical order. ...

    https://open.conted.ox.ac.uk/keywords/russian-history

    2.

    Я не люблю русский рок, но эта одна из тех 5-6 групп, которые я слушаю [Переписка в icq между agd-ardin и Колючий друг (2008.02.08)]




    News and Events. People. Research. Visitors. MPhil in Russian and East European Studies. ... Core Course 3. Contemporary Russian and East European Studies Part 2 - Sociology and Economics.

    https://www.rees.ox.ac.uk/mphil-russian-and-east-european-studies

    3

    ― Да выучил я, ― бормочет он. Я не сдаюсь: ― А русский сделал? Мне учительница сказала, что она тебе двойку в четверти поставит: ты делаешь по три ошибки в слове! [Елена Павлова. Вместе мы эту пропасть одолеем! // «Даша», 2004]




    How to learn Russian at the Language Centre including pathways, timetables and fees.

    https://www.lang.ox.ac.uk/russian


    Задание 3. - Сравните морфологические характеристики выписанных слов (существительное/прилагательное).


    № примера

    РНК

    КРЛЯ

    БНК

    1.

    прилагательное




    прилагательное

    2.

    прилагательное




    прилагательное

    3

    существительное




    существительное


    Задание 4. - Сравните значение выписанных слов.

    Для этого посетите веб-страницы толковых словарей www.gramota.ru/slovari и http://oxforddictionaries.com. Определите, в каком значении рассматриваемое слово встречается в контекстах. Впишите результат в таблицу.


    № примера

    РНК

    КРЛЯ

    БНК

    1.

    Принадлежащий русским, созданный русскими или свойственный русским




    relating to Russia, its people, or their language

    2.

    Принадлежащий русским, созданный русскими или свойственный русским




    relating to Russia, its people, or their language

    3

    к Россия и Русь




    the language of Russia, an Eastern Slavic language written in the Cyrillic alphabet and spoken by over 130 million people



    Задание 5. - К каким выводам вы пришли при сравнении морфологической и лексической характеристики одного и того же слова, включенного в разные корпусы?
    В действительности морфологические метки включают не только признак части речи, но и признаки грамматических категорий, свойственных данной части речи. Это основной тип разметки: во-первых, большинство крупных корпусов являются как раз морфологически размеченными корпусами, во-вторых, морфологический анализ рассматривается как основа для дальнейших форм анализа – синтаксического и семантического, и, в-третьих, успехи в компьютерной морфологии позволяют автоматически размечать корпусы больших размеров.

    Однако автоматический анализ естественного языка небезошибо­чен и многозначен – он, как правило, дает несколько вариантов анализа для одной лексической единицы (слова, словосочетания, предложения). В этом случае говорят о грамматической омонимии. Снятие неодно­значности (морфологической, синтаксической) в целом является одной из важнейших и сложнейших задач компьютерной лингвистики. При создании корпусов для снятия неоднозначности используются автома­тические и ручные способы. Корпусы нового поколения включают сотни миллионов слов, поэтому выдвигаются принципы разработки систем, которые бы минимизировали вмешательство человека. Автома­тическое разрешение морфологической или синтаксической омонимии, как правило, основывается на использовании информации более высокого уровня (синтаксического, семантического) с применением статистических методов

    При морфологическом синтезе исходными данными являются лексема и конкретные морфологические характеристики запрашиваемой словоформы данной лексемы, возможен и запрос на синтез всех форм заданной

    лексемы (так называемой парадигмы слова).
    Задание 6. - Как можно использовать рассмотренные корпусы в лингвистическом исследовании?
    Пользователей корпусов, как правило, интересует не содержание конкретных текстов, а их метатекстовая информация и примеры употребления тех или иных языковых элементов и конструкций. Это, в первую очередь, лингвисты. Первоначальные лингвистические исследования, проводившиеся с помощью корпусов, сводились к подсчету частот встречаемости различных языковых элементов. Статистические методики используются в решении сложных лингвистических задач, таких как машинный перевод, распознавание и синтез речи, средства проверки орфографии и грамматики и т.д. Так, устойчивые словосочетания представляют собой с семантической точки зрения неделимую смысловую единицу, что очень важно учитывать в лексикографии, системах автоматической обработки текста. На материале корпуса статистическими методами можно определить, какие слова встречаются вместе регулярно и, таким образом, могут быть отнесены к устойчивым словосочетаниям. Корпусы являются богатым источником данных для исследований по лексикографии и грамматике. С исследованиями по лексикографии тесно связаны исследования в области семантики. Наблюдая окружения той или иной лингвистической единицы в корпусе, можно установить определенные семантические признаки, характеризующие данную единицу.
    Лингвисты-теоретики используют корпусы в качестве экспериментальной базы для проверки гипотез и доказательства своих теорий. Прикладные лингвисты (преподаватели, переводчики и т.п.) используют компьютерные корпусы при обучении языкам и для решения своих профессиональных задач. Особый класс пользователей представляют компьютерные лингвисты: они пытаются выявить и использовать статистические и лингвистические закономерности, присутствующие в текстах, для создания компьютерных моделей языка. Другие специалисты по языку (литературоведы, редакторы) также в ряде случаев могут получить ответы на интересующие их вопросы, обратившись к корпусу. Специалисты по общественным наукам (историки, социологи) также могут изучать свои объекты через язык, используя такие параметры текстов, как период, автор или жанр. Литературоведы используют корпусы для стилеметрических исследований. Наконец, корпусы используются для разработки и настройки различных автоматизированных систем (машинный перевод, распознавание речи, информационный поиск).

    Практическое задание № 9

    Электронные словари

    Задание 1. - Посетите сайт www.rvb.ru/soft/catalogue/index.html.

    В разделе 7 – словари и тезаурусы — выберите «Словарь сокращений русского языка». Протестируйте предлагаемый онлайн-словарь, введя любое сокращение русского языка. Представьте результаты работы в таблице.


    Введенное сокращение

    Расшифровка сокращения

    ФРСН

    1) федеральный реестр сметных нормативов

    СОК

    2) «Самарские объединённые капиталы»

    НКТТ

    3) Новосибирский колледж транспортных технологий имени Николая Александровича Лунина


    Задание 2. Посетите сайт www.merriam-webster.com.

    Введите слово culture в строку поиска. Определите зоны словарной статьи для этого слова в словаре Merriam Webster и представьте результаты вашего анализа в таблице.

    Зоны словарной статьи

    Данные для слова culture в электронном словаре Merriam Webster

    • лексический вход (вокабула, лемма)

    culture

    • зона грамматической информации

    cul·​ture | \ ˈkəl-chər

    cultured; culturing

    • зона стилистических помет

    a way of thinking, behaving, or working that exists in a place or organization (such as a business)The company's corporate/business culture is focused on increasing profits.There was a culture of success at the school. [=the school's policies and environment encouraged its students' success]


    • зона значения

    the beliefs, customs, arts, etc., of a particular society, group, place, or time

    a particular society that has its own beliefs, ways of life, art, etc.


    • зона фразеологизмов

    the set of shared attitudes, values, goals, and practices that characterizes an institution or organization
    a corporate culture focused on the bottom line

    зона этимологии

    Middle English, cultivated land, cultivation, from Anglo-French, from Latin cultura, from cultus, past participle

    зона примера и источника примера

    In this new view, genes allow the human mind to learn, remember, imitate, imprint language, absorb culture and express instincts.

    — Matt Ridley, Time, 2 June 2003


    Задание 3. Посетите сайт www.ozhegov.org.

    Введите слово культура в строку поиска. Определите зоны словарной статьи для этого слова в электронной версии словаря Ожегова и представьте результаты вашего анализа в таблице.

    Зоны словарной статьи

    Данные для слова культура в электронном словаре Ожегова

    • лексический вход (вокабула, лемма)

    КУЛЬТУРА

    • зона грамматической информации

    -ы, ж.

    • зона стилистических помет

    (спец.)

    • зона значения

    1. Совокупность производственных, общественных и духовных достижений людей. 2. Человек высокой культуры. 3. Разведение, выращивание какого-н. растения или животного. 4. Разводимое растение, а также клетки микроорганизмов, выращенные в питательной среде в лабораторных или промышленных условиях. 5. Высокий уровень чего-н., высокое развитие, умение.

    • зона фразеологизмов

    Культура голоса, физическая культура, культура речи

    • зона этимологии

    (см. культурный во 2 знач.)

    • зона примера и источника примера

    История культуры. К. древних греков

    Человек высокой культуры.

    К. льна. К. шелкопряда.

    Технические культуры.

    К. органической ткани.

    К. производства. К. голоса (у певцов). Физическая к. (физкультура). л, речи

    1   2   3   4


    написать администратору сайта