Главная страница

Пупа. Информационные технологии в лингвистике. Webсервер представляет собой


Скачать 188 Kb.
НазваниеWebсервер представляет собой
Дата13.09.2022
Размер188 Kb.
Формат файлаdoc
Имя файлаИнформационные технологии в лингвистике.doc
ТипПротокол
#675402

Тест




Web-сервер представляет собой

выделенный компьютер, предназначенный для хранения только текстовых документов

компьютерную программу, запускаемую на подключенном к сети компьютере и использующую протокол HTTP для передачи данных

выделенный компьютер, предназначенный для хранения лицензионных программ



Web-страница представляет собой

текстовый файл с расширением .txt или .doc

двоичный файл с расширением .com или .exe

наименьшую единицу Всемирной паутины, представляющую собой текстовый документ, составленный на языке разметки страниц



Автоматический синтез текстов относится к … лингвистике

компьютерной

фундаментальной

теоретической



Алгоритм – это …

набор команд для компьютера

описание последовательности действий, строгое исполнение которых приводит к решению поставленной задачи за конечное число шагов

правила выполнения определенных действий



Алгоритмы информационного поиска основаны на …

сравнении поискового образа документа с поисковым образом запроса

отборе всех документов, релевантных по смыслу

отборе всех формально релевантных документов



Аннотация к текстовому документу – это …

краткое изложение достоинств аннотируемого документа

сведения об авторах документа

вторичный документ, содержащий краткую характеристику текстового документа с точки зрения его содержания, оформления, направленности и происхождения



База данных представляет собой …

часть информационного хранилища, структура которого описывается на языке некоторой модели данных

информационное хранилище

файловую систему



База знаний содержит …

базу данных и правила поиска данных

базу данных и правила, используемые для вывода новых знаний

ответы на все вопросы программы



В бытовом смысле под информацией понимаются …

знания, которые используется для ориентирования, активного действия, управления, т.е. в целях самосохранения, совершенствования и развития

любые сведения или данные, которые кого-либо интересуют

сведения, полученные из надежных источников



В основе корпусной лингвистики лежит постулат о том, что язык – это …

система с реляционным определением языковых единиц как пучков отношении каждой единицы со всеми другими единицами и произвольными языковыми знаками

полностью социальное явление и его можно описать данными, основанными на опыте, то есть получаемыми из речевых актов

врожденная данность с автономностью синтаксиса, наличием глубинного и поверхностного синтаксиса, универсальностью правил глубинного синтаксиса и естественной отличимостью правильных и неправильных языковых выражений



В процессе поиска с использованием поисковой системы пользователь вводит поисковый запрос, сформулированный на естественном языке, и затем этот запрос преобразуется в …

язык машинных кодов (ЯМК)

информационно-поисковый язык (ИПЯ)

язык информационно-поисковых схем (ЯИП-С)



В ряду «символ, …, строка, фрагмент текста» пропущен элемент «…»

абзац

страница

слово



В системах автоматического распознавания устной речи в качестве выделяемых в речевом потоке знаков используются …

отдельные звуки

предложения

слова



В случае наличия качественной связи между вероятностью некоторого события и количеством информации в сообщении об этом событии можно утверждать, что …

чем меньше вероятность некоторого события, тем больше информации содержит сообщение об этом событии

количество получаемой о событии информации не зависит от вероятности этого события



В частотных словарях слова располагаются …

по алфавиту

в порядке возрастания частоты их встречаемости в тестах

в порядке убывания частоты их встречаемости в тестах



Гиперссылка – это …

заголовок документа

абзац документа, в котором ссылаются на другие абзацы этого же документа

выделенный фрагмент документа, с которым ассоциирован фрагмент текущего документа или адрес другого Web-документа



Говоря о взаимозависимости частоты использования слова в естественном языке и «возраста» этого слова, можно утверждать, что …

между частотой использования слова и его «возрастом» зависимости нет

самые частотные слова, как правило, являются наиболее древними

самые частотные слова, как правило, являются наиболее молодыми



Говоря о взаимозависимости частоты использования слова в естественном языке и его многозначности, можно утверждать, что …

самые частотные слова, как правило, не являются многозначными

зависимости между частотой использования слова и его многозначностью не существует

самые частотные слова, как правило, являются наиболее многозначными



Говоря о взаимозависимости частоты использования слова и его длины, можно утверждать, что …

самые частотные слова в естественном языке, как правило, являются наиболее краткими

зависимости между частотой использования слова и его длиной не существует

самые частотные слова в естественном языке, как правило, являются наиболее длинными



Говоря об универсальном (стандартизованном) информационно-поисковом языке (ИПЯ), можно утверждать, что …

существует международный стандарт ИПЯ

существует российский стандарт языка ИПЯ

единого стандарта не существует, и каждая поисковая система имеет ИПЯ со своей спецификой



Дескриптор – это …

служебная структура в оперативной памяти компьютера, которая определяет размер сегмента файловой системы

лексическая единица информационно-поискового языка (слово или словосочетание), служащая для описания смыслового содержания документа или для формулировки запроса при поиске документа (информации) в информационно-поисковой системе

конфигурационный файл, содержащий описание процесса развертывания информационно-поисковой системы



Диапазон речевых частот, т.е. тех колебаний, которые могут быть обнаружены при анализе акустических свойств звуков речи, колеблется от …

50 до 10000 Гц

20000 до 90000 Гц

10 до 100 Гц



Для обозначения научного направления, связанного с разработкой алгоритмов и изучением методов и приемов их построения, используется термин …

Brainware

Software

Hardware



Единица измерения количества информации – …

1 тер

1 байт

1 вольт



Закон Ципфа-Мандельброта отражает эмпирическую зависимость между …

различными языками

частотой слова и его семантическим наполнением

абсолютной частотой слова и его рангом



Изучением проблемы частотности слов в естественном языке занимались ученые …

Ж. Эсту, Дж. Ципф, Б. Мандельброт

Фердинанд де Соссюр, Бодуэн де Куртенэ

Н.С. Трубецкой, Р.О. Якобсон



Индексирование – это процедура …

записи информации о документе в базу данных поисковой системы

описания документа на информационно-поисковом языке, в процессе которой создается поисковый образ документа

создания файла, содержащего аннотацию к документу



Информативность сообщения, принимаемого человеком, зависит от …

понятности сообщения и наличия в нем новых знаний

способа обработки сообщения

способа передачи сообщения



Информативность текста зависит от …

объема текста

количества содержащихся в нем информативных сообщений

количества семантико-синтаксических конструкций в тексте



Информационная технология – это совокупность …

приемов использования компьютерной техники для работы с информацией

методов работы с текстом

методов и устройств, используемых людьми для обработки информации



Информационно-поисковая система представляет собой …

любую управляемую систему, направленную на поиск информации

компьютерную систему и набор технологий обработки информации, с помощью которых можно найти необходимые сведения

упорядоченную совокупность документов и информационных технологий, предназначенных для хранения и поиска информации, представленной в виде текстов или их частей (фактов)



Информационные ресурсы – это …

любая актуальная информация

базы данных

идеи человечества и указания по реализации этих идей, накопленные в форме, позволяющей их воспроизводство



Информационные ресурсы, в отличие от всех других видов ресурсов (трудовых, энергетических, минеральных и т.д.), …

не зависят от скорости их расходования

уменьшаются при их расходовании

растут тем быстрее, чем больше их расходуют



Информационные технологии в лингвистике – это …

компьютерные технологии, позволяющие работать с текстами на различных языках

совокупность законов, методов и средств получения, хранения, передачи, распространения, преобразования с помощью компьютеров информации о языке и законах его функционирования

компьютерные методы и средства работы с лингвистической составляющей мультимедийной информации



Информационный поиск – это …

процесс поиска информации в Интернете

процесс поиска неструктурированной документальной информации, удовлетворяющей информационные потребности людей, и наука об этом поиске

использование специальных технологий и инструментов для нахождения необходимых фактов, сведений и данных



Информационный процесс – это процесс, связанный с …

приобретением права на распространение информации

сменой владельца информации

определенными операциями над информацией



Информация (с позиций информатики) – это …

сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень определенности, неполноты знаний

любые сведения об окружающем мире, его свойствах и протекающих процессах

сведения об окружающем мире, передаваемые человеком, живыми организмами или техническими системами для регулирования своего поведения в окружающей среде



К главным отличиям корпуса текстов от электронной библиотеки (архива) относят …

способ структуризации текстов

способ хранения текстов на машинном носителе

большой объем корпуса, его репрезентативность, обусловленную доминантой, объединяющей все тексты единым логическим замыслом, и наличие разметки текстов



К корпусам с точки зрения пользователя предъявляются такие требования, как …

большой объем, одноязычность и свободный доступ

понятность, непротиворечивость, достоверность и достаточный объем

репрезентативность, полнота, экономичность, структуризация материала, компьютерная поддержка и наличие разметки



К корпусам с точки зрения пользователя предъявляются такие требования, как …

понятность, непротиворечивость, достоверность и достаточный объем

большой объем, одноязычность и свободный доступ

репрезентативность, полнота, экономичность, структуризация материала, компьютерная поддержка и наличие разметки



К общенаучным методам научного исследования в лингвистике относят …

мониторинг функционирования языка

анализ, синтез, индукцию, дедукцию, обобщение и сравнение

шкалирование, наблюдение и осреднение



Квантитативная лингвистика – это направление …

лингвистики, в рамках которого изучаются и разъясняются лингвистические явления с помощью методов «количественной» математики

прикладной лингвистики, в рамках которого исследуются проблемы машинного перевода

лингвистики, в рамках которого изучаются искусственно создаваемые знаковые системы для тех областей деятельности, где применение естественных языков затруднительно или невозможно



Количество информации в полученном сообщении удобнее оценивать по степени …

важности информации

уменьшения неопределенности знаний

увеличения количества знаний



Комплекс аппаратных и программных средств, позволяющий компьютерам обмениваться данными,– это …

компьютерная сеть

интерфейс

адаптеры



Компьютерная лингвистика – это …

направление прикладной лингвистики, в котором разрабатываются новые языки программирования

направление прикладной лингвистики, связанное с разработкой систем управления базами данных

область прикладной лингвистики, связанная с привлечением компьютеров для решения практических задач использования языка



Корпусная лингвистика – это …

раздел компьютерной лингвистики, занимающийся разработкой общих принципов построения и использования корпусов текстов с применением компьютерных технологий

направление лингвистики, занимающееся исследованием машинных текстов

направление лингвистики, занимающееся внедрением новых компьютерных технологий в сферу лингвистики



Национальный корпус русского языка появился в …

1960 г.

1978 г.

2004 г.



Неверно, что … входит в схему машинного перевода

определение принадлежности текста к конкретной предметной области

морфологический анализ текста

ввод в компьютер текста на исходном языке



Неверно, что … методы относятся к квантитативным методам в лингвистике

статистические

описательные

вероятностные



Неверно, что … можно отнести к поисковым машинам

MSDN

Google

AOL



Неверно, что … относятся к поисковым средствам

каталоги

поисковые машины

базы данных, содержащих искомую информацию



Неверно, что … является программой распознавания текста

ABBYY FineReader

FoxPro Professional

Cognitive OpenOCR (CuneiForm)



Неверно, что выделяют … в качестве метода поиска документов

адресный

иерархический

фактографический



Неверно, что для функционирования систем машинного перевода требуется … обеспечение

математическое

лингвистическое

информационное



Неверно, что для хранения текстовой информации используются файлы с расширением …

.docxml

.jpf

.log



Неверно, что компьютерная система … содержит и функцию автоматического реферирования, и функцию аннотирования

Oracle Context

Microsoft Word

Intelligent Text Miner (IBM)



Неверно, что программа … ориентирована на автоматический анализ текста

Voice Key

CyberPlat

VoiceTypeDictation (IBM)



Неверно, что программы … включают в себя автоматизированный перевод

управления базами данных

для проверки грамматики

для полнотекстового поиска



Неверно, что система … относится к системам машинного перевода

Stylus

allRefs.net

Universal Translator



Неверно, что система … относится к системам переводческой памяти (ТМ)

Transit (швейцарской фирмы Star)

Paradox (фирма Borland)

Translation Manager (IBM)



Неверно, что создание … относится к задачам прикладной лингвистики

систем генерации речи

систем шифрования информации

автоматизированных информационно-поисковых систем



Обработка информации – это …

получение одних информационных объектов из других информационных объектов путем выполнения некоторых алгоритмов

любые виды редактирования информации с помощью компьютера

изменение формы отображения информации



Объем оперативной памяти персонального компьютера, выделяемый для двоичного кода каждого символа текстовой информации, зависит от …

объема оперативной памяти компьютера

применяемой в компьютере кодировочной таблицы

языка, на котором написан текст



Основными акустическими характеристиками звучащей речи являются …

высота звука и частота колебаний

частота колебаний, амплитуда и длительность (долгота) звука

тембр и сила звука



Отсканированный текст является …

текстовым документом

графическим образом текстового документа

документом, содержащим машинные коды



Первый частотный словарь был составлен …

Жаном-Батистом Эсту

Джорджем Кингсли Ципфом

Александром Бенуа ди Стетто



Период возникновения квантитативной лингвистики относится к …

90-м гг. XX в.

Древней Греции

середине XX в.



По способам выделения из исходных текстов ключевых словосочетаний и предложений выделяют такие методы автоматического реферирования и (или) аннотирования, как …

метод составления конспекта и метод словесных клише

лингвостилистический метод, семантико-стилистический метод и метод вероятностно-статистического анализа текста

статистические, позиционные и логико-семантические методы



Под «информационным шумом» в информационном поиске понимается количество найденных документов, …

формально релевантных, но нерелевантных по смыслу

полностью не соответствующих запросу

относящихся к поисковому спаму



Под информатизацией общества понимают …

организованный социально-экономический и научно-технический процесс создания оптимальных условий для удовлетворения информационных потребностей отдельных людей и общества в целом

ликвидацию компьютерной неграмотности

формирование культуры использования новых информационных технологий



Под корпусом в корпусной лингвистике понимается …

большой, представленный в машиночитаемом виде, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, предназначенный для решения конкретных лингвистических задач

большое собрание текстов, объединенное некоторым логическим замыслом

репрезентативное собрание текстов на одном языке, содержащее дополнительную информацию об авторах текстов



Под машинным переводом понимается процесс перевода …

письменных текстов с одного естественного языка на другой с использованием компьютерных словарей

устной речи с одного естественного языка на другой с использованием компьютерной программы

письменных текстов с одного естественного языка на другой с помощью специальной компьютерной программы



Под национальным корпусом текстов понимается …

собрание художественных текстов в электронной форме на одном языке

корпус текстов, составителями которого являются лица определенной национальности

собрание текстов в электронной форме, представляющих данный язык на определенном этапе его существования



Под переводом обычно понимается деятельность, в результате которой некоторый текст на одном языке ставится в соответствие тексту на другом языке …

при строгом соблюдении грамматических правил языка исходного текста

при обеспечении смысловой эквивалентности обоих текстов

с рассмотрением возможных противоречий и парадоксов



Под репрезентативностью лингвистической выборки понимается …

совпадение тематики лингвистической выборки с тематикой всей генеральной лингвистической совокупности

ее размер

способность выборочной лингвистической совокупности отражать все исследуемы свойства лингвистических единиц в той пропорции, которая наблюдается во всей генеральной лингвистической совокупности



Поисковый образ запроса представляет собой …

текст, состоящий из лексических единиц информационно поискового языка, отражающий содержание информационного запроса

текст запроса на языке SQL

поисковое предписание, сформулированное на естественном языке



Предмет исследования теоретической (фундаментальной) лингвистики – это …

изучение традиции носителей отдельных языков

происхождение и состояние отдельных языков, их история и законы развития

изучение возможностей унификации различных языков



Предметом корпусной лингвистики …

являются язык как социальное явление в определенный период времени в определенных районах, внутренние и внешние свойства текстов и др.

являются межязыковые связи

является внутреннее устройство естественного языка



При автоматическом анализе звучащей речи исходный текст вводится в компьютер с помощью микрофона и затем …

переводится в машинные коды

сохраняется в виде звукового файла

переводится в печатный текст



При автоматическом анализе печатного текста исходный текст …

переводится в цифровую форму

остается на естественном языке

кодируется



При автоматическом реферировании и (или) аннотировании исходного текста главными смысловыми единицами выступают …

только ключевые словосочетания

только ключевые слова

ключевые слова, ключевые словосочетания и ключевые предложения



При квантитативном исследовании любых языковых структур прежде всего необходимо определить …

цель и единицу исследования

количество словарных словоформ

метод исследования



Прикладная лингвистика – это область языкознания, …

направленная на формирование понятий отдельных предметных областей

связанная с разработкой методов решения практических задач использования языка

связанная с разработкой отдельных компьютерных приложений



Программа – менеджер корпуса нужна для того, чтобы …

контролировать поступление в корпус новых текстов

производить поиск данных в корпусе, формировать статистическую информацию и предоставлять результаты пользователю в удобной форме

шифровать хранящиеся в корпусе тексты



Программа ABBYY FineReader поддерживает …

40 языков распознавания текстов

70 языков распознавания текстов (в том числе языки разметки текста)

200 языков распознавания (в том числе экзотические, древние и некоторые языки программирования)



Программа RealSpeaker предназначена для …

перевода речи в текст

редактирования текстов

распознавания текстов



Программы автоматического распознавания текстов должны выполнять операции в следующей последовательности: …

сканирование, сегментация, распознавание, проверка орфографии

сканирование, распознавание, проверка орфографии, сегментация

проверка орфографии, сканирование, распознавание, сегментация



Различают следующие виды рефератов: …

реферат-клише, квазиреферат, связный текст

компьютерный реферат, псевдореферат, миниреферат

предметный, научный, продуктивный



Разметка корпуса текстов представляет собой …

способ форматирования текстов

использование различных шрифтов для выделения сведений об авторах и названиях текстов

приписывание текстам и их компонентам специальных (внешних и внутренних) меток



Результаты квантитативного анализа, как правило, представляются в виде …

графиков, таблиц, схем, гистограмм

рисунков

текстовых отчетов



Результаты поиска документов могут оцениваться по таким показателям, как …

коэффициент правильности поиска и коэффициент ложной выдачи

коэффициент полноты поиска, коэффициент точности поиска и коэффициент информационного шума

коэффициент поискового спама и коэффициент информационного шума



Релевантность в информационном поиске – это …

степень несоответствия найденного документа запросу на поиск

общее количество найденных документов по запросу на поиск

степень семантического соответствия найденного документа запросу на поиск



Реферат – это …

краткое пояснение к каждому пункту оглавления некоторого текстового документа

доклад по определенной теме, содержащий краткое изложение содержания научной работы, статьи, монографии и т.д., в котором собрана информация из одного или нескольких текстовых источников

развернутое изложение сути научной работы, статьи, монографии и т.д.



Семантический анализ звучащей речи …

возможен полностью

возможен частично

практически невозможен



Система переводческой памяти Translation Memory (ТМ) предполагает …

хранение базы данных переводов, сделанных профессиональным переводчиком, для того чтобы в процессе перевода предлагать человеку готовый перевод фразы или фрагмента текста

использование баз данных переводов различных текстов, расположенных на серверах Интернета

использование баз данных переводов специализированных текстов для отдельных предметных областей, таких как юридические или медицинские документы, технические инструкции и т.д.



Скорость работы компьютера зависит от …

объема обрабатываемой информации

организации интерфейса операционной системы

тактовой частоты обработки информации в процессоре



Сообщение «…» содержит 1 бит информации

В игре "Крестики-нолики" на поле 8x8 сделан первый ход

Лампочка загорелась

Загорелся зеленый свет светофора



Средой WWW называют …

совокупность провайдеров, работающих в среде Internet

среду разработки Web-документов

службу Интернет, управляющую передачей документов в гипертекстовом формате (Web-страниц)



Степень сжатия файла зависит …

от производительности ПК

только от программы-архиватора

только от типа файла



Считая, что каждый символ кодируется одним байтом, можно определить, что информационный объем высказывания Рене Декарта «Я мыслю, следовательно, существую» – …

28 бит

34 байта

32 Кбайта



Термин «бит» в теории информации и в вычислительной технике определяет количество информации, …

доступное для измерения

которое содержит сообщение, уменьшающее неопределенность в 2 раза

содержащееся в одном символе текста



Язык HTML – это специализированный язык для …

разметки гипертекста

создания графических и мультимедийных иллюстраций

разработки баз данных


написать администратору сайта