|
Ответы на вопросы для экзамена по общей фонетике. Общая фонетика. Язык, его функции, знаковая природа, системная организация, уровневая структура. Дихотомия языкаречи. Текст как продукт речи
- длительность. Длительность (количественная характеристика) – время звучания. Обычно не менее 25 мс. В среднем — от 0,040 до 0,200 с.
абсолютная д-ть
относительная д-ть
Субъективно звуки могут восприниматься как долгие и краткие.
Чистый тон и комплексный звук. Спектр звуков речи. Резонанс и резонаторы. Спектральный анализ речи.
Речевые звуки представляют собой комплексные колебания, то есть сложнейшие сочетания простых или чистых тонов и/или шумов. Простой тон — это периодическое колебание, которое имеет только одну частоту колебания. Иначе простое периодическое колебание называется гармоническим. Звуков такого рода в природе не существует, хотя имеются звуки, очень близкие чистому тону. К ним относится, например, звук, издаваемый камертоном. Если ударить по ножке камертона, то его усы (рожки) начинают смещаться из нейтрального положения, затем возвращаются в исходное положение под воздействием силы эластичности, затем, вследствие инерции, продолжают движение через точку покоя, затем обратно и т.д. Большинство источников производят не простые, а сложные (комплексные) колебания, то есть колебания, характеризующиеся наличием более чем одной частоты. Так, например, при колебании струны колеблется не только вся она целиком, но и ее половина, четвертая часть и т.п.
Все речевые звуки являются сложными. Комплексные колебания могут быть 1) (квази)периодическими, то есть имеющими регулярно повторяющуюся модель, и 2) непериодическими (у них отсутствует регулярное повторение модели вследствие неповторяющегося характера колебаний или быстрого их затухания).
Спектр речевого звука можно разложить на тоновую (периодическую) и шумовую (непериодическую) составляющие. Тоновые звуки образуются при участии голосовых связок, шумовые — препятствиями в полости рта. По наличию этих составляющих можно провести первую классификацию речевых звуков: • Гласные — тоновые • Глухие согласные — шумовые • Сонорные согласные — тоновые со слабой примесью шума • Звонкие согласные — шумовые с участием тона.
По форме спектра звуки речи могут быть: 1. Вокальные — невокальные. Для характеристики звука по этому признаку важно, есть ли в его спектре формантная структура, т. е. отчетливо выраженное регулярное усиление определенных частотных составляющих. Вокальными являются все гласные и сонорные согласные, невокальными — шумные согласные. 2. Консонантные — неконсонантные. Признак консонантности связан с общим уровнем энергии в спектре: звуки со слабым уровнем консонантны, звуки с высоким уровнем энергии неконсонантны. К первой группе относятся все согласные, в том числе и сонорные, ко второй группе — гласные. 3. Высокие — низкие. Для этих звуков важно, в какой части спектра преимущественно расположены составляющие — в области низких частот или высоких. Высокие — гласные переднего ряда, передне- и среднеязычные согласные, низкие — все непередние гласные, губные и заднеязычные согласные. 4. Компактные — диффузные. Компактность звука определяется относительной близостью усиленных составляющих друг к другу и одновременно к центру спектра (1000 Гц). Диффузные звуки не обладают этим качеством. Диффузные — гласные верхнего подъема, а также губные и зубные согласные. Все остальные звуки речи компактны. 5. Диезные — недиезные. Признак диезности связан с более высоким положением в спектре одной или нескольких областей усиления энергии. Диезные — мягкие согласные, а также гласные переднего ряда и те гласные, которые мы произносим между мягкими согласными. Все твердые согласные и непередние гласные недиезны. 6. Бемольные — небемольные. Бемольность — понижение всех или нескольких спектральных составляющих звука. Бемольны огубленные гласные и согласные, остальные небемольны. 7. Прерванные — непрерывные. У прерванных звуков начало отличается большим расходом энергии, который затем не возрастает. У непрерывных расход энергии относительно равномерно распределен во времени. Прерванные — смычные согласные. Непрерывные — все гласные и несмычные согласные. 8. Резкие — нерезкие. Резкие звуки — с явно выраженной неоднородностью спектра. Это аффрикаты и дрожащие согласные. Все остальные звуки речи — нерезкие. 9. Звонкие — глухие. Звонкие звуки — гласные и звонкие согласные — имеют в спектре самую низкую интенсивную составляющую (до 300 Гц), которая соответствует основному тону звука. Этот тон создается колебаниями голосовых связок. Области усиления энергии в спектре звука называются формантами. Поскольку звуки речи имеют протяженность во времени, их спектры удобно представлять с учетом трех характеристик: частоты, интенсивности и времени. На таких спектрограммах по горизонтальной оси отложена длительность, по вертикальной — частота. Об интенсивности свидетельствует степень потемнения различных участков спектрограммы.
Резонанс и резонаторы. Резонанс-Акустическое явление, при котором в результате воздействия колебаний одного тела, называемого вибратором, в др. теле, называемом резонатором, возникают аналогичные по частоте и близкие по амплитуде колебания. Наиболее полно Р. проявляется в условиях точной настройки резонатора на частоту колебаний вибратора и при хорошей (с малыми потерями энергии) передаче колебаний. В качестве резонатора может служить любой вибратор, однако на практике конструируют спец. резонаторы, оптимальные по своим характеристикам и соответствующие предъявляемым к муз. инструментам требованиям (по высоте, громкости, тембру, продолжительности звучания). Различают единичные резонаторы, отвечающие на одну частоту (резонирующая подставка камертона, резонаторы челесты, вибрафона и др.), и множественные резонаторы (деки фп., скрипок и др.).
Спектральный анализ речи. Метод установления акустической структуры звуков речи, представляющих собой сложный, непрерывно изменяющийся во времени акустический сигнал, образующийся рядом частотных составляющих с различной интенсивностью. При С. а. з. р. используются автоматически действующие электроакустические приборы спектрометры или спектрографы. Динамические спектрографы позволяют анализировать текущую речь; полученные спектрограммы отражают непрерывность перехода от одного звука к другому.
Акустическая теория речи. Типы звуковых источников и фильтров. Акустическая классификация звуков.
Акустическая теория речи (АТР)
Роман Якобсон
Гуннар Фант
Моррис Халле
Начальные работы 1950-х – 1960-х гг.
В акустической теории речеобразования (АТР), создателем которой является шведский ученый Гуннар Фант, речь рассматривается как процесс фильтрации. Это означает, что речевой тракт выступает в функции фильтра, пропускающего (усиливающего) только те частоты, порожденные источником звука, которые совпадают с его собственной частотой.
Типы источников: В пределах колебания связок скорость воздушного потока постепенно нарастает (голосовая щель открывается), достигает максимума, затем убывает (голосовая щель закрывается) и некоторое время остается равной нулю (голосовая щель закрыта)
Импульсный Турбулентный
Акустические признаки звуков в АТР (всего 9)
вокальные – невокальные
гласные и сонорные ↔ согласные
консонантные – неконсонантные высокие – низкие
высокие: гласные п.р., переднеязычные согласные
компактные – диффузные
гласные неверхнего подъема, нёбные согласные ↔ гласные верхнего подъема, губные и зубные согласные
бемольные – небемольные
лабиализованные ↔ нелабиализованные
диезные – недиезные
гласные рядом с мягкими, палатализованные согласные ↔ «обычные» гласные, непалатализованные согласные
прерывистые (прерван.) – непрерывные резкие – нерезкие
аффрикаты и дрожащие ↔ все прочие
звонкие – глухие
гласные и звонкие согласные ↔ глухие согласные
Перцептивная фонетика. Работа слухового аппарата. Этапы и свойства человеческого восприятия речи. Теории восприятия речи.
Перцептивная фонетика — раздел фонетики, рассматривающий восприятие звуков речи человеческими органами слуха.
Задачи перцептивной фонетики:
Понять какие механизмы обеспечивают восприятие речи в естественных условиях коммуникации Исследовать реакции на речевые сигналы
способность опознавать и различать звуковые единицы языка, слоги, слова в разных экспериментальных условиях способность оценивать и интерпретировать изменение акустических характеристик речевого сигнала и др.
Этапы приема акустического сигнала:
первичный слуховой анализ
выделение акустических событий и признаков лингвистическая интерпретация речевого сообщения
Слуховой аппарат человека
Три отдела слухового аппарата:
периферический
наружное, среднее, внутреннее ухо
проводниковый центральный Свойства наружного уха
Ушная раковина и наружный слуховой проход (около 2,5 см) – резонаторы. Усиливают звуковые частоты в диапазоне 3 0005 000 Гц приблизительно в 2-4 раза.
Форма ушной раковины уменьшает чувствительность к волнам, поступающим сзади.
Устройство среднего уха
Костная полость, заполненная воздухом. С одной стороны ограничена барабанной перепонкой, с другой — системой внутреннего уха.
В среднем ухе находятся три слуховые косточки: молоточек, наковаленка (наковальня) и стремечко (стремя).
Колебания барабанной перепонки приводят в движение прикрепленный к ней молоточек. Его колебания передаются наковаленке и стремечку. Основание стремечка действует как поршень на жидкость, находящуюся во внутреннем ухе, вызывая в ней изменение давления. Свойства среднего уха
При прохождении через структуры среднего уха уровень передаваемого давления увеличивается приблизительно на 30 дБ!
Наиболее эффективно передаются колебания среднего частотного диапазона (800 – 3000 Гц).
Давление воздуха в полости среднего уха равно внешнему атмосферному давлению. Нарушение этого баланса (ощущения при резком подъеме и спуске) ухудшает работу барабанной перепонки. Полость среднего уха с носоглоткой соединяет евстахиева труба, которая открывается при глотании или зевании.
Устройство внутреннего уха
Множество каналов, расположенных в височной кости, заполненных жидкостью.
Одна из костных структур имеет форму спирали и называется улиткой. Закручивается вокруг костного стержня почти три раза.
Внутри улитки вдоль всей длины проходят две мембраны. Возбуждение клеток мембран передаются окончаниям слухового нерва. Таким образом генерируются электрические импульсы.
Улитка: преобразование колебаний
Электрические импульсы передаются в кору головного мозга.
Пространственно-временной рисунок, получаемый в слуховом нерве, напоминает динамическую спектрограмму речи.
Интерпретация первичного слухового анализа
Свойства восприятия речи:
категориальность
нелинейность
Сегментация речевого сигнала
Выделение фрагментов со сменой источника и степени сужения речевого тракта, т. е. быстрых изменений в спектре. Наиболее яркие акустические фрагменты:
пауза звонкая пауза при произнесении звонкого смычного взрыв (резкое начальное нарастание) длительный шум с нерезким началом (щелевой) вокализованный шум (звонкий щелевой) вокальный участок (гласный или сонорный) Резкие изменения в частоте и амплитуде сигнала.
Гипотезы распознавания речевого сигнала (теории восприятия речи):
Артикуляционная гипотеза (моторная теория): восприятие зависит от модели артикуляции, которую воссоздает слушающий (как бы одновременно артикулируя с говорящим).
Количественная: восприятие зависит от изменения положения артикулирующих органов при переходе от одного звука к другому.
Акустическая: восприятие зависит от акустической картины.
Проблемы автоматического анализа и синтеза речи. Принципы артикуляционного и акустического синтеза. Системы Text To Speech (TTS).
Автоматический анализ и синтез устной речи
Этапы анализа и синтеза устной речи
понять и среагировать (анализ) первичная акустическая сегментация смысловая интерпретация преобразовать и выдать (синтез) смысловой синтез акустический синтез
Генеральные проблемы:
сегментация речи
снятие омонимии (разрешение многозначности) Трудности первичной сегментации речи
плавность речевого потока
огромное количество звуковых нюансов, специфическая сочетаемость звуков
отсутствие пауз между словами, несоответствие пауз и синтаксических единиц
наличие интонации, мелодическая изменчивость
индивидуальные особенности речи
… … Синтез речи-1
Моделирование речевого аппарата: артикуляторный синтез
Синтез речи-2
Моделирование звукового сигнала (акустический синтез):
а) формантный синтез (по правилам),
б) компилятивный синтез Формантный синтез
Генерация сигнала источником (синтезатором) Фильтрация исходного сигнала, моделирование параметров голосового тракта. Компилятивный синтез: «Склейка» речи из имеющихся единиц Современные синтезаторы: системы Text To Speech (TTS)
Интеграция в операционные системы, мобильные телефоны, электронные книги, GPS-навигаторы
Text-to-Speech (TTS), или синтез речи, — это технология, которая преобразует печатный текст в звучащую речь. Синтез речи применяется во многих сферах.
Фонология. Звуки речи и звуковые типы. Фонема как единица языка. Трактовка фонемы И. А. Бодуэна де Куртенэ как основание появления последующих фонологических теорий.
Фонология – раздел фонетики, изучающий функционирование фонетических единиц в языке в связи с различием смысловых единиц. Фонема – минимальная единица хранения информации, это то, чем могут отличаться друг от друга разные знаковые единицы;
Звуки речи и звуковые типы:
Индивидуальные особенности речи Ситуативные особенности различия в сочетаемости [а] [ъ] [иэ] как «акустико-артикуляционные зоны»
Звук речи – конкретный звук, произнесенный конкретным лицом в конкретной ситуации.
Звуковой тип – мно-во звуков, воспринимаемых тождественно. Звуковые типы мы отражаем в фонетической транскрипции.
Определение фонемы (МФШ) - мельчайшая языковая единица, представленная рядом позиционно чередующихся звуков и служащая для отождествления и различения слов и морфем. При этом фонема не является значимой единицей. Минимальная значимая единица – морфема.
Фонема (И.А. Бодуэн де Куртенэ) – единое представление, принадлежащее миру фонетики, которое возникает в душе посредством слияния впечатлений, полученных от произношения одного и того же звука – психический эквивалент звуков языка.
Фонема в понимании МФШ. Понятие фонологической позиции. Типы позиций.
Фонема МФШ – это минимальная линейная единица языка, служащая для различения и отождествления морфем и представления в речи рядом позиционно чередующихся звуков. При этом фонема не является значимой единицей. Минимальная значимая единица – морфема.
Фонологические позиции:
Условия реализации фонемы в речи. В сильных позициях фонема наилучшим образом выполняет свои функции (сигнификативную и перцептивную: возможность отождествлять и различать), в слабых — ограниченно. В соответствии с этим выделяются: перцептивно
Фонологические позиции, по МФШ
пример для фонемы <о>
Перцептивная +
Сигнификативая +
основной вариант (вид) фонемы: [ó]
Перцептивная –
Сигнификативая +
вариации фонемы: [ó˙] [˙ó] [˙ó˙]
Перцептивная –
Сигнификативая –
варианты фонемы [] [ъ] [иэ] [ь]
Нейтрализация - совпадение двух или более фонем в одном звуке.
Или:
Неразличение двух или более фонем в сигнификативно слабой позиции.
Сильные позиции фонем
Гласные: ударная
<у>: все позиции сильные
Согласные:
по глухости/звонкости
перед гласным
перед сонорным согласным
перед [в] и [в’]
по твердости/мягкости
перед гласным
на конце слова
перед заднеязычным согласным
|
|
|