Главная страница
Навигация по странице:

  • Диагностика качества передаваемой речи

  • Тип обесценения (Уровень 1) Деградация (Уровень 2)

  • Оценка Шифр Характеристика качества разговора 1

  • Измерение разборчивости методом артикуляции.

  • Метод мнений.

  • Метод парных сравнений.

  • Характеристика качества речи Баллы

  • отчет. Оценка качества информации в сетях мобильной связи


    Скачать 0.53 Mb.
    НазваниеОценка качества информации в сетях мобильной связи
    Анкоротчет
    Дата12.03.2023
    Размер0.53 Mb.
    Формат файлаdocx
    Имя файла77di.docx
    ТипРеферат
    #982124
    страница2 из 4
    1   2   3   4

    Р ПОМ.сумм.= α1α1Рэхо.+ α2 Рвн.пер.+ α3 Ргл.ш. (1.2)
    где: Р ПОМ.сумм. - суммарная мощность помех;

    Рэхо. - суммарная мощность помех;

    Рвн.пер. - помеха внятного переходного разговора;

    α1 - весовой коэффициент, равный 0,5;

    α2, α3 - весовые коэффициенты, равные 0,25;

    Ргл.ш. - помеха гладкого шума.

    2 ОБЕСПЕЧЕНИЕ КАЧЕСТВА ИНФОРМАЦИИ В СЕТЯХ МОБИЛЬНОЙ СВЯЗИ
    2.1 Оценка качества передачи информации по каналам мобильной связи
    Речь, являясь одной из самых ярких характеристик индивидуума, содержит в себе не только смысловую, но и эстетическую информацию. Поэтому желательно изыскание таких критериев и методов оценки качества телефонной передачи, с помощью которых можно было бы оценить не только степень передачи смысла речи, но и степень передачи особенностей голоса говорящего и динамики речи.

    Все факторы, характеризующие качество передачи речи (разборчивость, громкость, естественность и мешающее влияние различных помех), определяются не только физическими характеристиками телефонного тракта и физиологическими свойствами участвующих в процессе приема-передачи слухового и речевого аппаратов человека, но и рядом субъективных и чисто психологических факторов.

    Все факторы, определяющие качество передачи и их удельный вес в «интегральной» абонентской оценке, связаны с психикой абонента, состоянием его нервной системы, необходимой торопливостью или, наоборот, со спокойствием, которое абонент испытывает, осуществляя нужное ему соединение. Восприятие меняется в зависимости от возраста слушателя и особенностей его родного языка. Более того, от теста к тесту мнения одних и тех же людей могут изменяться, многое зависит от ожиданий: хорошие оценки сотовой связи чаще всего объясняются ожиданием невысокого качества.

    В этой связи можно сказать, что оценка качества телефонной передачи есть продукт мышления и состояния психики абонента, а не простое техническое измерение [3]. То есть, оценка качества телефонной передачи есть не что иное, как психологическая реакция абонента на телефонную передачу. Большое число не поддаюшихся точному учету факторов, оказывающих влияние на абонентскую оценку качества передачи, в сильной степени усложняет ее выражение мерой и числом. Учитывая различные вкусы и потребности, а также зависимость суждений абонентов о качестве передачи от их психического состояния, можно говорить лишь о какой-то усредненной абонентской оценке качества телефонной передачи. Достаточная точность такой оценки, очевидно, может быть обеспечена только статистическими методами.

    В последнее время наиболее часто используются объективные методы оценки, дающие возможность автоматизировать данный процесс, сделать его экономичнее и технологичнее и, что самое важное, осуществлять оценку качества без перерыва связи [11].

    При планировании современных сетей с точки зрения обеспечения достаточного качества передаваемой речи МСЭ-Т рекомендует основываться на специально разработанной Е-модели [11, 22] (рекомендация G.107). Основной принцип, заложенный в Е-модель, гласит: «Психологические факторы на психологической шкале являются аддитивными». Таким образом, Е-модель учитывает все факторы, влияющие на качество речевого обмена в телефонных сетях, основными из которых являются уровень речевого сигнала, амплитудно-частотные искажения, задержка передачи, задержка и ослабление эхо-сигнала, уровень шума и нелинейные искажения. Модель вводит такой параметр, как рейтинг (качества) передачи (transmission ratings - R). Основное уравнение данной модели выглядит следующим образом:
    R = R0-Is-Id-Ie+ A (2.1)

    где:

    R0- отношение сигнал/шум;

    Is - степень ухудшения тракта, связанная с искажениями типа перегрузки, шумом квантования, и др.;

    Id - ухудшение тракта, связанное с задержкой распространения радиосигнала;

    Ie - снижение качества речи, связанное с включенными в тракт устройствами обработки речи (может варьироваться в достаточно значительных пределах, в зависимости от типа кодека);

    А - коэффициент ожидания, определяемый эмоциональным настроем пользователя, который подсознательно предъявляет к качеству связи разные требования в зависимости от условий ведения разговора и его доступности.

    При комфортных условиях и со стационарного телефона ожидаемое пользователем качество связи очень высокое, т.е. А = 0. При разговоре из быстро движущегося транспорта или с абонентом, который находится гденибудь в малодоступном районе, пользователь заранее настроен не обращать внимания на плохое качество, и значение А может равняться 20.

    В таблице 2.1 [11] и на рисунке 2.1 [22] показано соотношение между величиной коэффициента R и результатами субъективно-статистической оценки качества передачи речи по 5-балльной шкале Mean Opinion Scores (MOS). Также в таблице показана их связь со степенью удовлетворенности пользователей качеством речи.
    Таблица 2,1. Степень удовлетворенности пользователей качеством связи в зависимости от показателей R и MOS.


    Значение R

    (нижний предел)

    MOS

    (нижний предел)

    Удовлетворенность

    пользователей

    90

    4,34

    Весьма удовлетворены

    80

    4,03

    Удовлетворены

    70

    3,60

    Некоторые пользователи

    не удовлетворены

    60

    3,10

    Многие пользователи

    не удовлетворены

    50

    2,58

    Почти все пользователи

    не удовлетворены



    Рис.2.1. Связь между значениями MOS и R.

    Данная модель может быть полезна при проектировании сетей связи, для того, чтобы убедиться, что будущие (потенциальные) абоненты будут удовлетворены качеством передачи речи в создаваемой сети.

    2.2 Методы оценки качества информации в сетях мобильной связи

    https://www.qu.tu-berlin.de/fileadmin/fg41/publications/koester_2014_methods-for-assessing-the-quality-of-transmitted-speech-and-of-speech-communication-services.pdf
    Методы оценки качества речи могут быть делятся на две группы: субъективные и объективные методы.

    Субъективные тесты проводятся в лабораторных условиях и в соответствии с определенной процедурой [19], в которой оценщик указывает воспринимаемое качество речи. В конце тестов определяется средний результат, известный как MOS. Рекомендация МСЭ-Т P.800 [19] вводит различные методики тестирования для выполнения субъективной оценки качества речи в службах телефонной связи, к ним относятся: проверка мнения в разговоре, тесты на прослушивание, а также интервью и опрос тесты. Эти методы применимы для любого типа ухудшения качества, такого как передача ошибок, помехи в цепи и окружающей

    среде, искажения, возникающие в результате коммутации пакетов, искажения кодеков и другие.

    Использование телефонной связи для голосового общения между людьми глубоко интегрировано в нашу повседневную жизнь. Технологическое развитие сделало телефонию еще более полезной, например, с появлением мобильных телефонов или передачи голоса по IP. Однако создание и поддержание надежной работающей телефонной системы стало еще более сложной задачей; например, применение разнородных устройств конечных пользователей и сетевой инфраструктуры, а также межсоединение между операторами связи.

    В рамках телефонной службы речевой сигнал может ухудшаться во время записи, кодирования, передачи, декодирования и воспроизведения. Здесь точка зрения конечных пользователей, то есть клиентов, представляет большой интерес: понимание того, как конечные пользователи воспринимают и испытывают ухудшение качества, позволяет улучшить обслуживание телефонной связи и эффективно реагировать на возникающие проблемы, такие как перегрузка сети.

    Качество опыта (QoE) - это степень удовольствия или раздражения пользователя от приложения или сервиса. Это является результатом удовлетворения его или ее ожиданий в отношении полезности и / или удовольствия от приложения или услуги в свете личности пользователя и текущего состояния. [1]. Это определение QoE и разработка методологий для

    оценки субъективно воспринимаемого QoE является целью Европейской сети по качеству опыта в области мультимедиа.Системы и услуги (СТОИМОСТЬ Qualinet IC1003). Это сотрудничество европейских экспертов по качеству и некоторые темы, рассмотренные в этой статье, были частью этого сотрудничества. Применительно к услугам телефонной связи оценка и прогнозирование QoE представляет собой одну из основных целей текущих исследований. Для того, чтобы понять QoE, требуются эксперименты с участием людей-участников. Типичными методами оценки качества передаваемой речи

    являются тесты только на прослушивание и разговорные тесты (с заданием или без него), в которых испытуемые испытывают стимул и оценивают качество. Такие субъективные исследования позволяют понять, если и как ухудшения воспринимаются в соответствии с представленными условиями и задачами исследования [2]. Количественная обратная связь часто собирается с использованием 5-балльной шкалы оценки абсолютной категории (ACR).

    Количество, оцененное по баллам, представлено средним баллом мнений (MOS). Типичную шкалу ACR только для прослушивания, приводящую к MOS (поэтому также называемую шкалой MOS), можно увидеть на рисунке 2.2 [3].
    Качество речи:


    Отлично

    Хорошо

    Довольно хорошо

    Посредственно

    Плохо

    5

    4

    3

    2

    1


    Рис.2.2. Шкала качества прослушивания ACR
    Для оценки качества речи обычно используются короткие стимулы длительностью до нескольких секунд, которые достаточно длительны, чтобы оценить качество, связанное с кодеками или сетевыми нарушениями. Однако эти типы субъективных тестов имеют определенные присущие им ограничения:

    - Стимулы должны быть тщательно отобраны, чтобы были соблюдены все необходимые условия, в то время как количество стимулов все еще управляемо.

    - Усилия по подготовке и проведению исследований являются значительными.

    - Доступна только количественная качественная обратная связь.

    Информация, собранная в ходе субъективных исследований, составляет основу для разработки инструментальных, так называемых объективных

    качественные модели прогнозирования. Серьезной сложностью является тот факт, что данные субъективные результаты часто действительны только при заданных условиях исследования, в котором они были собраны (например, набор

    стимулов, выбор задачи и т.д.).

    Оценке качества речи, направленная на преодоление ограничений, изложенных выше. Такие подходы включают диагностические методы, физиологические измерения и подходы к изучению временных эффектов во время предъявления одного стимула и в течение нескольких отдельных эпизодов использования. Конечная цель состоит в том, чтобы включить идеи, полученные с помощью таких недавних подходов, в традиционные объективные модели прогнозирования речи с целью расширения их валидности и, следовательно, повышения точности таких моделей.
    Диагностика качества передаваемой речи
    Традиционные субъективные тесты дают лишь слабое представление о

    причинах ухудшения качества. Точнее, два разных речевых стимула могут быть оценены с одинаковым значением MOS, в то время как, например, один ухудшается из-за фонового шума, а другой - из-за отсечения. Таким образом, оценка MOS не предоставляет никакой диагностической информации относительно причины ухудшения качества. При разработке подходов, позволяющих выявить причину снижения качества, были использованы два важных наблюдения:

    - наивные слушатели определяют параметры восприятия, связанные с нарушениями, такими как ухудшение цвета звука, шумность или непрерывность.

    - эксперты определяют технические причины канала передачи, которые приводят к таким нарушениям, как неоптимальный уровень речи, речевой спектр или уровень шума.

    Для определения перцептивных измерений передаваемой речи были использованы две методологии, основанные на первом наблюдении выше: (1) масштабирование различий в восприятии попарно представленных стимулов, а затем отображение расстояния восприятия в многомерном пространстве (MDS) [4]; или (2) независимо оценивание всех стимулов по набору биполярные шкалы (Семантический дифференциал, SD [5]) и сокращение пространства суждений с помощью факторного анализа (Анализ главных компонентов, PCA). Применение обеих методик к узкополосному (300-3400 Гц) и широкополосные (50-7000 Гц) передаваемые речевые стимулы позволили идентифицировать три перцептивных измерения суждений о качестве: окраску, шумность и прерывистость [6]. Результаты проиллюстрированы на рисунке 2. Четвертое измерение, представляющее громкость, было добавлено в более позднем исследовании. В [7]

    было показано, что выявленные перцептивные измерения могут быть количественно определены непосредственно в субъективном тесте.

    Идентификация и оценка перцептивных измерений является текущим направлением работы Международного союза электросвязи (ITU-T) (рабочее название P.AMD, Assessment of Multiple Dimensions).

    Второе наблюдение, упомянутое выше, может быть использовано следующим образом: Во-первых, эксперты-слушатели определяют наиболее доминирующие типы ухудшений (“Тип ухудшения”, Уровень 1, например, “Уровень речи”, “Спектр речи” и т.д., см. Таблицу 2.2) и оценивают их в соответствии с тремя категории сильно доминирующие, доминирующие или менее доминирующие. После этого эксперты определяют подробные свойства каждой из доминирующих деградаций (“Деградация”, Уровень 2, например, “Громкая речь” или “Тихая речь”, соответствующая “Уровню речи” и т.д.) [8]. Эксперты могут выбирать из списка технических причин, приведенного в [9], где представлено в общей сложности 47 различных нарушений на уровне 2, сгруппированных в 9 категорий на уровне 1. Экспертов просят оценивать только те образцы, которые получили оценку MOS 3,0 или ниже в субъективных оценках. Выявление технических причин является еще одним элементом работы МСЭ-Т с рабочим названием P.TCA (Анализ технических причин).

    Таблица 2.2: Выдержка из руководства P.TCA



    Тип обесценения (Уровень 1)

    Деградация (Уровень 2)

    Уровень речи

    Громкая речь

    Тихая речь

    Громкость меняется

    Колебания уровня речи

    Временное обрезание речи

    Прерывистая речь

    Самоотсечение

    Вырезки из речи

    Речевой спектр

    Тембр меняется

    Приглушенная речь

    Резкая речь

    Цветная речь

    Уровень шума

    Линия звучит мертво

    Громкий шум

    Колебания уровня шума

    Отсечение временного шума

    Шумоподавители



    Очевидно, что существуют связи между техническими причинами и аспектами восприятия. В первом исследовании результаты эксперимента с аннотациями P.TCA были проанализированы в отношении надежности аннотаций, а также в отношении взаимосвязей между техническими причинами, аспектами восприятия и общим качеством [10]. Результаты показали, что существует необходимость в анализе всех причин P.TCA, анализе перцептивных измерений P.AMD и общих показателях MOS, поскольку эти три показателя коррелируют лишь частично и, следовательно, содержат дополнительную информацию.

    Все вышеупомянутые подходы сосредоточены на ситуация только для “пассивного” прослушивания. Другие фразы, появляющиеся во время использования услуги связи, такие как разговор (нарушенный, например, боковым тоном или эхом) и взаимодействие (нарушенное, например, задержкой), не рассматриваются. В связи с этим в настоящее время исследуется следующий

    подход [11]: Перцептивные измерения фазы прослушивания, описанные выше, складываются с измерениями, относящимися к фазе говорения, и с измерениями, относящимися к фазе взаимодействия. В начальных исследованиях отдельные тесты для фаз говорения и взаимодействия были были проведены, в результате чего были получены два измерения для фазы говорения и одно измерение для фазы взаимодействия [12]. Эти измерения должны быть подтверждены в последующих исследованиях, и до сих пор не было доказано, что они ортогональны друг другу. Для этой цели необходимо разработать субъективные методы, которые позволили бы объединить все фазы беседы в одной экспериментальной парадигме.
    2.3 Субъективные методы контроля качества передачи в мобильной связи
    Качество передачи речи определяется на основании субъективных оценок группы людей, работающих в стерильных условиях тестовой среды. Данный метод занимает много времени и требует наличия большого числа участников, поскольку разные люди могут совершенно поразному оценивать качество, обеспечиваемое одной и той же системой.

    В середине 90-х годов Сектор по стандартизации телекоммуникаций Международного союза электросвязи (МСЭ-Т) завершил разработку рекомендации Р.800, "Методы субъективной оценки качества речевой связи" [16], которая на сегодня является наиболее признанной методологией оценки работы систем передачи речи. В ней описываются условия проведения тестовых испытаний, содержание аудиообразцов, система оценок и методики анализа полученных данных. Чаще всего метод Р.800 используют для расчета средней субъективной оценки (Mean Opinion Score — MOS) качества речи по пятибалльной шкапе. В нашей стране субъективные методы контроля качества передачи речи описываются в ГОСТ 51061-97 «Системы низкоскоростной передачи речи по цифровым каналам. Параметры качества речи и методы измерений» [26].

    Поскольку тесты рекомендации Р.800 могут приводить к получению неоднозначных результатов, среди ученых и инженеров нет согласия относительно их применения. Даже сами авторы этой рекомендации предупреждают о некорректности сравнения оценок MOS, полученных в разных условиях. К тому же лексика, рекомендуемая в Р.800, дает повод для субъективной интерпретации. Исследователи просят участников оценить качество телефонной связи в терминах: "отлично", "хорошо", "удовлетворительно", "неудовлетворительно" и "плохо" (см. табл. 2.3). Проблема состоит в том, что разница между "неудовлетворительным" ("poor") и "плохим" ("bad") качеством, как правило, намного меньше, чем между "удовлетворительным" ("fair") и "неудовлетворительным", поэтому данную шкалу оценок нельзя считать равномерной. С изменением лексики изменятся и результаты. Они могут зависеть от национальности участников тестов. Исследования показали, что если итальянцы, оценивая звонок положительно, ставят оценку "хорошо", то американцы — "удовлетворительно".
    Таблица 2.3. Шкала оценок пользователями качества услуг связи


    Оценка

    Шифр

    Характеристика качества разговора 1

    Отлично

    Excellent (4)

    Полное отсутствие напряженности при разговоре

    Хорошо

    Good (3)

    При разговоре следует приложить внимание, но не требуется никаких заметных усилий

    Довольно хорошо

    Fair (2)

    При разговоре требуется постоянное, но не исключительное напряжение внимания

    Посредственно

    Poor(1)

    Разговор возможен, но испытываются большие затруднения, особенно при передаче необычных слов


    Однако, несмотря на эти проблемы, субъективная оценка качества передачи речи по каналам связи широко применяется.
    Измерение разборчивости методом артикуляции.
    Измерение разборчивости методом артикуляции производится бригадой операторов путем передачи и приема по испытуемому тракту серии артикуляционных таблиц, составленных из элементов речи (слогов, слов, фраз).

    Получаемые в результате таких измерений значения разборчивости являются оценкой качества испытуемого тракта. Эта оценка характеризует телефонный тракт с точки зрения его способности передавать смысловую информацию, содержащуюся в речи собеседников.

    Очевидно, что любые отклонения субъективного характера, связанные с субъективными свойствами операторов, которые участвуют в передаче, приеме и последующей проверке принятых артикуляционных таблиц, могут привести к погрешности в оценке испытуемого телефонного тракта. Субъективные факторы, приводящие к погрешности измерений, весьма многообразны, однако важнейшими из них являются [3]:

    - дикция и слух операторов;

    - их уровень развития;

    - образование операторов;

    - сообразительность;

    - способность концентрировать внимание;

    - степень знакомства с текстом и т.д.
    Использование в артикуляционных измерениях бригады операторов способствует усреднению их субъективных свойств и уже одним этим до некоторой степени ослабляет влияние субъективных факторов.

    Люди, отобранные для работы в артикуляционной бригаде, не должны иметь дефектов речи и слуха, должны обладать быстротой реакции и способностью концентрировать внимание. Нормально укомплектованная бригада должна состоять из пяти операторов (трех мужчин и двух женщин или наоборот).
    Метод мнений.

    Метод заданных категорий оценки, или, как его еще называют, метод многобалльной оценки, нашел наибольшее применение, поскольку он относительно прост. Типичным представителем метода заданных категорий оценки является так называемый метод мнений.

    Сущность метода заключается в следующем: подлежащий оценке тракт телефонной передачи поочередно предоставляется не менее чем 12 парам обычных телефонных абонентов, которые ведут активный двусторонний разговор в течение примерно 3-5 минут. Тема для разговора может быть, вообще говоря, произвольной, однако в целях облегчения нахождения темы для разговора предлагается использовать специальные таблицы случайных фигур.

    Для построения фигур [3] изготовляется сетка из пяти концентрических окружностей, которым придается двузначная нумерация: 1-2, 3-4, 5-6, 7-8, 9-10. Нумерация окружностей начинается от центра. Окружности делятся на равные части с помощью восьми радиусов, которые нумеруются по часовой стрелке порядковыми числами от 1 до 8 (рис.2.3).

    Такая сетка является шаблоном для составления рисунков фигур. Кроме шаблона используется также таблица двузначных случайных чисел. Происходит построение фигуры следующим образом: из таблицы случайных чисел отбираем восемь таких двузначных чисел, первые цифры которых не повторяются и имеют значения от 1 до 8. Вторые цифры этих чисел могут быть любыми. Пусть отобранные числа имеют значения: 43,17,26, 70, 63, 34, 87,52.

    Рис.2.3. Пример построения фигуры по шаблону
    Первые цифры каждого числа соответствуют номерам радиусов, а вторые номерам окружностей. Тогда каждое число определяет точку пересечения радиуса с окружностью. Так, число 43 даст точку пересечения радиуса 4 с окружностью 3-4, число 17 - точку пересечения радиуса 1 с окружностью 7-8 и т.д. Эти точки пересечения отмечаются кружком, если соответствующее число четное, или крестиком, если соответствующее число нечетное. В целях многократного использования одного и того же шаблона построение ведут на кальке, накладываемой на шаблон.

    Полученные по всем восьми числам точки соединяют между собой линией, соблюдая следующее условно принятое правило: через точки, отмеченные кружочком, проводят плавную кривую; в точках, отмеченных крестиком, кривая претерпевает разрыв (рис.2.3). Аналогичным образом может быть построено необходимое число фигур, причем для каждой новой фигуры должны использоваться новые комбинации случайных чисел.

    Полученные фигуры путем случайного отбора включаются в так называемые «листы отвечающего», причем в каждый такой лист включается 12 фигур. В свою очередь, каждая из 12 фигур получает условное словесное обозначение. Слова для обозначений берутся из какого-либо печатного текста (например, из газетной статьи) подряд, исключая собственные имена, союзы, предлоги, междометия.

    Любые три фигуры из «листа отвечающего» наносятся на «лист вызывающего». Там же помещается колонка слов, обозначающих все 12 фигур «листа отвечающего». Каждая пара таких листов получает один и тот же номер. Фрагмент «листа отвечающего» приведен на рисунке 2.4.

    Рис.2.4. Фрагмент «листа отвечающего»
    Практически для использования метода мнений достаточно иметь комплект из 25-30 «листов отвечающего» и «листов вызывающего».

    К оценке испытуемых трактов телефонной передачи по методу мнений должны привлекаться лица (мужчины и женщины) из числа обычных телефонных абонентов, не заинтересованные в результатах измерений и не являющиеся специалистами в вопросах измерения и оценки качества передачи речи. Также они не должны участвовать в подобных испытаниях чаще, чем раз в полгода [16].

    Передающий и приемный концы испытуемого тракта должны располагаться в двух звукоизолированных друг от друга помещениях, исключающих прямое прослушивание «по воздуху». В помещениях передачи и приема должны быть созданы акустические условия в соответствии с требованиями к испытуемой системе.

    В процессе испытаний пара операторов - вызывающий и отвечающий - получает от руководителя опытов соответствующие листы одного и того же номера с фигурами. Вызывающий оператор, начиная разговор, описывает своими словами первую из трех фигур, расположенных на его листе. Отвечающий оператор, перебивая вызывающего и задавая ему уточняющие вопросы, пытается опознать описываемую фигуру на своем листе. Опознав фигуру, отвечающий сообщает вызывающему ее словесное обозначение, после чего вызывающий, убедившись, что такое слово имеется в таблице слов на его листе, приступает к описанию второй, а затем и третьей фигур. Весь процесс такого разговора длится 3-5 минут, после чего оба оператора, не обмениваясь друг с другом мнением о качестве передачи, совершенно самостоятельно выставляют словесную оценку разговора в соответствии с таблицей 2.3.

    Процесс измерений считается законченным, когда все пары операторов произведут оценку качества разговора по описанной выше методике. По окончании измерений осуществляется обработка полученных данных, в результате чего определяется оценка качества передачи испытуемой телефонной системы.

    Преимущества метода мнений заключаются в следующем:

    1. Оценка качества передачи по методу мнений производится абонентами по степени напряженности их внимания, необходимого для ведения телефонного разговора. Очевидно, что степень напряженности внимания зависит от многих факторов, в том числе и от громкости, разборчивости, естественности звучания голоса говорящего и мешающего действия различных помех. Следовательно, оценка по методу мнений принадлежит к так называемой «интегральной» оценке.

    2. Положение микротелефонной трубки в пространстве, а также расстояние ото рта говорящего до микрофона устанавливается произвольно самими операторами, как и при обычном телефонном разговоре.

    3. Используемый для измерений речевой материал максимально приближается к обычному телефонному разговору.

    4. Оценка производится обычными абонентами, а не специально подобранной и тренированной бригадой операторов.

    5. Относительная простота постановки экспериментов и обработки результатов измерений.

    Недостатки метода мнений заключаются в следующем:

    1. При оценке качества передачи по этому методу абонент находится в весьма сложных психологических условиях, не свойственных условиям ведения обычного телефонного разговора. Так, в процессе ведения разговора он должен определить степень напряженности своего внимания и найти на заданной шкале оценок такую категорию, которая лучше других согласуется с его ощущениями.

    2. Степень напряженности внимания - это очень сложный с психологической точки зрения критерий, который сложно определить.

    3. Большой разброс оценок, так как категории определены недостаточно конкретно.

    4. Повышенные требования к наблюдателям в отношении их общего уровня развития.

    5. Трудность установления границ категорий, что требует от наблюдателей повышенного внимания.

    6. Несоответствие оценок, данных в одних условиях, оценкам, полученным в других условиях.

    7. Возникает погрешность «усреднения» - наблюдатели избегают применения крайних оценок.

    8. Возникает погрешность «снисходительности». Наблюдатель дает завышенные - положительная «снисходительность» - или заниженные - отрицательная «снисходительность» - оценки. Положительная «снисходительность» является, как правило, следствием привычности к данному возбудителю, отрицательная - следствием знания склонности к завышению оценок.

    Метод парных сравнений.
    Метод парных сравнений состоит в том, что наблюдателю предлагается путем сравнения двух возбудителей друг с другом высказать суждение (больше - меньше, лучше - хуже). Величины реакций на соответствующие возбудители вычисляются путем статистической обработки числа высказанных суждений в пользу того или иного возбудителя. В отличие от первого метода здесь значительно облегчается задача наблюдателей, так как от них требуется определить только различие в величинах реакций, не связывая это различие с категориями оценок. Данное обстоятельство приводит к устранению многих недостатков метода мнений.

    В случае оценки качества телефонной передачи возбудителем, очевидно, будет являться воспринимаемая абонентами речь.

    Системы телефонной связи, подлежащие оценке по методу парных сравнений, комбинируются во всевозможные пары, причем передача речи по любой паре систем может рассматриваться как парное возбуждение, а реакция абонентов на такое парное возбуждение - как мера оценки качества передачи.

    Качество передачи речи испытуемого тракта оценивают путем сравнения с эталонным трактом. Качество речи оценивают по следующим контрольным фразам, приведенным в ГОСТ Р 51061-97.


    1. Основные фразы


    1. Если хочешь быть здоров, советует Татьяна Илье, чисть зубы пастой «Жемчуг»!

    2. Вчера на Московском заводе малолитражных автомобилей состоялось собрание молодежи.

    3. В клумбах сочинской здравницы «Пуща», сообщает нам автоинспектор, обожгли шихту.

    4. Тропический какаду - это крупный попугай? Ты не злословишь?

    5. Актеры и актрисы драматического театра часто покупают в этой аптеке антибиотики.

    6. Нам с вами сидеть и обсуждать эти слухи некогда!

    7. Так ты считаешь, что техникой мы обеспечены на весь сезон?
    Примечание: Подчеркнуты слова, на которые делается фразовое ударение. Фразы 6, 7 произносят без пауз между словами.
    II. Дополнительные фразы

    1. Раз. Эти жирные сазаны ушли под палубу.

    2. Алло, слушаю! Кто у телефона? Ах, это Вы! Я был вчера у Вас.
    Бригада аудиторов должна состоять из 10-12 человек. Аудиторами не могут быть специалисты по кодекам речи. Число дикторов должно быть не менее 5 (мужчины и женщины).

    Каждую контрольную фразу диктор произносит два раза - один раз через оцениваемый тракт, другой - через эталонный тракт. Порядок чередования трактов - случайный. Контрольные фразы, произносимые диктором, могут быть записаны на магнитофон, а затем прослушаны аудиторами в записи. Пауза между фразами 2-3 с, пауза между парами фраз 4-5 с. (рис.2.5).

    Рис.2.5 Схема предъявления парных возбудителей.
    Парные возбуждения подаются в случайном порядке как в прямом, так и в обратном направлениях. Такой способ передачи обусловлен тем, что число суждений, высказанных в пользу той или иной системы, во многом определяется порядком следования систем в данной паре.

    Экспериментально было установлено, что система, следующая второй в паре, получает больше положительных суждений, чем в случае, когда она является первой, причем разница в числе положительных суждений тем больше, чем меньше объективная разница между системами, включенными в пару. Изменение порядка следования систем в каждой паре создает условия взаимной компенсации этой погрешности.

    Возможны два варианта оценки качества речи, либо по критерию «лучше - хуже», либо в баллах по пятибалльной шкале. В первом случае при прослушивании аудитор в бланке, образец которого приведен в приложении 5, ставит знак «+» в графе 1 или 2 в зависимости от того, какая фраза по его мнению звучит лучше. В том случае, если аудитор не может отдать предпочтение какому-либо варианту, он оставляет обе графы незаполненными. При подсчете числа предпочтений в случае незаполненных граф обоим вариантам засчитывается по 0,5.

    Результат испытаний оценивают средним числом предпочтений, вычисляемым по формуле


    (2.2)
    - число случаев предпочтений первой (второй) фразы;

    N - число единичных измерений.

    Далее вычисляют разницу чисел предпочтений по формуле
    , (2.3)
    где:
    -среднее число предпочтений первой фразы;

    - среднее число предпочтений второй фразы
    При разнице чисел предпочтения менее 15 % тракты считают одинаковыми, т. е. оцениваемый тракт передает речь с тем же качеством, что и стандартный (эталонный) телефонный тракт, и по показателю качества речи, измеренного по методу парных сравнений, пригоден для использования в телефонной сети.

    При менее или равным 75 % испытуемый канал вносит искажения, заметные только при парных сравнениях испытательных фраз и незаметные при реальном телефонном обмене. Такой канал по показателю качества речи, измеренного по методу парных сравнений, пригоден для использования в телефонной сети.

    Критерий «лучше - хуже» неприменим в случаях, когда и передаваемой по оцениваемому каналу передачи речи имеются искажения, хотя и не мешающие ее восприятию, но легко различимые сравнительно с обычным телефонным трактом, и обеспечивающие обычному телефонному тракту 100 % предпочтения. В этом случае качество речи по методу парных сравнений необходимо оценивать в баллах. При оценке трактов в баллах аудитор, прослушав одну и ту же фразу, прошедшую через сравниваемые тракты, выставляет в графах 1 и 2 оценки в баллах с точностью до 0,1, соответствующие по его мнению качеству того и другого тракта, руководствуясь таблицей 2.2 и имея в виду, что качество речи, передаваемой через стандартный канал, принято оценивать в 4 балла.
    Таблица 2.4. Соответствие между качеством речи и оценкой в баллах


    Характеристика качества речи

    Баллы

    Естественность звучания речи. Высокая узнаваемость. Полное отсутствие помех и искажений

    4,6-5,0

    Естественность звучания речи. Высокая узнаваемость. Отдельные малозаметные искажения или помехи

    4,0-4,5

    Естественность звучания речи. Высокая узнаваемость. Слабое постоянное присутствие отдельных видов искажений или помех

    3,5-3,9

    Незначительное нарушение естественности и узнаваемости. Заметное присутствие отдельных искажений или помех

    3,0-3,4

    Заметное нарушение естественности и ухудшение узнаваемости, присутствие нескольких видов искажений (картавость, гнусавость и др.) или помех

    2,5-2,9

    Существенное искажение естественности и ухудшение узнаваемости. Постоянное присутствие искажений типа картавость, гнусавость и др. или помех

    1,7-2,4

    Сильные искажения типа картавость, гнусавость и др. Механический голос. Наблюдается потеря естественности

    и узнаваемости

    <1,7


    При оценке результата измерений в баллах средний балл вычисляют по формуле
    (2.4)
    где:
    - результат единичного измерения;

    N- число единичных измерений.

    1   2   3   4


    написать администратору сайта