Расчетно графическая работа сводный анализ нейронных систем распознавания аудио материалов
Скачать 1.69 Mb.
|
Построение модели системы анализа нейронных систем2.1 Определение входов и выходаОпределим модель системы в виде схемы, отображающей входы, внутреннее состояние системы и выход (рис. 17). Рис. 17 Демонстрация модели системы На таблице 2 представлено разделение входов по их типам (табл. 3). Таблица 3
Цели системы.Цель – анализ систем распознавания речи по выбранным метрикам. Главной целью системы является поиск наиболее удачного средства распознавания речи. Второстепенные цели возникающие в процессе проведения работ: Поиск рабочих систем для их анализа. Наработка датасета данных для проведения анализа. Настройка оборудования для проведения тестирования. Подготовка к проведению тестовДля проведения сравнительного анализа систем распознавания речи были отобраны 9 средств (наиболее распространённых): Ashmanov Google (default) Google (enchanced) Sber (IVR) Sber Silero Silero new Tinkoff Yandex Проведение тестирования будет происходить на машине, имеющей вычислительные устройства как: процессор – i7 -12700KF, видеокарта RTX 2080Ti. Проверка качественного показателя WERДля проверки качественного показателя (и в дальнейшем) WER были выбраны датасеты длинною в 1 час. Тематики данных датасетов различны, и не повторяются (чтение, публичные выступления, звонки (такси) и т.д.). На таблице 3 представлены данные по метрике WER (%) (чем ниже показатель, тем лучше): Таблица 4 Показатель метрики WER
Пустые ячейки таблицы означают то, что результат исследования в данном сервисе \ датасете не является объективным для приведения его в сводную таблицу (возникали ошибки в процессе исследования или невозможность проведения тестирования). Из таблицы следует, что лучший результат в процессе тестирования показал сервис Silero New. Его среднеарифметический показатель WER оказался наименьшим. |