Проектирование системы голосового управления периферийными устройствами. Проектирование системы голосового управления периферийными устро. Проектирование системы голосового управления периферийными устройствами по образовательной программе среднего профессионального образования
Скачать 2.07 Mb.
|
1 2 1.3 Состояние проблемы автоматического распознавания речи Задача машинного распознавания речи привлекает внимание специалистов уже очень давно. Тем не менее, продвинуться в этом направлении удалось относительно недалеко. Процесс распознавания речи представляет собой преобразование акустического сигнала, полученного от микрофона, в последовательность слов. Полученный набор гипотез цепочек слов далее используется для понимания речи. При этом возникает ряд проблем. Во-первых, человек обычно не делает паузы между словами, а при слитном произнесении к задаче распознавания прибавляется еще и задача выделения слов из потока речи, что заведомо более сложно. Возникает необходимость выделять односложные слова - именно с ними и связано максимальное число ошибок реально существующих систем. Можно потребовать, чтобы человек произносил слова по одному, делая достаточно продолжительные паузы или чтобы каждое следующее слово произносилось после звукового сигнала. Но данный подход не удобен и может быть применён только для подачи простых команд. Следующая проблема - различие голосов, диалектов, дикций, возрастных различий, эмоциональное и физическое состояния диктора. Значительное влияние вносит акустический аспект, т.е. смена микрофона, расположение микрофона относительно рта, акустическая обстановка в помещении. Наконец, последний, наиболее сложный для реализации, но одновременно и наиболее перспективный режим работы - распознавание без настройки на диктора. При этом гарантируется, что система распознает любое включенное в словарь слово, кем бы оно ни было произнесено. Здесь, как правило, словари насчитывают небольшое количество слов (обычно не более двух десятков) и существуют для относительно небольшого числа языков (примерно тридцати). Русский язык в это число хотя и входит, однако количество распознаваемых русских слов невелико. Создание словаря для распознавания речи без настройки на голос требует больших затрат. Для решения этой задачи разработчикам приходится опрашивать большое число (несколько сотен или тысяч) носителей языка, выделять некие общие элементы речи, усреднять их - и все этого для того, чтобы обеспечить распознавание десяти-двадцати слов. Чаще всего словарь без настройки на голос пользователя требует раздельного произнесения слов. Для целого ряда приложений этого, однако, оказывается вполне достаточно. Именно из-за этих и многих других проблем до полного решения задачи распознавания речи по-прежнему весьма далеко. Существует два существенно различающихся режима работы: с настройкой на голос определенного диктора и без такой настройки. Размеры словаря при работе с настройкой на диктора в настоящее время могут достигать нескольких (и даже многих) тысяч слов при слитном произнесении. Процедура настройки на диктора выглядит следующим образом: диктор читает некий специальным образом составленный текст, компьютер распознает слова и выдает вариант распознавания. Диктор помечает ошибки и читает текст снова. После нескольких таких итераций процесс сходится, и компьютер оказывается в состоянии распознавать речь. 1.4 Обзор устройств чтения аудио сигналов Первые записи звуков происходили методом непосредственного нарезания записи: через рогоподобные микрофоны вибрация воздуха передавалась на граммофонную иглу, которая и производила нарезание этих колебаний на поверхности вращающегося воскового цилиндра. Сегодняшние микрофоны преобразуют колебания воздуха в электрический сигнал, и хотя эта теория лежит в основе работы всех микрофонов, их различия заключаются в процессах производящих эти преобразования. Все разнообразие существующих моделей сводится к трём основным типам микрофонов. Динамический микрофон. Этот вид микрофонов пользуется особой популярностью среди вокалистов. По сравнению с остальными типами, динамические микрофоны обладают целым рядом достоинств: они сравнительно дёшевы и в то же время надежны, и могут успешно работать в областях высокого звукового давления. Устойчивость к громким звукам позволяет использовать эти микрофоны для снятия звуков ударов. Принцип его работы напоминает работу громкоговорителя, но в обратном режиме. Как и в громкоговорителе, для проведения преобразования здесь применяются колебания катушки индуктивности. Как видно из рисунка 1.1, катушка индуктивности, помещенная Рисунок 1.1 - Структура динамического микрофона. вокруг магнитного сердечника, осуществляет колебательные движения под воздействием давления воздушных волн, исходящих от источника звука. Генерация (появление) электрического тока возникает всякий раз, когда происходит перемещение катушки (если вы изучали физику, то должны помнить, что это явление называется законом Флеминга). Таким образом, попадающая в микрофон акустическая энергия преобразуется в электрическую, при этом, форма электрического тока соответствует характеру звуковых колебаний. Если произвести усиление этого тока и послать его к громкоговорителю, то можно будет услышать усиленный звук. Особенности внутреннего устройства динамических микрофонов ограничивают количество возможных типов диаграмм направленности: такие микрофоны могут быть только однонаправленными или всенаправленными. Кроме того, инерционность перемещающейся в магнитном поле катушки с проводом ограничивает воспринимаемый этими микрофонами частотный диапазон. На сегодняшний день различными фирмами разработано огромное количество различных динамических микрофонов стоимостью от единиц до тысяч долларов, причем многие модели специально ориентированы на то или иное конкретное применение. Конденсаторный микрофон. Конденсаторные микрофоны представляют собой более совершенный тип, чем динамические. Принцип их действия основан на изменении электрической ёмкости двух проводящих пластин при изменении расстояния между ними. Одна из этих пластин жестко закреплена в корпусе микрофона, а вторая (тонкая) выступает в роли мембраны. Колебания мембраны, вызванные колебаниями воздуха, приводят к изменению емкости. Для работы такого микрофона на его пластины необходимо подать электрическое напряжение. Для этого обычно используется напряжение в 48 Вольт (фантомное питание), подаваемое на микрофон непосредственно с предварительного усилителя или микшерного пульта. Эти микрофоны преимущественно используются профессионалами, потому что обеспечивают значительно более высокое качество звучания, но являются довольно дорогим типом микрофонов из-за сложности в производстве. Но с момента их появления они приобрели в наши дни большую популярность и стали распространенной моделью в музыкальном мире. Принцип построения конденсаторного микрофона показан на рисунке 1.2. Рисунок 1.2 - Структура конденсаторного микрофона При поступлении электрического тока на диафрагму и пластину, последние образуют конденсатор, когда звуковые колебания производят давление на диафрагму, они вынуждают ее перемещаться, что приводит к изменению расстояния между диафрагмой и пластиной, тем самым, меняя ёмкость между ними. Эти изменения соответствуют форме сигнала. Затем этот сигнал усиливается. Особенностью конденсаторного микрофона является то, что он использует электрический ток. Другая его характеристика заключается в применении легкой диафрагмы вместо тяжелых катушек динамических микрофонов, что означает большую чувствительность к звуку. Причем диафрагма конденсаторного микрофона может быть сделана сколь угодно тонкой (в разумных пределах), что позволяет добиться значительно более высокой чувствительности и способности к воспроизведению высоких частот. Поэтому частотный диапазон этих микрофонов значительно шире. Кроме того, конденсаторные микрофоны могут иметь практически любую диаграмму направленности. Звук, идущий из конденсаторного микрофона, отличается особым изяществом даже при резких на него звуковых воздействиях. Благодаря этим характеристикам конденсаторные микрофоны часто используются везде, где предъявляются высокие требования к качеству и точности воспроизведения звука. Низкая устойчивость к механическим нагрузкам делает их малопригодными для живых выступлений, однако при стационарном использовании они оказываются незаменимыми, особенно в тех случаях, когда требуется максимальная достоверность воспроизведения гармонических составляющих звука. В электроконденсаторном микрофоне диафрагма использует статическое электричество. Помните, как вы ребёнком натирали кусочек пластика? Он потом притягивал к себе волосы и пыль. Электроконденсаторный микрофон работает аналогично. Конденсатор этого микрофона не использует никакого электрического тока, и поэтому эти микрофоны характеризуются сравнительно невысокой стоимостью. Электроконденсаторный микрофон обладает теми же характеристиками, что и обычный конденсаторный: высокочастотная область работы и широкая динамика. В персональной магнитной записи лучшим вариантом будет применение как электроконденсаторного, так и динамического микрофонов. Электретные микрофоны Принцип действия электретных микрофонов аналогичен принципу действия конденсаторных, с тем отличием, что для их работы не требуется внешний источник питания. Мембрана таких микрофонов получает электрический заряд в процессе производства, и для их питания достаточно небольшого напряжения (обычно около 1,5 Вольта), которое обеспечивается установленной в микрофоне батареей. Также микрофоны подразделяются по направленности действия. Все они имеют свою направленность. В повседневной речи мы не используем этого понятия, но применительно к работе микрофонных систем это означает то направление или направления, откуда на микрофон могут поступать звуки. Существуют три типа микрофонов с точки зрения направленности: узконаправленные, бинаправленные и всенаправленные. Узконаправленные микрофоны принимают звуковой сигнал только из одного направления. Они характеризуются высокой чувствительностью к звуку, поступающему из прямого направления и крайне низкой чувствительностью к остальным звукам. Б инаправленные микрофоны хорошо принимают сигналы, идущие как с прямого, так и с обратного направлений. Всенаправленные микрофоны принимают звуковые сигналы, поступающие со всех направлений. На рисунке1.3 показаны схемы направленности этих трех типов микрофонов. Рисунок 1.3 - Направленность микрофонов. Угол снятия звука Под углом снятия звука (рисунок 1.4) понимается зона возможного расположения источника звукового сигнала, внутри которой не наблюдается значимой потери эффективности микрофона. Рисунок 1.4 - Схема снятия звука Для однонаправленных микрофонов (кардиоидных, суперкардиоидных, и т. д.) угол между центральной линией (см. рисунок) и точкой, где эффективность микрофона значимо падает (разница достигает 3 дБ), считается половиной угла снятия звука. Типичный показатель для кардиоидного микрофона составляет 131° (65.5° по обе стороны центральной линии), значения для других видов микрофонов: всенаправленный микрофон - 360°; кардиоидный микрофон - 131°; суперкардиоидный микрофон - 115°. Сбалансированные и несбалансированные микрофоны. Эти термины показывают, как посылается сигнал. Основная цель применения сбалансированного микрофона - в уничтожении электрических шумов. По этой причине, именно сбалансированный микрофон обычно применяется при профессиональных записях. Кабель для сбалансированного микрофона (рисунок 1.5) состоит из трёх проводников, которые принято называть «красный», «белый» и «экран». Рисунок 1.5 - Сечение кабеля для сбалансированного микрофона. Экран покрывает красный и белый провода, защищая их от нежелательных внешних электрических токов. Это особенно важно при использовании длинного кабеля для низкоомного микрофона. Для сбалансированного микрофона применяются разъемы, имеющие трехштырьковую контактную группу. Разница в распаивании между этими тремя контактами в том, что в европейском варианте контакт №3 - красный, а в американском и японском вариантах красным является контакт №2. Несбалансированные микрофоны используют в своих соединениях только два проводника, один из которых белый и экранный одновременно. Эти микрофоны вполне удовлетворяют различным требованиям, но только при небольшой длине кабеля. В качестве разъема для них применяют стандартный 1/4″ телефонный штекер. Сбалансированный микрофон может быть использован вместе с микшером, имеющим несбалансированные входы (такие как в МТ1Х и МТ2Х) при условии осуществления соответствующего распая разъемов. Для этого необходимо соединить контакты 1 и 3 микрофона с экраном (оболочкой) 1/4″ штекера и контакт 2 с его центральной жилой. Длина кабеля при подобном распае не должна превышать 6 метров. Таблица 1.2. Характеристики Crown PZM-11LLWRS1.
2 МОДЕЛЬ ГОЛОСОВОГО УПРАВЛЕНИЯ ПЕРИФЕРИЙНЫМИ УСТРОЙСТВАМИ 2.1 Предпосылки к созданию «умной» системы Еще в далеком прошлом из-под пера писателей-фантастов выходили рассказы о том, как изменится жизнь в будущем: появятся сложные технологии, роботы, а люди доведут все до автоматизма. Например, в популярном романе Рэя Брэдбери «Будет ласковый дождь», увидевшем свет в 1950 году, очень ярко и подробно описывается жизнь Умного дома, выжившего после военных действий. Но на деле технический прогресс шел намного медленнее человеческой мысли. История возникновения Умного дома зародилась в начале 60-х годов, когда появился на свет диммер — прибор для регулировки яркости света. Авторами этого приспособления стала чета Спира. Это было первым шагом к реализации идеи автоматизации дома. В 70-х годах некоторые богатые граждане Соединённых Штатов задумались о том, как сделать свою жизнь комфортнее. Тогда и появилась идея передачи информации для управления приборами по одному кабелю. Учитывая, что именно в этот период технологии шагнули далеко вперед, каждое новое кабельное внедрение устаревало еще до того, как здание переходило в эксплуатацию. В конце двадцатого века на рынке техники появились транзисторы, цифровые контроллеры, микросхемы и другие элементы, которые можно было программировать. Они стали эффективно вытеснять с мирового рынка своих аналоговых конкурентов, которые значительно уступали по производительности. Именно тогда и начали появляться первые варианты Умных домов, похожих на современные. Первый Умный дом появился в Англии. Его разработчикам удалось реализовать регулировку тепла, системы безопасности, сигнализации, управление открытием и закрытием дверей в гараже. В начале 90-х произошел настоящий рывок: на рынке радиоэлектронных компонентов появились различные датчики, сенсоры, логические элементы, вычислительные компоненты и другие детали, которые становились важными компонентами Умного дома. Именно тогда появились и первые программы, которые описывали логику управления Умным домом. Одним из последних значимых событий, повлиявших на ход истории Умного дома, стало появление технологии беспроводной связи Wi Fi. Количество проводов сократилось до минимума, автоматизация значительно удешевилась и стала доступной для широких масс. Сегодня благодаря Интернету и локально-вычислительной сети система Умный дом может осуществлять управление всеми инженерными системами и приборами с помощью смартфона или специальной панели управления. Это комбинация проводной и беспроводной систем, где программное обеспечение может управлять светом, температурой, вентиляцией, безопасностью, видеонаблюдением и многим другим. Основным элементом этой системы является микрокомпьютер, который может включить и выключить нужный прибор, изменить настройки, запустить сценарий действий, настроенный под предпочтения и желания хозяина. Теперь Умный дом — не просто фантастические рассказы писателей, а реальная технология, которая родилась благодаря техническому прогрессу. 2.2 Область применения устройств автоматического управления голосом В настоящее время все больший интерес приобретают системы распознавания речи, что обусловлено широким распространением мобильных устройств. Применение голосового управления к данным устройствам, ввиду ограниченности интерфейсов ручного ввода привело бы к расширению их возможностей и упрощению в использовании. Существующие технологии распознавания, как правило, не имеют широкого распространения ввиду ограничения их по одному или нескольким параметрам. Например, основная доля систем, позволяющих распознать большинство пользовательских запросов требуют подключения к сети Интернет (к удаленным серверам, на которых происходит обработка запросов), поскольку недостаточно их вычислительной мощности и ограниченности памяти, выделенной под словарь. По состоянию на 2012 год объем рынка систем распознавания речи оценивается в миллиард долларов США и планируется его рост. Большим спросом пользуется голосовая биометрия в судебно-медицинских и военных целях и является основным «драйвером» рынка. К одним из первых программ для коммерческого использования можно отнести Voice Navigator, Dragon NaturallySpeaking и другие. Начало использования таких программ датируется началом девяностых годов. В основном, их используют люди с ограниченными возможностями, набор текста большого объема для которых является проблематичным. Преобразуя голосовое сообщение диктора в текст, данные программы позволяют не использовать руки при печатании. Качество перевода у данных программ довольно низкое, однако со временем оно существенно улучшается. В результате усовершенствования производительности мобильных устройств стало возможным применение в приложениях к ним технологий по распознаванию речи. К такому приложению можно отнести Microsoft Voice Command. Так, данное приложение позволяет управлять многими функциями 7 при помощи голоса. К примеру, можно создать документ, набрать сообщение или воспроизвести музыкальный файл в плеере. Можно найти следующее применение распознаванию речи в повседневной жизни, например, доктору в поликлинике вместо того чтобы заполнять вручную медицинскую карточку больного достаточно просто проговорить диагноз и данные о больном. В качестве другого примера можно привести систему «умный дом», где голосовые команды используются для управления электрикой в доме, к примеру, включением или выключением света, кондиционером, и т.д. Так, во многих приложениях на современных мобильных устройствах все больше применяются системы автоматического распознавания речи. Важно то, что данные применяемые системы, независимы от диктора и способны распознавать голос любого человека. Следующим этапом во внедрении технологий распознавания отмечается применение интерфейсов безмолвного доступа (SSI). Данные системы основаны на обработке речи на начальной стадии артикулирования. Однако можно выделить значительный недостаток современных систем распознавания речи, это: слишком высокая чувствительность к воздействию шумов, т.е необходимо довольно разборчиво и четко произносить голосовые команды вовремя обращении к системе по распознаванию. Отметим, что SSI основан на подходе заключающимся в использовании сенсоров не подверженных влиянию шумов в качестве дополнения к обработанным акустическим сигналам. Можно выделить пять основных способов распознавания речи: 1. Распознавание отдельных команд – в данном способе требуется раздельно произносить слово\словосочетание, а затем проводится его распознавание. Качество распознавания данного способа ограничена размером имеющегося 2. Распознавание по грамматике – в данном способе проводится распознавание уже по фразам, которое соответствует определенному набору правил. Грамматика здесь задается путем использования стандартных XML- 8 языков, а обмен данными между системой распознавания и приложением осуществляется по протоколу MRCP. 3. Поиск ключевых слов в потоке слитной речи – в данном способе распознавание проводится по отдельным участкам речи. Здесь речь вполне может быть, как соответствующая набору неких правил, так и соответствующей определённым правилам. В данном методе нет необходимости переводить весь текст - в ней находятся лишь те участки, которые содержат заданные слова или словосочетания. 4. Распознавание слитной речи на большом словаре – в данном методе, сказанная фраза, дословно преобразуется в текст. При этом достоверность данного метода достаточно высока. 5. Распознавание речи с помощью нейронных систем – является довольно сложным методом, однако на основе нейронных сетей появляется возможность создания обучаемых и самообучающиеся систем, что является важной предпосылкой для их применения в системах распознавания (и синтеза) речи. 2.3 Подбор устройств для разработки аудиосистемы При работе с микрофоном есть такие понятия как «сопротивление» или «импеданс». Это электротехнический термин, который показывает степень сопротивления переменному току, измеряемую в Омах. С точки зрения сопротивления различают высокоомные (10-50 кОм) и низкоомные (50-600 Ом) микрофоны. Если выходное сопротивление микрофона не соответствует входному сопротивлению усилителя, это может привести к снижению отношения полезного сигнала к шуму. На это следует обращать внимание. Хотя эти два сопротивления не должны быть практически совершенно одинаковыми, микрофонное сопротивление должно находится в допустимых границах величины сопротивления усилителя. Если усилитель обладает низкоомным входом, то выходное сопротивление микрофона должно быть таким же. Если вы подсоединяете высокоомный микрофон к низкоомному входу усилителя, то произойдет снижение мощности сигнала. С другой стороны, при соединении низкоомного микрофона с высокоомных входом усилителя, звук может приобрести окраску дисторшена, хотя, в общем смысле, это и не является большой проблемой. Преимущество практического использования низкоомного микрофона заключается в его низкой чувствительности к шумам, даже при длинных кабельных соединениях. 2.3.1 Выбор микрофона. При выборе микрофона следует учитывать как всю совокупность его технических характеристик, так и условия записи, поэтому конкретные рекомендации дать довольно трудно. Однако общие правила выбора микрофона все же существуют. Ненаправленный микрофон можно применять при записи голоса и звуков в сильно заглушенном помещении. Его же следует использовать для передачи общей акустической обстановки при многомикрофонной записи. Односторонне направленный микрофон с характеристикой типа «кардиоида» желательно применять при записи в помещении с большим количеством звуковых отражений. Применяют его и в том случае, когда в помещение, где проводят запись, проникают посторонние шумы. Микрофон следует устанавливать тыльной стороной к источнику звуковых помех. Такой микрофон рекомендуется использовать при широком фронте размещения исполнителей. Этот микрофон применяют при маловероятной в любительских условиях многомикрофонной записи для четкого разделения групп звуков, а также при размещении источника звука близко к микрофону, чтобы снизить низкочастотные искажения, присущие в этом случае ненаправленному и двусторонне направленному микрофонам. Двусторонне направленный микрофон с диаграммой типа «восьмерка» следует применять при записи в заглушенном помещении, когда необходимо увеличить относительный уровень переотраженных сигналов, а также при записи отдельных звуков и голосов для выделения низких частот в условиях близкого размещения, источников звуков у микрофона. Используют такой микрофон и в том случае, когда необходимо отстроиться от направленных источников шума. Для этого микрофон ориентируют зоной нулевой чувствительности к источнику шума. Двусторонне направленный микрофон, сориентированный в горизонтальном направлении, оказывается полезным для ослабления звуковых волн, отраженных от пола, потолка и боковых стен помещения. Это позволяет применить акустическую обработку только двух стен: за источником звуковых волн и напротив него. Для окончательного выбора нужно определиться в каком звуковом поле будет использоваться микрофон. 2.3.2 Прямое звуковое поле. Понятие «прямое звуковое поле» описывает тот случай, когда звук достигает микрофон, не отражаясь предварительно от стен, потолка пола или других поверхностей (см. рисунок 2.1). Рисунок 2.1 - Прямое звуковое поле и отраженный звук Если микрофон находится в прямом звуковом поле, вы можете направить его зоной нулевой чувствительности к источнику нежелательного шума. Этот приём помогает существенно сократить эффект обратной связи и избежать утечки звука. 2.3.3 Отражённое звуковое поле. Понятие «отражённое (реверберационное) звуковое поле» описывает ситуацию, когда звук перед тем, как достигнуть микрофон, отражается о стены, потолок, пол или другие поверхности (см. рисунок 2.2). Рисунок 2.2 - Отраженное звуковое поле В данном случае, для полного контроля над нежелательными шумами недостаточно манипуляций с зоной нулевой чувствительности микрофона. Однако и в отражённом звуковом поле однонаправленные микрофоны обеспечивают более надёжную защиту от эффекта обратной связи и посторонних сигналов по сравнению с всенаправленными. Чем уже угол снятия звука микрофона, тем лучше он справляется с данной задачей. В этой связи, наиболее эффективны суперкардиоидные микрофоны, затем идут микрофоны с кардиоидной направленностью. Численной мерой эффективности микрофона в отражённом звуковом поле является коэффициент направленности (directivity index), который находится в обратной зависимости от угла снятия звука. Значения коэффициента для микрофонов с различными диаграммами направленности представлены в таблице 2.1: Таблица 2.1 - Диаграммы направленности.
Данные таблицы свидетельствуют о том, что коэффициент направленности суперкардиоидного микрофона в 1.9 раза превышает соответствующий показатель для всенаправленного микрофона. В реальных условиях это выражается в следующем: в отражённом звуковом поле суперкардиоидный микрофон снимает на 5.7 дБ меньше реверберационных шумов [17,18,19,20]. Исходя из изложенного выше стоит остановить выбор на микрофоне Crown PZM-11LLWRS1 (рисунок 2.3). Это поверхностный всенаправленный стереомикрофон самого высокого качества, с небольшим внутренним сопротивлением, представляющий собой панельный микрофон пограничного слоя, широко применяемый в системах наблюдения и безопасности, монтирующийся в стену, стандартную коробку для электрической розетки или выключателя. Внешне устройство совсем не похоже на микрофон, что позволяет использовать его там, где привлечение внимания к нему нежелательно. Оптимально размещённые друг относительно друга, элементы данного микрофона обеспечивают запись стереозвука в самом высоком качестве, позволяя достичь его беспрецедентного реализма. Модель обладает прочным и надёжным корпусом, резиновой подкладкой, защищающей от вибраций, которые могут вызывать помехи. Устройство имеет встроенный частотный фильтр, позволяющий снизить уровень ненужных шумов. Кроме того, частотная характеристика модели оптимизирована для озвучивания человеческой речи. Рисунок 2.3 - Микрофон Crown PZM-11LLWRS1. 3 РАЗРАБОТКА УСТРОЙСТВА ДЛЯ ГОЛОСОВОГО УПРАВЛЕНИЯ ПЕРИФЕРИЙНЫМИ УСТРОЙСТВАМИ 3.1 Разработка архитектуры системы управления периферийными устройствами Архитектурная схема умной системы представлена на рисунке 3.1. Источником сигналов является сам человек. Устройства, следящие за человеком (микрофоны, видеокамеры, сенсоры и др.) располагаются по всей комнате (зданию) и постоянно сканируют, исходящие от человека звуки и проделываемые им жесты, обрабатывая их в блоке обработки аудио и видео сигналов (чем больше количество этих устройств, тем лучше и точнее он распознаётся). После чего сравнивает их с базой данных, определяя при этом какую команду ей нужно выполнить. Далее эта информация поступает в систему управления периферийными устройствами в виде двоичного кода. В конечном итоге эта система, в зависимости от кода, включает или выключает то или иное электрическое устройство. Рисунок 3.1 - Архитектурная схема «умной системы» 3.2 Разработка схемы управления электрическими устройствами Схема голосового управления электрическими устройствами представлена на рисунок 3.2. Она состоит из трёх основных частей: четырех поверхностных всенаправленных микрофонов Crown PZM-11LLWRS1, блока обработки аудио сигналов и системы управления периферийными устройствами. Принцип действия её прост: звук от человека с помощью микрофона передается в блок обработки аудио сигналов, который представляет собой ПЭВМ с ОС Windows’2019 и выше с соответствующим программным обеспечением, со встроенной картой аудио-захвата. Рисунок 3.2. Схема голосового управления электрическими устройствами Примером может послужить аудиокарта Audiomedia III от фирмы Digidesign, имеющая 8 встроенных процессоров звуковой обработки, электронных регуляторов громкости и баланса и эквалайзеров, встроенный стереорегулятор мастер канала и панорамы и четыре электронных регулятора для входов. В этом блоке сканируются все сигналы, идущие от микрофона. При распознавании из потока слов голосовой команды, например «включить свет», программа ищет в базе данных голосовых команд какой код соответствует этой самой команде. Таким образом голосовая команда преобразуется в простейший двухразрядный сигнал и по шине данных поступает в СУПУ, где происходит уже непосредственное включение электромеханических устройств. 3.3 Описание построения структурной и принципиальной схемы работы устройства Была поставлена задача следующего плана: необходимо было разработать «умную систему», которая с помощью голоса могла включать и выключала в помещении электромеханические устройства — это кондиционер, обогреватель, вентилятор и три вида освещения: верхнее, боковое и полное. А также обеспечивала их независимую друг от друга работу. Задача разработки системы была решена (рисунок 3.3) с помощью программируемой микросхемы КР1533ИР35, предназначенной для фиксации данных, приходящих с ПЭВМ. Рисунок 3.3 - Принципиальная схема включения электромеханических устройств Микросхема запрограммирована таким образом, что при приходе сигнала «1» на вывод D0, цепь замыкается по Q0. В таблице 3.1 приведены голосовые команды и соответствующие им комбинации сигналов. Таблица 3.1 Комбинации голосовых команд и кодов.
При команде «выключить все» на все выводы D0 - D4 подаются «0», и все цепи размыкаются. Рассмотрим принцип действия этой схемы на одном из примеров. Пусть на блок обработки аудосигналов пришла команда «включить свет». По шине данных от ПЭВМ к микросхеме с частотой в несколько килогерц поочередно начинают приходить сигналы «1,0,0,0,0» и «0,1,0,0,0» по входам D0, D1, D2, D3 и D4 соответственно. Регистр сравнивает эти сигналы с запрограммированными и замыкает цепь на выводы Q0 и Q1, через которые начинает течь ток. В результате этого в работу включаются оптроны V1 и V2, включая цепь бокового и верхнего освещения. В результате у нас в комнате загорается весь свет! Если за этим последует команда «выключить верхний свет», блок обработки аудосигналов перестает подавать сигнал с кодом «0,1,0,0,0», но не прекращает подачу импульсов бокового света. В конечном итоге цепь по выходу Q1 размыкается, на оптрон V1 перестает приходить ток и он размыкает цепь верхнего освещения., в результате чего остаётся гореть только боковой свет. Для работы оптронов и блока управления периферийными устройствами в целом был разработан источник вторичного питания напряжением пять вольт, питающийся от общей сети переменного тока. Разработанную систему можно применять практически везде: как дома, так и различных отраслях промышленности. Она делает работу с возможной для людей с ограниченными возможностями или вовсе не имеющих возможности пользоваться традиционными средствами интерфейса (инвалиды). А также позволяет уменьшить время исполнения какого-либо действия, которое сопровождается хоть и незначительной, но физической нагрузкой и как следствие потерей полезного времени. Структурная и принципиальная схема работы устройства приведены в Приложении 1 и 2. 3.4 Мероприятия по противопожарной безопасности Анализируемое оборудование может стать источником пожара при неисправностях токоведущих частей. Наиболее частые причины пожаров: перегрев проводов; короткое замыкание; большие переходные сопротивления в электрических сетях. Одним из условий обеспечения пожарной безопасности является применение автоматических средств обнаружения пожаров, так как это позволяет своевременно известить о пожаре и принять меры к быстрой его ликвидации. В данном помещении устанавливаются дымовые пожарные извещатели. Для обеспечения современных мер по обнаружению и локализации пожара, эвакуации рабочего персонала, а также для уменьшения материальных потерь необходимо выполнять следующие условия: – наличие системы автоматической пожарной сигнализации; – наличие эвакуационных путей и выходов; – наличие первичных средств тушения пожаров: пожарные стволы, внутренние пожарные водопроводы, сухой песок, огнетушители. ЗАКЛЮЧЕНИЕ С научно-техническим развитием, автоматизация постепенно внедряется во все сферы человеческой жизни, в том числе и в его дом. Голосовое управление является неким способом взаимодействия устройства и человека с помощью голоса. В будущем, возможно, голосовое управление заменит людям сенсорное. Оно предназначено для ввода входящих команд при помощи голоса. Все это возможно с развитием технологий. Сегодня множество компьютерных гигантов занимаются разработкой систем в этой области Пока что говорить о полноценном общении с машиной не приходится. Однако существует целый ряд голосовых программ, которые позволяют отдавать простые команды, не прибегая к помощи пальцев. Следует отметить, что уже множество компьютерных систем, автомобилей, лифтов и роботов могут похвастаться наличием голосового управления. Сейчас данная функция во многих системах работает не всегда корректно, либо оператору после каждого слова приходится выдерживать длинные паузы, чтобы компьютер распознал речь и выполнил команду правильно. Чтобы в будущем пользоваться такой системой ввода данных, разработчикам необходимо упорно работать над системами распознавания голоса, потому что такие команды значительно экономят драгоценное время человека, особенно, когда нужно принять экстренное управленческое решение. Мечта человечества о комфортной жизни, где большинством домашних процессов будут управлять роботы или компьютеры, постепенно становится реальной благодаря современным системам «Умный дом». Это система домашней автоматизации, которая позволяет осуществлять эффективный контроль безопасности, систем газо-, водо- и теплоснабжения, температурного режима, освещения и так далее. Контроль осуществляется с помощью ряда устройств, главным из которых является панель управления. Есть также возможность управлять «Умным домом» с помощью телефона и интернета. Одним из наиболее перспективных направлений сегодня считается разработка управления системой домашней автоматизации с помощью голоса. Целью данной выпускной квалификационной работы явилась реализация простой и надежной системы управления освещением и климат-контролем в голосовом режиме. Эта функция призвана обеспечить необходимый комфорт и уют в жилой квартире или любом другом помещении, обеспечить дизайн и стиль, соответствующий современным мировым стандартам. Рассмотрен вопрос аппаратной реализации подсистемы голосового управления. Представлена структурная схема модульного типа подсистемы голосового управления на основе программируемой микросхемы КР1533ИР35. В соответствии со структурной схемой проведены выбор и обоснование аппаратных средств для системы. На основании подобранных элементов аппаратной реализации разработана схема электрическая принципиальная соединений подсистемы голосового управления Но самое главное - то, что основной целью такой автоматизации является комфорт. Поэтому система умного дома — это самая комфортная система управления домом или офисом на сегодняшний день. Список литературыЧащина Е.А. Обслуживание аппаратного обеспечения персональных компьютеров, серверов, периферийных устройств, оборудования и компьютерной оргтехники. – М.: Академия, 2016. Киселёв С.В. Оператор ЭВМ. – М.: Академия, 2016. Богомазова Г.Н. Установка и обслуживание программного обеспечения персональных компьютеров, серверов, периферийных устройств и оборудования: учеб. для студ. учреждений сред. проф. образования / Г.Н.Богомазова. – 2-е изд., испр. – М.: Издательский центр «Академия», 2019. – 256 с. – https://www.academia-moscow.ru/reader/?id=374065 Михеева Е.В. Практикум по информационным технологиям в профессиональной деятельности: учеб. пособие для студ. учрежде-ний сред. проф. образования / Е.В.Михеева, О.И.Титова. – 4-е изд., стер. – М.: Издательский центр «Академия», 2019. – 288 с. – https://www.academia-moscow.ru/reader/?id=416917 Остроух А.В. Выполнение работ по монтажу, наладке, эксплуатации и обслуживанию локальных компьютерных сетей: учебник для студ. учреждений сред. проф. образования / А.В.Остроух. – М.: Издательский центр «Академия», 2018. – 160 с. – https://www.academia-moscow.ru/reader/?id=349633 Нормативная документация ГОСТ 2.701-84 ЕСКД. Схемы. Виды и типы. Общие требования к выполнению ГОСТ 2.743-91 ЕСКД. Обозначения условные графические в схемах. Элементы цифровой техники. ГОСТ 19.701-90 Единая система программной документации. Схемы алгоритмов, программ, данных и систем. Условные обозначения и правила выполнения ГОСТ 2.105-95 Общие требования к текстовым документам. ГОСТ Р 7.0.5-2008 Библиографическая ссылка. Интернет – ресурсы: 11. https://moluch.ru/archive/277/62675/ - Казачкин, А. Е. Методы распознавания речи, современные речевые технологии / А. Е. Казачкин. — Текст: непосредственный // Молодой ученый. — 2019. — № 39 (277). — С. 6-8. 12. https://frolov-lib.ru/books/hi/ch05.html - Синтез и распознавание речи. Современные решения, А.В. Фролов, Г.В. Фролов 13. https://habr.com/ru/post/177099/ - Способы оценки субъективного качества речи, Хабр 14. https://amperka.ru/blogs/projects/abot-robot-part-3 - Как сделать робота на ROS своими руками. Часть 3: распознавание речи для голосового управления / Амперка ПРИЛОЖЕНИЕ 1 Структурная схема устройства ПРИЛОЖЕНИЕ 2 Принципиальная схема устройства 1 2 |