дипломная. 2Теоретическая часть 5 1Технология обработки звуковой информации 5

Название	2Теоретическая часть 5 1Технология обработки звуковой информации 5
Дата	11.02.2019
Размер	46.4 Kb.
Формат файла
Имя файла	дипломная.docx
Тип	Реферат #67242

Содержание

1Введение 2

2Теоретическая часть 5

2.1Технология обработки звуковой информации 5

3Пример 8

3.1Какие основные методы используются для обработки звука 8

3.2Автоматическое распознавание речи 11

4Практическая часть 12

4.1Структура и деятельность компьютерного магазина 12

5Структура учреждения 12

6Организация трудовой деятельности 12

6.1Конфигурация рабочего места 12

7Заключение 13

8Список литературы 14

1Введение

Программы для работы с аудиоинформацией (звуком). Для серьезной работы со звуковой информацией, как правило, требуется вызвать внешний аудиоредактор, то есть как раз программу для работы со звуком. В отличие от MIDI-секвенсеров, здесь качество программы определяется не только удобством и функциональностью интерфейса, не только наличием дополнительных утилит, но и собственно алгоритмами обработки. При одних и тех же условиях и параметрах на одном и том же звуковом материале разные программы могут дать совершенно непохожие результаты. Вообще говоря, звуковая информация — вещь «неуловимая»: порой незначительное изменение одного из многих параметров обработки может дать совершенно новый на слух результат. Так что, получив хорошие звуковые результаты, не поленитесь лишний раз записать получившийся файл на диск.

Перспективы развития и использования цифрового аудио видятся очень широкими. Казалось бы, все, что можно было сделать в этой области, уже сделано. Однако это не так. Остается масса еще совсем незатронутых проблем. Например, область распознавания речи еще очень не развита. Давно уже делались и делаются попытки создать программное обеспечение, способное качественно распознавать речь человека, однако все они пока не приводят к желаемому результату. А ведь долгожданный прорыв в этой области мог бы неимоверно упростить ввод информации в компьютер. Только представьте себе, что вместо набора текста его можно было бы просто надиктовывать, попивая кофе где-нибудь неподалеку от компьютера. Имеется множество программ якобы способных предоставить такую возможность, однако все они не универсальны и сбиваются при незначительном отклонении голоса читающего от заданного тона. Такая работа приносит не столько удобств, сколько огорчений. Можно надеяться, что когда-нибудь такое станет возможным, ведь человеческий мозг легко справляется с такими задачами, однако сегодня говорить о хотя бы малейших сдвигах в этой области рано.

Цель работ,Показать работу со звуком, на примере сайта со звуковой рекламой. Для ООО «Комп-Сити».

Актуальность работы, в том, что звуковая реклама очень хороша для восприятия человека и информативна.

И тем не менее многие сайты сегодня используют фоновую музыку или проигрывают звуковую заставку при входе. Этого делать нельзя по нескольким причинам:

посетитель не готов к тому, что сайт будет звучать;

у посетителя играет своя музыка;

фоновую музыку практически никогда нельзя выключить;

звук с сайта редко бывает хорошего качества;

при переходе на другую страницу сайта музыка пропадает на самом неподходящем месте — эффект еще хуже, чем от прослушивания радио в такси, где водитель ищет хорошую песню, переключаясь между станциями каждые две секунды;

смысловой и функциональной нагрузки у музыки на сайте — ноль целых, ноль десятых;

веб — среда текстовой и визуальной информации. Звук обитает во флеш-заставках (где действие связано со звучанием) или в аудиоформатах (которые прослушиваются обычно с помощью специализированных программ).

2Теоретическая часть

2.1Технология обработки звуковой информации

Даже первые персональные компьютеры отличались от калькуляторов и больших ЭВМ тем, что они могли издавать звуки с помощью маленького динамика, установленного в их корпусе. И хотя акустические возможности PC были более чем скромными, уже на заре компьютерной эры появились музыкальные редакторы, с помощью которых можно было создать "звуковой файл" для подключения к той или иной программе, написанной пользователем.

С появлением в 1989 г. звуковых карт перед пользователями открылись новые возможности. И дело даже не в том, что на порядок улучшилось качество звука. Появилась новая (звуковая) подсистема— комплекс программно-аппаратных средств, предназначенный для :

записи звуковых сигналов, поступающих от внешних источников, например, микрофона или магнитофона. В процессе записи входные аналоговые звуковые сигналы преобразуются в цифровые и далее могут быть сохранены на винчестере PC;
воспроизведения записанных ранее звуковых данных с помощью внешней акустической системы или головных телефонов (наушников). При воспроизведении звуковой сигнал считывается с носителя информации, преобразуется из цифрового в аналоговый и направляется к акустической системе;
микширования (смешивания) при записи или воспроизведении сигналов от нескольких источников;
одновременной записи и воспроизведения звуковых сигналов;
обработки звуковых сигналов: редактирования, объединения или разделения фрагментов сигнала, фильтрации, изменения его уровня и т. п.;
управления панорамой стереофонического звукового сигнала (кажущимся расположением источников звука) и уровнем сигнала в каждом канале при записи и воспроизведении;
обработки звукового сигнала в соответствии с алгоритмами объемного (трехмерного — 3DSound) звучания, что позволяет получить объемное звуковое поле даже при использовании обычной стереофонической акустической системы;
генерирования с помощью синтезатора звучания музыкальных инструментов (мелодичных и ударных), а также человеческой речи и любых других звуков;
управления работой внешних электронных музыкальных инструментов через специальный интерфейс MIDI (Musical Instrument Device Interface);
воспроизведения звуковых компакт-дисков;
выполнения таких операций, как управление компьютером и ввод текста с помощью микрофона.

Аппаратные средства для работы со звуковой информацией.

Звуковая система компьютера выполняется в виде самостоятельных звуковых карт, устанавливаемых в слот материнской платы, либо может быть интегрирована на материнскую плату или другой карту расширения. Отдельные функциональные модули звуковой системы могут выполняться в виде дочерних плат, устанавливаемых в соответствующие разъемы звуковой карты. Дочерняя плата обычно расширяет базовые возможности звуковой системы.

В классическую звуковую систему входят:

модуль записи и воспроизведения звука осуществляет аналого-цифровое и цифро-аналоговое преобразование звуковых данных;
модуль синтезатора;
модуль интерфейсов;
модуль микшера;
акустическая система - микрофон, колонки и т.п.

Первые четыре модуля, как правило, устанавливаются на звуковой карте. Каждый из модулей может выполняться в виде отдельной микросхемы или входить в состав многофункциональной микросхемы.

К программным средствам ввода и обработки звуковой информации относятся в основном:

музыкальные редакторы;
синтезаторы звуков, в частности, синтезаторы речи;
программы для распознавания речи;
звуковые редакторы;
редакторы оцифровок (сэмплов);
генераторы стилей;
программы для улучшения качества фонограмм и др.

3Пример

3.1Какие основные методы используются для обработки звука

Наиболее популярными программными средствами для синтеза, обработки и воспроизведения звука являются Adagio, TiMidity, Playmidi, Tracker, Gmod, MikMod, XAudio, S3mod, Nspmod, Yampmod и др.

Создание (синтез) звука в основном преследует две цели:

имитация различных естественных звуков (шум ветра и дождя, звук шагов, пение птиц и т.п.), а также акустических музыкальных инструментов;
получение принципиально новых звуков, не встречающихся в природе.

Обработка звука обычно наплавлена на получение новых звуков из уже существующих (например, голос робота), либо придание им дополнительных качеств или устранение существующих (напpимеp, добавление эффекта хора, удаление шума или щелчков).

Так же, как создание всевозможных анимационных эффектов и эффектов трехмерной графики базируется на использовании разнообразных математических методов, каждый из методов синтеза и обработки звука имеет свою математическую и алгометрическую модель. Именно это позволяет любой из них pеализовать на компьютеpе.

Прогpаммы обработки цифрового звука (Cool Editor, Sound Forge, Samplitude, Software Audio Workshop) дают возможность пpослушивать выбpанные участки, делать выpезки и вставки, амплитудные и частотные пpеобpазования, звуковые эффекты (эхо, pевеpбеpацию, фленжеp, дистошн), наложение дpугих оцифpовок, изменение частоты оцифpовки, генеpиpовать pазличные виды шумов, синтезиpовать звук.

Монтаж. Состоит в выpезании из записи одних участков, вставке дpугих, их замене, pазмножении и т.п. Hазывается также pедактиpованием. Практически каждый музыкальный редактор имеет такие возможности редактирования. Все совpеменные звуко- и видеозаписи в той или иной меpе подвеpгаются монтажу.

Амплитудные пpеобpазования, например, усиление/ослабление звука

Частотные (спектpальные) пpеобpазования, напpимеp, фильтpация - усиление или ослабление опpеделенных полос частот.

Фазовые пpеобpазования. Благодаpя тому, что слуховой аппаpат человека использует фазу для опpеделения напpавления на источник звука, фазовые пpеобpазования стеpеозвука позволяют получить эффект вpащающегося звука, хоpа и ему подобные.

Вpеменные пpеобpазования. Заключаются в добавлении к основному сигналу его копий, сдвинутых во вpемени на pазличные величины. Пpи небольших сдвигах (поpядка менее 20 мс) это дает эффект pазмножения источника звука (эффект хоpа), пpи больших - эффект эха.

Фоpмантные пpеобpазования опеpиpуют с фоpмантами - хаpактеpными полосами частот, встpечающимися в звуках, пpоизносимых человеком. Каждому звуку соответствует свое соотношение амплитуд и частот нескольких фоpмант, котоpое опpеделяет тембp и pазбоpчивость голоса. Изменяя паpаметpы фоpмант, можно подчеpкивать или затушевывать отдельные звуки, менять одну гласную на дpугую, сдвигать pегистp голоса и т.п.

Развитие систем ввода в ЭВМ и вывода из ЭВМ речевой информации обуславливает возможности расширения сферы эффективного применения вычислительной техники.

Обработка речевой информации включает в себя синтез речи и автоматическое распознавание речи.

Устное сообщение можно представить как последовательность элементарных звуков, называемых фонемами, и пауз между ними. От числа фонем, выделяемых в устной речи, зависит точность ее описания. На практике для кодирования русской устной речи выделяют порядка 40—45 фонем, каждой из которых ставится в соответствие кодирующее ее обозначение. Последовательность кодов, описывающих фонемы устного сообщения, вводится и хранится в памяти ЭВМ и при необходимости выводится из нее через специальные устройства, называемые синтезаторами речи.

В настоящее время сфера применения синтезаторов речи непрерывно расширяется — используются различные автоматизированные информационно-справочные системы, системы автоматизированного контроля, способные голосом предупредить человека о состоянии контролируемого объекта, и другие системы.

Разработаны устройства, позволяющие преобразовать письменный текст в соответствующее ему фонемное представление, что позволяет воспроизводить этот текст на экране дисплея или через синтезатор речи.

Программы для диктовки. DragonDictate, Office TalkKolvox Communication, Power Secretary, VoiceType Dictation.

Большой интерес вызывает синтез речи, в том числе реализация в виде речи произвольного текста, хранящегося в памяти компьютера. Вероятно вскоре многие программы и устройства "заговорят", сообщая пользователю о нештатных ситуациях, давая советы и информацию.

Немало усилий было положено на то, чтобы снабдить программы и операционные системы графическим интерфейсом пользователя. Сейчас новое направление - речевой интерфейс пользователя. Голосовые навигаторы управляют программами, в какой-то мере заменяя клавиатуру и мышь.

Голосовые навигаторы. PilotVoice, Listen, Just Voice, Speech Recognizer, QwickSwitchBitWare ,Voice Assist.

3.2Автоматическое распознавание речи

Растет популярность средств автоматического распознавания речи (Automated Speech Recognition, ASR). Системы ASR преобразуют речь в закодированный “письменный” текст. Для этого производится спектральный анализ оцифрованной речи и определяются с применением нейронных сетей или специальных математических моделей минимальные звуковые единицы языка - фонемы.

Существующие системы распознавания речи ориентированы или на слитную или на дискретную речь. Слитная (непрерывная) речь - это нормальная плавная человеческая речь. Если система рассчитана на дискретную речь, то... говорить... надо... с... паузами... между... словами.

Большинство систем зависимы от диктора - перед началом работы пользователь должен "обучить" программу, произнося определенный текст. Но есть и разработки, которые не требуют этого (speaker-independent - независимые от диктора).

В настоящее время словарь систем для распознавания слитной речи составляет порядка 2000 слов. Это существенно меньше словаря систем для дискретной речи (около 50 тысяч слов). Обычно чем меньше словарь, тем более непрерывной может быть речь, а система распознавания - менее зависимой от диктора.

Распознавание речи связано с большим объемом вычислений. Поэтому не все программы обходятся обычными звуковыми картами, некоторые требуют специализированных плат с цифровым сигнальным процессором, который уменьшает нагрузку на центральный процессор компьютера.

4Практическая часть

4.1Структура и деятельность компьютерного магазина

ООО «Комп-СИТИ»

ООО «Комп-СИТИ» имеет 4 своих магазина:

Г. Щелково, ул. Талсинская,д.1, Дом быта "Подмосковье".

Поселок Софрино 1, Торговый Центр "999"

Г. Ивантеевка, Первомайская 29, ТЦ "НАДЕЖДА"

Г. Щёлково, микрорайон Богородский, 2

5Структура учреждения

Директор

Заместитель

Управляющий магазином в Богородске

Управляющий магазином в Софрино

Управляющий магазином в Щёлково

Управляющий магазином в Ивантеевке

6Организация трудовой деятельности

6.1Конфигурация рабочего места

7Заключение

Обработка звука бывает разноплановой и зависит от целей, которые вы преследуете. Это может быть подавление шумов, наложение звуковых фильтров, добавление реверберации или дилея, выведение на передний план определённых частот и т.п.

Обработка звука в реальном времени с помощью модулей DirectX оказалась настолько привлекательной для многих музыкантов, что они начали активно использовать именно их, почти «забыв» о существовании основных функций программ обработки. Разумеется, семейство программ звуковой обработки не исчерпывается программами Sound Forge и Cool Edit Pro. Существуют и другие профессиональные программы, служащие тем же целям. Среди них можно особенно отметить WaveLab от компании Steinberg - программу, известную быстротой выполнения алгоритмов звукового преобразования. Она предоставляет также большие возможности по работе с записью Audio CD (звуковых компакт-дисков) и, кроме того, способна работать с подключаемыми модулями VST.

Довольно широко известна также программа Wave SE, входящая в стандартную поставку некоторых звуковых карт от компании Turtle Beach. Она предназначена в основном для работы с сэмплами, хотя имеет и традиционные возможности звуковой обработки. Однако алгоритмы обработки этой программы весьма далеки от совершенства.

Иными словами, цифровая обработка - это одна из перспективных областей высоких наукоемких технологий - high tech - привлекательная для приложения сил.

8Список литературы

http://www.mirhifi.ru/

http://vooch.narod.ru/read/obrabotka_zvuka.htm

http://cjcity.ru/news/all/edit-soft.php

http://www.geocities.com/SiliconValley/Pines/7899/studio/studio.htm

http://websound.ru/articles/theory/soundfaq.htm

http://www.vstpro.ru/category_3.html

http://www.interestprograms.ru/books_sound3.php

http://soundmake.narod.ru/teoriy/obr/3/3.html