Главная страница
Навигация по странице:

  • 3.3 Параметры дискретизации

  • 3.4 Задачи по кодированию звука Задача 1.

  • Задача 2.

  • Задача 3.

  • Лекция 4. Средства мультимедиа. Компьютерная графика

  • 4.1 Понятие компьютерной графики

  • камальдинова. Мультимедиа технологии


    Скачать 6.03 Mb.
    НазваниеМультимедиа технологии
    Анкоркамальдинова
    Дата23.05.2023
    Размер6.03 Mb.
    Формат файлаpdf
    Имя файла440020236.pdf
    ТипУчебное пособие
    #1153250
    страница4 из 37
    1   2   3   4   5   6   7   8   9   ...   37
    3.2 Кодирование и обработка звуковой информации на компьютере
    С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию.
    Звук – это волна с непрерывно меняющейся частотой и амплитудой.
    Одним из важнейших параметров звуковой волны является ее частота – величина, обратная периоду колебания. Частоту звука принято измерять в герцах (Гц) или килогерцах (1 КГц = 1000 Гц). Например, если частота звука равна 20 Гц, это означает, что в течение 1 с. происходит 20 полных колебаний. С частотой колебаний неразрывно связана длина волны – расстояние, которое волна успевает пройти за время одного периода колебаний (длина волны = скорость звука / период). Очевидно, что с увеличением частоты длина волны уменьшается: чем меньше период колебания, тем меньшее расстояние проходит волна. От частоты напрямую зависит тон: чем выше частота – тем выше тон.
    Амплитуда звуковой волны – максимальное отклонение сигнала от нуля на некотором интервале времени. Она характеризует величину уровня звукового давления и интенсивность звука. Громкость звука определяется амплитудой: чем выше амплитуда – тем громче звук.
    Многолетние исследования доказывают, что чувствительность нашего слуха существенно зависит от частоты звука. Частотный диапазон звуков, которые способен услышать человек, достаточно велик. Считается, что нижняя граница частоты слышимых звуков составляет 16 – 20 Гц, верхняя –
    18 – 20 КГц. Волны с частотами, лежащими ниже частотного диапазона, воспринимаемого человеком, называются инфразвуковыми, а лежащими выше – ультразвуковыми. Ни инфразвуки, ни ультразвуки человеческое ухо не воспринимает.

    43
    Звуковой волной простейшей формы является, например, чистый звуковой тон определенной частоты. Однако распространяющиеся в воздухе звуковые волны обычно имеют более сложную форму, особенно если частицы воздуха подвергаются одновременному воздействию нескольких волн, которые, к тому же, распространяются в различных направлениях. В этом случае наблюдается явление интерференции – сложение волн.
    Рис. 3.1 – Восприятие звука
    Звук делится на два вида:
    1. Аналоговый (непрерывный).
    2. Дискретный (цифровой).
    Если преобразовать звук в электрический сигнал (например, с помощью микрофона, подключенного к звуковой плате), то видно плавно изменяющееся с течением времени напряжение. Для компьютерной обработки такой – аналоговый – сигнал нужно каким-то образом преобразовать в последовательность двоичных чисел.
    Делается это так – непрерывная звуковая волна разбивается на отдельные участки – «ступеньки». Каждой «ступеньке» присваивается код громкости звука. Чем больше таких ступенек, тем точнее кодирование звука.
    Этот процесс называется дискретизацией (или оцифровкой).

    44
    Звуковая волна – это некая сложная функция, зависимость амплитуды звуковой волны от времени. Казалось бы, что раз это функция, то можно записать ее в компьютер «как есть», то есть описать математический вид функции и сохранить в памяти компьютера. Однако, практически это невозможно. Звуковые колебания нельзя представить аналитической формулой, как y=COSx, например. Остается один путь – описать функцию путем хранения ее дискретных значений в определенных точках. Говоря другими словами, в каждой точке времени можно измерить значение амплитуды сигнала и записать в виде чисел.
    Однако и в этом методе есть свои недостатки, так как значения амплитуды сигнала мы не можем записывать с бесконечной точностью, и вынуждены их округлять. То есть, мы будем приближать эту функцию по двум координатным осям: амплитудной и временной. Приближать в точках – значит, брать значения функции в точках и записывать их с конечной точностью. Таким образом, оцифровка сигнала включает в себя два процесса: процесс дискретизациит. е. осуществление выборки ипроцесс квантования.
    Процесс дискретизации процесс получения значений величин преобразуемого сигнала в определенные промежутки времени. Сэмплрэйт
    (samplerate) – частота дискретизации (или частота сэмплирования) – частота взятия отсчетов непрерывного во времени сигнала при его дискретизации (в частности, аналого-цифровым преобразователем – АЦП). Измеряется в герцах (Гц).

    45
    Рис.3.2 Частота дискретизации
    Квантование – процесс замены реальных значений сигнала приближенными с определенной точностью. Битрэйт (bitrate) – уровень квантования, объем информации в единицу времени (bits per second). То есть, какое количество информации о каждой секунде записи мы можем потратить. Измеряется в битах (bit).
    Рис.3.3 Квантование
    Частоты квантования показывают, сколько раз в секунду берутся выборки сигнала для преобразования в цифровой код. Обычно они лежат в пределах от 4-5 КГц до 45-48 КГц.

    46
    Разрядность квантования характеризует число ступеней квантования и изменяется степенью числа 2. Так, 8-разрядные аудиоадаптеры имеют 28 =
    256 степеней, что явно недостаточно для высококачественного кодирования звуковых сигналов. Поэтому сейчас применяются в основном 16-разрядные аудиоадаптеры, имеющие 216 = 65536 ступеней квантования – как у звукового компакт-диска.
    Таблица 3.1 – Частота квантования звуковых сигналов и разрядность квантования
    Частотный диапазон
    Вид сигнала
    Частота квантования
    400 – 3500 Гц
    Речь (едва разборчива)
    5.5 КГц
    250 – 5500 Гц
    Речь (среднее качество)
    11.025 КГц
    40 – 10000 Гц
    Качество звучания УКВ- приемника
    22.040 КГц
    20 – 20000 Гц
    Звук высокого качества
    44.100 КГц
    Устройство, выполняющее дискретизацию, называется аналого- цифровым преобразователем (АЦП).
    Рис.3.4 Процесс преобразования звуковых волн в двоичный код в памяти компьютера
    Чтобы воспроизвести закодированный таким образом звук, нужно сделать обратное преобразование (для этого служит цифро-аналоговый преобразователь – ЦАП), а затем сгладить получившийся ступенчатый сигнал.

    47
    Рис. 3.5 Процесс воспроизведения звуковой информации, сохраненной в памяти компьютера
    Чем выше частота дискретизации и чем больше разрядов отводится для каждого отсчета, тем точнее будет представлен звук, но при этом увеличивается и размер звукового файла. Поэтому в зависимости от характера звука, требований, предъявляемых к его качеству и объему занимаемой памяти, выбирают некоторые компромиссные значения.
    Основной элемент в процессе воспроизведения звуковой информации, сохраненной в памяти компьютера – аудио адаптер (звуковая плата), специальное устройство, подключаемое к компьютеру и предназначенное: для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении непрерывного звука.
    3.3 Параметры дискретизации
    Важными параметрами дискретизации являются частота и разрядность.
    Разрядность (глубина кодирования звука) – это количество бит, которое необходимо для кодирования дискретных уровней громкости цифрового звука. Указывает, с какой точностью происходят изменения амплитуды аналогового сигнала. Точность, с которой при оцифровке передается значение амплитуды сигнала в каждый из моментов времени, определяет качество сигнала после цифро-аналогового преобразования.
    Именно от разрядности зависит достоверность восстановления формы волны.

    48
    Для кодирования значения амплитуды используют принцип двоичного кодирования. Звуковой сигнал должен быть представленным в виде последовательности электрических импульсов (двоичных нулей и единиц).
    Обычно используют 8, 16-битное или 20-битное представление значений амплитуды. При двоичном кодировании непрерывного звукового сигнала его заменяют последовательностью дискретных уровней сигнала.
    Рис. 3.6 Квантование звуковой волны
    Частота – количество измерений амплитуды аналогового сигнала в секунду.
    Частота измеряется в герцах (Гц.). Одно измерение за 1 секунду соответствует частоте 1 Гц.1000 измерений за 1 секунду – 1 килогерц (кГц).
    В новом формате компакт-дисков Audio DVD за одну секунду сигнал измеряется 96 000 раз, т.е. применяют частоту дискретизации 96 кГц. Для экономии места на жестком диске в мультимедийных приложениях довольно часто применяют меньшие частоты: 11, 22, 32 кГц. Это приводит к уменьшению слышимого диапазона частот, а, значит, происходит сильное искажение того, что слышно.
    Самое низкое качество оцифрованного звука равно частоте = 11кГц и глубине кодирования 8 битов.

    49
    Высокое качество соответствует частоте 44,1 кГц и глубине кодирования 16 битов.
    От частоты дискретизации (количества измерений уровня сигнала в единицу времени) зависит качество кодирования. С увеличением частоты дискретизации увеличивается точность двоичного представления информации. При частоте 8 кГц (количество измерений в секунду 8000) качество оцифрованного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 кГц (количество измерений в секунду
    48000) – качеству звучания аудио-CD.
    В современных преобразователях принято использовать 20-битное кодирование сигнала, что позволяет получать высококачественную оцифровку звука.
    Если известна глубина кодирования звука (i), то количество уровней громкости (N) цифрового звука можно рассчитать по формуле:
    N = 2
    i
    (1)
    При глубине кодирования звука i = 8 бит количество уровней громкости N = 2 8
    = 256.
    Таблица 3.2 – Применение звукового сигнала при различных уровнях громкости
    Глубина кодирования (i)
    Количество уровней громкости (N)
    Применение
    8 256
    Недостаточно для достоверного восстановления исходного сигнала, так как будут большие нелинейные искажения. Применяют в основном в мультимедийных приложениях, где не требуется высокое качество звука
    16 65536
    Используется при записи компакт- дисков, так как нелинейные искажения сводятся к минимуму
    20 1048576
    Где требуется высококачественная оцифровка звука
    Описанный способ кодирования звуковой информации достаточно универсален, он позволяет представить любой звук и преобразовывать его

    50 самыми разными способами. Но бывают случаи, когда выгодней действовать по-иному.
    Издавна используется довольно компактный способ представления музыки – нотная запись. В ней специальными символами указывается, какой высоты звук, на каком инструменте и как сыграть. Фактически, ее можно считать алгоритмом для музыканта, записанным на особом формальном языке. В 1983 ведущие производители компьютеров и музыкальных синтезаторов разработали стандарт, определивший такую систему кодов. Он получил название MIDI (англ. Musical Instrument Digital Interface – цифровой интерфейс музыкальных инструментов).
    Конечно, такая система кодирования позволяет записать далеко не всякий звук, она годится только для инструментальной музыки. Но есть у нее и неоспоримые преимущества: чрезвычайно компактная запись, естественность для музыканта (практически любой MIDI-редактор позволяет работать с музыкой в виде обычных нот), легкость замены инструментов, изменения темпа и тональности мелодии.
    Есть и другие, чисто компьютерные, форматы записи музыки. Среди них – формат MP3, позволяющий с очень большим качеством и степенью сжатия кодировать музыку, при этом вместо 18–20 музыкальных композиций на стандартном компакт-диске (CD-ROM) помещается около 200. Одна песня занимает, примерно, 3,5 Мб, что позволяет пользователям сети Интернет легко обмениваться музыкальными композициями.
    Размер цифрового моноаудиофайла измеряется по формуле:
    I
    h
    t
    V



    (2) где t – время звучания файла (сек, мин.), h – частота дискретизации (Гц, кГц), i – глубина кодирования звука (бит).
    Размер цифрового стереоаудиофайла, сигнал которого записан для 2-х колонок (раздельно кодируются левый и правый каналы звучания), определяется по формуле:
    I
    h
    t
    V



     2
    (3)

    51
    3.4 Задачи по кодированию звука
    Задача 1. Подсчитать, сколько места будет занимать одна минута цифрового звука на жестком диске или любом другом цифровом носителе, записанного с частотой: а) 44.1 кГц; б) 11 кГц; в) 22 кГц; г) 32 кГц и разрядностью 16 бит.
    Решение
    а) Если записывают моносигнал с частотой h = 44.1 кГц, разрядностью
    I = 16 бит (2 байта), то каждую минуту (t=60 cек.) аналого-цифровой преобразователь будет выдавать V = 60 * 44100 * 2 = 5292000 байт
    (примерно 5 Мб) данных об амплитуде аналогового сигнала, который в компьютере записываются на жесткий диск.
    Если записывают стереосигнал, то V = 2*60*44100*2 = 10584000 байт
    (около 10 Мб). б) Для моносигнала размер файла
    V = 60 * 11000 * 2 = 1320000 байт (около1,26 Мб)
    Для стереосигнала
    V = 2*60 * 11000 * 2 = 2640000 байт (около 2,5 Мб) в) Для моносигнала размер файла
    V = 60 * 22000 * 2 = 2640000 байт (около 2,5 Мб)
    Для стереосигнала
    V = 2*60 * 22000 * 2 = 5280000 байт (около 5 Мб) г) Для моносигнала размер файла
    V = 60 * 32000 * 2 = 3840000 байт (около 3,7 Мб)
    Для стереосигнала
    V = 2*60 * 32000 * 2 = 7680000 байт (около 7,3 Мб)

    52
    Задача 2. Какой информационный объем имеет моноаудиофайл, длительность звучания которого 1 секунда, при среднем качестве звука (16 бит, 24 кГц)?
    Решение
    t=1 сек. h=24000 Гц.
    I=16 бит = 2 байт.
    V = 1*24000*2 = 48000 байт (около 47 кБ)
    Задача 3. Рассчитайте объем стереоаудиофайла длительностью 20 секунд при 20-битном кодировании и частоте дискретизации 44.1 кГц.
    Решение
    t=20 сек. h=44100 Гц.
    I=20 бит.
    V = 2*20* 20*44100 = 35280000 бит = 4410000 байт (ококло 4.41 Мб)
    Краткие итоги лекции 3
    Одним из основных понятий мультимедиа является термин «аудио».
    Возможность персональных компьютеров работать со звуковой информацией
    – важный этап в развитии мультимедиа. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию.
    Под термином «аудио» понимают звук, записанный на звуковом носителе, а также запись и воспроизведение звука, звукозаписывающая и звуковоспроизводящая аппаратура. Чем больше частота – тем выше тон. Чем больше амплитуда – тем громче звук.
    Звук делится на два вида: аналоговый (непрерывный), дискретный
    (цифровой).
    Для преобразования аналогового сигнала в цифровой необходимы процессы дискретизации и квантования.

    53
    Устройство, выполняющее дискретизацию, называется аналого- цифровым преобразователем (АЦП), основной элемент которого – аудиоадаптер (звуковая плата).
    Вопросы по лекции 3
    1. Перечислите основные характеристики звука.
    2. Перечислите форматы записи аудио данных. Дайте характеристику.
    3. Каким образом происходит запись и воспроизведение аудио сигналов?
    4. Что такое глубина звука?
    5. От каких параметров зависит качество звука?
    6. Какими параметрами определяется размер аудиофайла?
    7. Что такое формат MIDI?
    8. Рассчитать, какой информационный объем имеет моноаудиофайл, длительность звучания которого 3 секунды, при среднем качестве звука (16 бит, 24 кГц)?
    9. При какой глубине кодирования требуется высококачественная оцифровка звука?
    10. Опишите процесс дискретизации звукового сигнала. Приведите пример.
    11. Опишите процесс квантования звукового сигнала. Приведите пример.
    12. Перечислить и дать определение параметрам дискретизации.
    13. Перечислить виды звуковых сигналов и соответствующие частоты квантования.
    14. Каким образом рассчитывается размер цифрового моноаудиофайла и стереоаудиофайла. Привести пример.
    15. Подсчитать, сколько места будет занимать 3 минуты цифрового звука на жестком диске или любом другом цифровом носителе, записанного с частотой 44.1 кГц и разрядностью 32 бита.

    54
    Лекция 4. Средства мультимедиа. Компьютерная графика
    Краткая аннотация лекции: Рассмотрены определение компьютерной графики, растровой и векторной графики, процессы кодирования цвета. Рассмотрены основные цветовые модели.
    Цель лекции: изучить растровое и векторное представление компьютерной графики.
    Изучить основы кодирования растровой и векторной графики. Рассмотреть цветовые модели.
    4.1 Понятие компьютерной графики
    Компьютерная графика представляет собой одно из наиболее мощных направлений развития компьютерных технологий.
    Данное направление мультимедийных технологи предназначено для передачи пользователю визуальных изображений.
    По способам построения изображений компьютерную графику можно разделить на двумерную и трехмерную графику. Двумерная компьютерная графика (2D) классифицируется по типу представления графической информации, и следующими из него алгоритмами обработки изображений.
    Графическую информацию можно представлять в двух формах: аналоговой или дискретной.
    Примером аналогового представления графической информации может служить, например, живописное полотно, цвет которого изменяется непрерывно, а дискретного – изображение, напечатанное с помощью струйного принтера и состоящее из отдельных точек разного цвета.
    Преобразование графической информации из аналоговой формы в дискретную производится путем пространственной дискретизации.
    Пространственную дискретизацию изображения можно сравнить с построением изображения из мозаики (большого количества маленьких разноцветных стекол). Производится кодирование изображения, то есть изображение разбивается на отдельные маленькие фрагменты (точки), причем каждому фрагменту присваивается значение его цвета, то есть код цвета (красный, зеленый, синий и так далее).

    55
    При этом качество кодирования будет зависеть от следующих параметров: размера точки и количества используемых цветов. Чем меньше размер точки, а, значит, изображение составляется из большего количества точек, тем выше качество кодирования. Чем большее количество цветов используется (т. е. точка изображения может принимать больше возможных состояний), тем больше информации несет каждая точка, а, значит, увеличивается качество кодирования.
    Рис. 4.1 Пространственная дискретизация
    Создание и хранение графических объектов возможно в нескольких видах – в виде векторного или растрового изображения. Для каждого вида используется свой способ кодирования графической информации.
    1   2   3   4   5   6   7   8   9   ...   37


    написать администратору сайта