Введение
Благодаря интеллектуализации персональных компьютеров и в связи с развитием специального программного обеспечения существуют реальные возможности синтеза композиции и теории информации, объединения музыкальных и акустических параметров посредством серийного комбинирования, обилию встроенных систем аналитических вычислений, наличию диалоговых средств работы с табличными, графическими, текстовыми, музыкальными объектами и т. д.
Музыкальное программирование предполагает детальное изучение структуры музыкальной ткани, а также выяснение особенностей представлений о способах функционирования гармонии и тенденциях ее развития. Это внесло существенный вклад в развитие современных знаний о музыкальной гармонии.
С помощью новейших технологий музыкального программирования, которые используются для анализа музыкальных рукописей и произведений, анализируются некоторые аспекты музыкознания, которые допускают формализованный подход. Эти технологии великолепно применимы к таким проблемам как, например, распознавания нотных рукописей, которые были написаны с использованием забытых систем нотации, расшифровки древнерусских памятников, записанных крюковым, знаменным или кондакарным письмом.
1 Профессиональная обработка звука
Сегодня под обработкой звука понимают различные преобразования звуковой информации, для изменения определенных характеристик звучания. К обработке относят как способы создания различных звуковых эффектов, фильтрация, так и методы очистки звука от изменения тембра, различных нежелательных шумов, и т.д. В конечном счете все это множество преобразований сводится к следующим основным типам:
1. Амплитудные преобразования, которые проводятся с амплитудой сигнала и приводят к ее усилению или же ослаблению, а также изменению на определенных участках сигнала по какому-либо закону.
2. Частотные преобразования, которые выполняют над частотными составляющими звука. При этом сигнал вначале представляется в виде спектра частот через выбранные промежутки времени, а затем производится обработка необходимых частотных составляющих, например фильтрация, и обратное представление сигнала из спектра в волну.
3. Фазовые преобразования, при котором происходит сдвиг фазы сигнала тем или иным способом - преобразования стерео сигнала, которые позволяют реализовать эффект объемности или вращения звука.
4. Временные преобразования, которые производятся наложением, растягиванием или сжатием сигналов и позволяют создать такие эффекты как эхо или хор, а также влиять на пространственные характеристики звука. Эффект эхо создается с помощью временных преобразований. В частности для получения данного эффекта необходимо на оригинальный сигнал наложить его отстающую во времени копию. Чтобы слушатель воспринимал вторую копию не как отзвук основного сигнала, а как повторение время задержки принимают равным примерно 50 мс. На основной сигнал налаживают не одну копию, а несколько. Это позволит на выходе получить эффект многоголосного эха.
2 Шумы при оцифровке звука
На сегодня диапазон одновременно воспроизводимых громкостей составляет от максимальной амплитуды до той наименьшей. Наименьшая определяется разрешением оборудования. для 16 битного аудио это, например, около минус 93 децибел, Этот параметр сильно связан с уровнем шумов фонограммы. Например, на 16 битного аудио возможно передавать сигналы мощностью и в -120 дБ, но такие сигналы будет трудно применять на практике по причине такого аспекта как шум дискретизации. При снятии цифровых значений образуются ошибки, при округлении реального аналогового значение до ближайшего возможного цифрового. Самая минимально-возможная ошибка - это нулевая, а максимально возможная ошибка - это половина последнего разряда. Появление этой ошибки создает так называемый шум дискретизации. Это случайное несоответствие оцифрованного сигнала оригиналу. Данный шум носит постоянный характер. Он имеет максимальную амплитуду равную половине младшего разряда. Это рассматривается как случайные значения, подмешанные в цифровой сигнал. На практике это явление называется шум округления или квантования.
Рассмотрим также более подробно то, что понимается под мощностью сигналов, измеряемой в битах. При цифровой обработке звука самый сильный сигнал принимается за 0 дБ, это соответствует всем битам, поставленным в 1. Если старший бит обнулить, получившееся цифровое значение будет в два раза меньше, что соответствует потере уровня на 6 децибел. Поэтому при обнулении единички от старших разрядов к младшим, происходит уменьшение уровня сигнала на шесть децибел. Следовательно, минимальный уровень сигнала, при котором у нас единичка в младшем разряде, а все остальные разряды равны нулю, (N-1)*6децибел, где N - разрядность отсчета. Тогда для 16 разрядов получиться уровень самого слабого сигнала равным 90 децибел.
3 Применение цифровой обработки сигналов
Звуковой сигнал, записываемый в реальных акустических условиях, часто содержит нежелательные шумы, которые могут порождаться окружающей средой или звукозаписывающей аппаратурой. Один из классов шумов - аддитивные стационарные шумы.
Аддитивность означает, что шум суммируется с "чистым" сигналом и не зависит от него.
Стационарность означает, что свойства шума (мощность, спектральный состав) не меняются во времени. Примерами таких шумов могут являться постоянное шипение микрофона или усилительной аппаратуры, гул электросети. Работа различных приборов, не меняющих звучания по времени (вентиляторы, компьютеры) также может создавать шумы, близкие к стационарным. Не являются стационарными шумами различные щелчки, удары, шелест ветра, шум автомобилей. Для подавления аддитивных стационарных шумов существует алгоритм спектрального вычитания. Он состоит из следующих стадий:
1. Разложение сигнала с помощью кратковременного преобразования Фурье (STFT) или другого преобразования, компактно локализующего энергию сигнала.
2. Оценка спектра шума.
3. "Вычитание" амплитудного спектра шума из амплитудного спектра сигнала.
4. Обратное преобразование STFT - синтез результирующего сигнала.
В качестве банка фильтров рекомендуется использовать STFT с окном Ханна длиной порядка 50 мс и степенью перекрытия 75%. Амплитуду весового окна надо отмасштабировать так, чтобы при выбранной степени перекрытия окон банк фильтров не менял общую амплитуду сигнала в отсутствие обработки.
4 Методики вытеснения шумов дискретизации
С помощью специальной техники, называемой shaped dithering, можно изменить частотный спектр шумов дискретизации, почти полностью вынести их в область более 7-15 кГц. Мы как бы меняем разрешение по частоте (отказываемся от воспроизведения тихих высоких частот) на дополнительный динамический диапазон в оставшемся отрезке частот. В сочетании с особенностями нашего слуха - наша чувствительность к выкидываемой области высоких частот на десятки дБ ниже чем в основной области (2-4 кГц) - это делает возможным относительно бесшумную передачу полезных сигналов дополнительно ещё на 10-20 дБ тише, чем -93 дБ - таким образом, динамический диапазон 16 битного звука для человека составляет около 110 децибел. Да и вообще - одновременно человек просто не может слышать звуки на 110 децибел тише, чем только что услышанный громкий звук. Ухо, как и глаз, подстраивается под громкость окружающей действительности, поэтому одновременный диапазон нашего слуха составляет сравнительно мало - около 80 децибел. Поговорим о dithring-е подробнее после обсуждения частотных аспектов.
Для компакт-дисков выбрана частота дискретизации 44100 Гц. Бытует мнение (основанное на неверном понимании теоремы Котельникова-Найквиста), что при этом воспроизводятся все частоты вплоть до 22.05 кГц, однако это не совсем так. Однозначно можно сказать лишь то, что частот выше 22.05 кГц в оцифрованном сигнале нет. Реальная же картина воспроизведения оцифрованного звука всегда зависит от конкретной техники и всегда не так идеальна, как хотелось бы, и как соответствует теории. Все зависит от конкретного ЦАП (цифро-аналогового преобразователя, отвечающего за получение звукового сигнала из цифровой последовательности).
5 Хранение оцифрованного звука
Для того, чтобы сохранить цифровой звук можно:
1) блок оцифрованной аудио информации записать в файл последовательностью значений амплитуды. В такой ситуации существуют два способа хранения информации.
Первый называется Pulse Code Modulation . Это способ цифрового кодирования сигнала с использованием записи абсолютных значений амплитуд . Возможно использование знаковое или беззнаковое представления. На всех аудио CD именно в таком виде записаны данные.
Второй называется Adaptive Delta PCM . Представляет собой запись полученных значений сигнала не в абсолютных, а в относительных приращениях.
2) сжать данные так, чтобы они занимали меньший объем памяти. В данной ситуации тоже имеются два пути.
Первый называется кодирование данных без потерь. Это способ позволяет осуществлять стопроцентное восстановление данных из сжатого потока. В тех случаях, когда сохранение оригинального качества данных критично , прибегают к такому способу уплотнения данных. На сегодня алгоритмы кодирования без потерь позволяют уменьшить используемый данными объем на 50 процентов. При этом обеспечивается стопроцентное восстановление оригинальных данных из полученных после сжатия. Подобные кодеры можно сравнить с архиваторами данных , но предназначенных для сжатия именно аудио.
6 Кодирование аудиоинформации
Сегодня компьютер работает с числовыми данными и поэтому звуки преобразуются в числовой вид, или закодированы. Полученная аудиоинформация после кодирования занимает много места на жестком диске, поэтому принято использовать сжатые аудиоформаты. В таком случае музыка занимает меньше места. Он хорошо формализуется и ее можно записать с помощью нот.
Звук - это волна, которая распространяется в окружающем нас воздухе, и которая воспринимается человеком с помощью органов слуха. Один из основных параметров, описывающих звук - это громкость. Громкость измеряется в децибелах. Порог чувствительности человеческого уха около 20 дБ. Громкость обычного разговора же составляет около 50 дБ, шум на улице может превышать 70 дБ, а громкость взлетающего самолета - 120 дБ.
Характеризуется звуковая волна также изменением во времени таких характеристик как частота и амплитуда сигнала. Графически звуковая волна можно описать кривой, которая задает зависимость амплитуды от времени. Высоту звука определяет частота основных колебаний. Но все же звуки одной частоты могут иметь разный тембр.
Для того, чтобы закодировать звук, требуется измерять амплитуду сигнала через определенные промежутки времени. На заданном отрезке времени определяется средняя амплитуда сигнала. Графически такое преобразование выглядит как множеством столбиков.
Вид восстановленной кривой будет искажен. Чем больше ширина столбиков и чем реже определяется текущая амплитуда, тем больше искажения. Чем временные промежутки меньше, тем выше будет качество закодированного звука. Частота, на которой находят амплитуду сигнала, называется частотой дискретизации.
7 Аппаратура
Важная часть рассмотрения теории о звуке связана именно с аппаратурой. Сегодня существует множество различных устройств как для обработки, так и для ввода и вывода звука. В рамках рассмотрения обычного персонального компьютера следует подробно рассмотреть звуковые карты. Звуковые карты обычно делиться на звуковые, музыкальные и звукомузыкальные. По конструкции же звуковые платы можно подразделяют на две группы: основные, которые устанавливаются на материнской плате компьютера и обеспечивают ввод и вывод аудио данных, и дочерние, которые имеют принципиальное конструктивное отличие от основных плат и они подключаются к специальному разъему, который расположен на основной плате. Дочерние платы выполняют функцию обеспечения или расширения возможностей MIDI-синтезатора.
Звукомузыкальные и звуковые платы выполняются в виде устройств, которые вставляются в слот материнской платы. Также они могут быть уже предустановлены в нее изначально. Визуально на них располагаются два аналоговых входа - линейный и микрофонный, и несколько аналоговых выходов: линейные выходы и выход для наушников. Сегодня карты стали оснащать еще и цифровым входом и выходом, которые обеспечивают передачу аудио между цифровыми устройствами. Разъемы аналоговых входов и выходов схожи с аналогичными разъемам головных наушников (1/8). у звуковой платы входов немного больше, чем два: аналоговые CD, MIDI и другие входы. По сравнению с микрофонными и линейными входами, они расположены не на задней панели звуковой платы, а на самой плате.
8 Программы для обработки звуковой информации
К основным возможностям данных программ относиться обеспечение возможности записи оцифровки аудио с последующим сохранением на диск.
Более мощные представители данного рода программ позволяют также производить запись, многоканальное сведение аудио на нескольких виртуальных дорожках, очистка от шумов, обработку с помощью специальных эффектов. Они имеют достаточно развитую навигацию и инструментарий, визуализованный в виде спектроскопа и иных виртуальных приборов, преобразование аудио из формата в формат, управление внешними устройствами, запись на компакт диски, генерация сигналов и многое другое. Можно выделить следующие программы: Cool Edit Pro (Syntrillium), Nuendo (Steinberg), Sound Forge (Sonic Foundry), Wavelab (Steinberg), Samplitude Producer (Magix).
К основным возможностям редактора Cool Edit Pro 2.0 относятся: 32-битная обработка, поддержка аудио с параметрами 24 бит / 192 КГц, редактирование и сведение аудио на 128 дорожках, 45 встроенных DSP-эффектов, включая инструменты для мастеринга, поддержка DirectX, анализа и реставрации аудио, мощный инструментарии для работы с петлями (loops), а также управление SMPTE/MTC, поддержка работы с видео и MIDI и прочее.
К основным возможностям редактора Sound Forge 6.0a относятся возможности: многозадачная фоновая обработка заданий, деструктивного редактирования, поддержка файлов с параметрами до 32 бит / 192 КГц, большой набор эффектов обработки, менеджер предустановок, поддержка файлов более 4 Гб, работа с видео, восстановление после зависаний, спектральный анализатор, предпрослушивание примененных эффектов, и прочее.
9 Технологии DirectX и VST
С появлением созданного компанией Microsoft программируемого интерфейса DirectX стало возможна разработка программ как для профессиональной, эффективной и производительной работы с графикой и звуком, включая работу в реальном временном масштабе. Появление этой технологии совершило масштабную революцию в сфере обработки звука в реальном времени на IBM-совместимых компьютерах. Первоначально она предназначалась для разработчиков компьютерных игр. Основной смысл данной разработки заключается в обходе ограничений Windows по быстродействию при работе приложений с устройствами компьютера, такими как память, дисплей, жесткий диск и портами ввода-вывода.
Для использования модулей эффектов необходимо иметь на компьютере соответствующее программное обеспечение, которое предназначено для обработки звука и имеющет поддержку DirectX. Сегодня к числу таких программ относятся Cakewalk 6.0, Sound Forge 4.0, Cool Edit Pro, WaveLab 1.6, Cubase VST, а также программы, использующие многоканальную аудиозапись, Samplitude 2496 и SAW Plus 32. После процесса установке любой из представленных программ, кроме Cakewalk, в операционной системе DirectX-эффекты не появляются, но появиться возможность их последующего подключения. Стоит помнить, что драйверы, которые использует звуковая карта, должны быть сертифицированы компанией Microsoft на предмет поддержки DirectX
10 Программы-анализаторы аудио
Данные программы представляют аудио данные в более удобном виде, чем обычные редакторы. Они позволяют внимательно изучить данные с помощью различных инструментов, в которым относятся FFT-анализаторы, построители сонограмм, построители динамических и статических амплитудно-частотных характеристик. Перспективной в данной области считается программа SpectraLAB , Также можно выделит более простые, но все же мощные -Analyzer2000 и Spectrogram.
Программа SpectraLAB – это самый мощный продукт подобного рода на сегодня . Можно выделить следующее основные возможности программы:
1) возможность сравнения амплитудно-частотных характеристик нескольких сигналов;
2) 3 режима работы (пост режим, режим реального времени, режим записи);
3) основной инструментарий - осциллограф, спектрометр (двухмерный, трехмерный, а также построитель сонограмм) и фазометр;
4)широкие возможности масштабирования, измерительные инструменты: нелинейных искажений, отношения сигнал/шум, искажений и прочие.
11 Специализированные реставраторы аудио
Данные реставраторы аудио играют важнейшую роль в обработке звука. Данные программы дают возможность восстановить утерянное качество звучания аудио материала, удалить нежелательные шумы, щелчки, специфические помехи записей, треск с аудио-кассет, и провести иную корректировку аудио. Можно выделить: Clean, Dart, Wave Corrector, Audio Cleaning Lab.
К основным возможностям реставратора Clean 3.0 относятся: режим автокоррекции, устранение всевозможных потрескиваний и шумов, запись CD с подготовленными данными, набор эффектов для обработки скорректированного звука, включая функцию surround sound с наглядным акустическим моделированием эффекта, поддержка внешних VST плагинов и другие возможности, «интеллигентная» система подсказок.
Заключение
Компьютерная техника сегодня предоставляет широкие возможности как в творческом процессе обучения музыки, так и на профессиональном и е любительского творчества.
Современные музыкальные компьютерные технологии позволили открыть новый этап технического воспроизводства музыкальной продукции: в жанрах прикладной музыки, в нотопечатании, в средствах звукозаписи, в театрально-концертной деятельности, в качественных возможностях звуковоспроизводящей аппаратуры, в звуковом дизайне и трансляции музыки.
Обработка звука осуществляется разнопланово и зависит от преследуемых целей. Это может быть наложение звуковых фильтров, подавление шумов, выведение на передний план определённых частот, добавление реверберации или дилея, и т.п.
Выбор программного обеспечения звуковой обработки во многом зависит от предпочтений самого пользователя. В последнее время все представленные программы имеют очень похожий пользовательский интерфейс, и поэтому освоив работу с одной легко сможно освоить и другие звуковые программы.
Сегодня использование цифровой обработки - это одна из самых перспективных и привлекательных для приложения сил областей high tech технологий.
Систематическое и грамотное применение информационных компьютерных технологий позволяет преподавателям, научным работникам возможность наиболее эффективно распределять время и реализовывать творческий потенциал.