ЦИФРОВАЯ ЗВУКОЗАПИСЬ МУЗЫКАЛЬНЫХ CD


Музыкальные звуки хранятся на обычных CD в виде 16-битных чисел. Частота дискретизации сигналов на обычных компакт дисках 44.1 Кгц. К сожалению, такое представление сигналов даже с применением рассмотренных в предыдущей статье dithering и noise shaping не позволяет получить субъективный динамический и частотный диапазоны звукозаписи, соответствующие возможностям человеческого слуха и приводит к заметной деградации качества звука. Однако услышать это ухудшение в основном могут звукорежиссеры, имеющие возможность сравнивать звук с CD и исходный материал, часто записанный на очень дорогой аппаратуре в виде 20 или даже 24-битных чисел и иногда с частотой дискретизации 96 Кгц и более. Звукорежиссеры это, как правило, люди не имеющие ни музыкального, ни технического образования. Поэтому они формулируют свои мысли крайне туманно и в тоже время часто облекают их в наукообразную форму с расчетом на впечатлительных музыкантов. Ухудшение цифрового звука в стандарте музыкального компакт диска они обычно описывают терминами типа "омертвение", "убийство звука", "звуковая грязь", "жесткость", "тусклость", "отсутствие баланса", "транзисторное звучание", "задавленность", отсутствие "прозрачности" и даже "низкая разрешающая способность". Всеми этими эмоционально верными, но ничего, по сути, не объясняющими терминами и ошибочными с научной точки зрения рассуждениями изобилует практически любая статья о цифровой звукозаписи в многочисленных (столь же многочисленными, как и компьютерные издания!) культовых "звукорежиссерских" журналах о Hi-Fi и Hi-End (IN/OUT, Class A, Hi-Fi Audio и д.р.). Для понимание процессов, происходящих при звукозаписи, рассмотрим, как создается музыкальный CD по возможности подробно и с самого начала. Запись часто производится в небольшом помещении со звукопоглощающим покрытием на стенках, потолке и полу. Звук, как правило, сначала попадает на микрофоны и затем на микшерский пульт. Эти аналоговые устройства вполне могут ухудшить качество звука еще до аналого-цифрового преобразования. Во избежание "убийства" звука не рекомендуется использовать конденсаторные микрофоны с "фантомным" питанием, т.е. с подачей напряжения питания по сигнальным проводам. К сожалению, хороший аналоговый микшерский пульт довольно дорогая вещь. При отсутствии высококачественного аналогового микшера, видимо, надо стремиться, как можно раньше оцифровывать аналоговые сигналы с помощью многоканальных 20..24-битных звуковых компьютерных карт и все регулировки, сведения и другие микшерские операции производить уже в цифре. Запись оцифрованного звука рационально производить сразу на жесткий диск персонального компьютера, всячески избегая использования DAT магнитофонов из-за весьма возможных и трудно устранимых проблем с джиттером.

Программное обеспечение для создания музыкального CD на ПК

Почти всю обработку цифровой записи музыкального материала можно произвести с помощью специального программного обеспечения. Одной из таких программ является SAW, выпускаемая фирмой Innovative Quality Software. SAW поддерживает до 24 дорожек для записи, воспроизведения и обработки звука. SAW может независимо обрабатывать записанные дорожки эффектами реверберации, хоруса, флэнжера, многополосного компрессора, шумоподавителя, инверсии фазы, одновременного изменения высоты и скорости звучания, графического эквалайзера, удаления составляющих, лежащих по центру стерео панорамы, эхо/задержки, динамической обработки и других. Многие из эффектов могут работать в реальном времени независимо для каждой дорожки записи. Характерной особенностью SAW является поддержка до восьми звуковых карт одновременно. Эта программа позволяет в одном проекте записывать файлы с разными частотами дискретизации. Значения частоты задаются для каждой дорожки отдельно. Удобные инструменты "сведения" позволяют быстро создать стерео запись из исходного многодорожечного материала. Помимо эффектов, входящих в комплект поставки SAW фирма Innovative Quality Software предлагает за отдельную плату модуль реверберации с большим количеством установок, измеритель уровня выходного сигнала MultiTrack View, PanHandler для кодирования звука по алгоритму Surround Sound, AVI Viewer для работы с видео файлами в формате AVI, и Ignition CD, позволяющий записывать компакт-диски прямо из программы SAW при наличии пишущего CD-ROM-дисковода. К недостаткам программы можно отнести отсутствие в стандартной поставке модулей обработки Noise Shaping и Dithering.

Рис. 1 Интерфейс пользователя программы SAW.

Другая программа Sound Forge 4.0 производства фирмы Sonic Foundry это многофункциональный высококачественный 32-х разрядный редактор звуковых файлов, предназначенных для профессиональной обработки звука. В базовой поставке предусмотрена возможность увеличения числа функций за счет так называемых модулей расширения (plug-in), которые покупаются отдельно у фирм производителей Sonic Foundry, Steinberg и Waves, продукты которых известны своими высококачественными алгоритмами. Для Sound Forge характерно высокое качество, скорость и точность алгоритмов обработки звука. Многие из них могут работать в режиме реального времени. Программа имеет удобный пользовательский интерфейс с доступом почти ко всем функциям через настраиваемые линейки инструментов и улучшенное отображение происходящих процессов на экране. В Sound Forge курсор останавливается на месте в центре экрана, а звуковая волна движется справа налево по мере воспроизведения. Программа поддерживает большое количество различных типов звуковых файлов и может использовать разнообразные алгоритмы сжатия данных (RealAudio, ADPCM, MPEG). Sound Forge обеспечивают неразрушающее редактирование. В процессе обработки файла изменяется не непосредственно открытый звуковой файл, а его копии, которые хранятся в оперативной памяти компьютера или на диске в виде временных файлов. Исходный звуковой файл будет изменен только после выполнения команды сохранения. Sound Forge позволяет применять звуковые эффекты реверберации, хоруса, гармонайзера, сжатия и растяжения звука во времени без воздействия на его абсолютную высоту, изменения высоты звука без изменения длительности звучания файла, параметрического и 10-полосный графического эквалайзера. Эффекты динамической обработки позволяют сузить и расширить динамический диапазон сигнала (компрессор и экспандер), ограничить уровень звукового сигнал (лимитер), подавить шумы в паузах. В Sound Forge есть очень полезный эффект многополосного компрессора, позволяющий эффективно сжимать динамический диапазон сигнала в определенных частотных полосах без взаимного влияния мощных низких частот на средний диапазон частот, характерного для обычного компрессора. Программа предоставляет пользователю мощные средства для реставрации и очистки фонограмм от нежелательных шумов, щелчков, фона переменного тока, помогающие восстанавливать старые фонограммы и записи. Компьютерная реставрация звука не влияет на исходный частотную характеристику исходного материал. Чтобы избавиться от шумов в фонограмме, надо выбрать участок записи с шумовыми сигналами и произвести его частотный анализ программным модулем Noise Reduction. Алгоритм шумоподавления использует полученную частотную огибающую для определения части записанного сигнала, являющуюся шумом. Частоты с амплитудами, лежащими ниже частотной огибающей, считаются шумом, и их амплитуда будет значительно уменьшена. Частоты с более высокими амплитудами останутся нетронутыми. Дополнительно в состав модуля Noise Reduction входит инструмент для удаления из звукозаписей щелчков методом интерполяции, методом замещения поврежденного участка звукового файла данными с другого стереоканала, с предыдущего или последующего фрагмента записи. Sound Forge позволяет проводить спектральный анализ звука. Дополнительный модуль Spectrum Analysis показывает спектральную картину всего файла или выделенного участка, дает возможность отслеживать изменение спектральной картины звука при воспроизведении. Спектр сигнала может быть представлен в виде обычной амплитудно-частотной характеристики (АЧХ) или в виде цветного графика. Амплитуда различных частот выражается различными цветами. Sound Forge имеет средства синтеза простейших волн синусоидальной, прямоугольной (меандр), пилообразной, треугольной формы, заданной частоты, амплитуды и длительности, а также белый шум. Частотная модуляция позволяет синтезировать сложные звуки на основе базовых волновых форм, получая различные звуковые эффекты, имитирующие звуки аналоговых синтезаторов. Sound Forge имеет функцию Loop Tuner редактирование сэмплов с целью их дальнейшего использования в сэмплерах. Программа поддерживает редактирование звуковой информации AVI-файлов, позволяющее открывать видео ролики, добавлять и редактировать к ним звуковую дорожку, синхронизировать звук с изображением. Это делает удобным производство мультимедиа продукции.

Рис. 2 Интерфейс пользователя программы Sound Forge

При создании фонограммы трудно обойтись без использования музыкальных миди синтезаторов на основе звуковых карт с табличным волновым синтезом. Существенно облегчают работу с ними программы секвенсоры. Наиболее распространенные это Digital Orcestrator фирмы Steinberg и Cakewalk корпорации Twelve Tone Systems. Эти программы работают как виртуальные студии звукозаписи. Создание фонограммы начинается с записи нескольких миди инструментов из набора табличного волнового синтезатора звуковой карты (ударные, бас и т.д.) на виртуальный многоканальный миди магнитофон на основе жесткого диска персонального компьютера. При этом можно записывать одну дорожку с одновременным с воспроизведением других. "Компьютерные" композиторы и ранжировщики могут, действуя таким образом, последовательно записывать на несколько треков партии различных инструментов с MIDI-клавиатуры, микрофонного или линейного входов, индивидуально устанавливать громкость каждого инструмента и обрабатывать его звук различными эффектами специализированного цифрового процессор (DSP) обычно установленного на распространенных звуковых картах типа AWE32/64, Turtle Beach Pinnacle, Monster Sound 3D, Ensoniq или YAMAHA DB50/60X. Затем несколько дорожек (треков) виртуального многоканального магнитофона суммируются и располагаются на стерео панораме с помощью микшера, обрабатываются звуковыми эффектами и записываются (сводятся) в обычный стерео WAV файл. Можно и сразу все треки сбросить в отдельные WAV файлы и все операции по созданию стерео панорамы, компрессированию, обработке звуковыми эффектами произвести с помощью, например, программ SAW. В результате можно более или менее хорошо имитировать при помощи компьютера звучание целого оркестра.

Рис. 3 Интерфейс программы Digital Orchestrator

Для производства от единиц до нескольких сот (и даже тысяч!) единиц обычных музыкальных компакт дисков с вашей музыкой надо подключить CD рекордер к компьютеру и воспользоваться программой WaveLab 1.6 для тиражирования. WaveLab это одна из самых совершенных программ, содержащая все необходимое для записи, редактирования, наложения эффектов, создания фонограмм и последующей записи компакт дисков. Эта программа позволяет обрабатывать фонограмму в реальном времени, накладывая одновременно до 6 цифровых звуковых эффектов. WaveLab использует самые последние достижения в 32-битной многозадачной технологии Windows 95/NT. Эта программа может производить параллельно с проигрыванием WAV файлов загрузку, сохранение и обработку эффектами других WAV файлов. WaveLab, наконец, обеспечивает обработку данных с разрядностью до 24 бит с динамическим диапазоном до 192 дБ и отношением сигнал/шум до 144 дБ. А это уже вполне профессиональный уровень. Программа имеет встроенную систему производства компакт дисков. Достаточно создать список треков компакт диска, перемещая мышкой иконки WAV, AIFF, AU, 8, 16, 20, 24 bit, моно и стерео файлов в специальное окно CD-Window, и можно начинать тиражирование CD. Причем WaveLab автоматически обеспечивает полную совместимость созданных музыкальных компакт дисков с рекомендациями "Red-Book compatible audio CDs". Программа может импортировать треки прямо с компакт дисков в цифровом виде, без АЦП/ЦАП преобразований и, следовательно, без потери качества. WaveLab имеет больший набор эффектов реального времени. Это Noise Shaping, Dithering, DeNoiser (шумоподавитель), DeClicker (подавитель щелчков), максимизатор громкости, хорус, задержка, ревербератор, параметрический эквалайзер, передискретизатор, инверсия фазы и другие. Возможна обработка сигнала без записи на жесткий диск и обработка файлов в фоновом режиме. WaveLab поддерживает профессиональную звуковую базу данных AudioAccess, организующую ваши записи в виде структурной коллекции, позволяющую найти любой звуковой файл на CD-ROM или на жестком диске за нескольких секунд и обеспечивающую мгновенное начало воспроизведения файла (предварительное прослушивание) без долгой загрузки.

Рис. 4 Интерфейс программы WaveLab

Очень неплоха программа CoolEdit Pro. Она обладает практически такой же функциональностью как WaveLab 1.6, включая обработку 24-битных данных в реальном времени, практически весь набор звуковых эффектов и компрессию данных по стандарту MPEG, а стоит в десять раз дешевле (всего $45)! Существует и программа анализа, синтеза и обработки звуковых файлов EDS TOOLS для почти забытой ms-dos с прекрасным графическим пользовательским интерфейсом в стиле Windows 95. Эта программа позволяет проводить статистический анализ и обрабатывать данные, записанные в форматах от 8-битных до 32-битных чисел с плавающей точкой с помощью 1024 полосного эквалайзера, цифровых рекурсивных фильтров и фильтров с конечной импульсной реакцией (КИХ). Также пользователь может сам очень просто запрограммировать любой алгоритм обработки на специальном встроенном в программу языке. В EDS TOOLS есть функции трехмерного спектрального анализа на основе преобразования Фурье и современного спектрального анализа со сверх высоким разрешением по методу LPC (отсутствует в других программах!). Все рассмотренные программы обработки звука имеют богатейшие возможности, реализованные на профессиональном уровне с применением 24 и даже 32-битной математики с плавающей точкой, что значительно превосходит возможности традиционных студийных (рэковых) устройств. Кроме того, весь процесс обработки может быть реализован полностью в цифре. Это исключает характерные искажения, вносимые, например, студийными ревербераторами типа Yamaha SPX90, Sony DPS-R7, Alesis MidiVerb, DOD R-512 не имеющими цифровых входов и выходов. При использовании этих устройств аналоговый сигнал сначала преобразуется в цифровой поток данных (и не всегда 24-битный!), затем обрабатывается внутри студийного ревербератора с помощью DSP, цифрового сигнального процессора (часто 32-битная математика с плавающей точкой в них не применяется), вновь превращается в аналоговый сигнал (и опять не всегда 24-битным ЦАП, и, как правило, без Noise Saping и Dithering). Далее он подается на аналоговый микшерский пульт и только после этого поступает на АЦП студийного цифрового магнитофона. Конечно, такие преобразования не способствуют получению высококачественного звука и рождают в среде звукорежиссеров легенды об "убийстве" звука цифрой. Поэтому весьма разумно придерживаться концепции полностью цифровой студии звукозаписи на персональном компьютере, применяя программное обеспечение для обработки сигналов, наложения эффектов, сведения и мастеринга, использующее как минимум 24-битные программные алгоритмы.

"Транзисторные", "ламповые" и "цифровые" искажения звука: легенды и реальность.

Легенды о нерегистрируемых никакими приборами специфических цифровых искажениях, "убивающих" звук по своей сути столь же абсурдны, как и телепатия или "транзисторный" звук. Как ни странно до сих пор в среде аудиофилов существует байка о некоем "бездуховном" начале в транзисторных усилителях (в отличие от ламповых) и "транзисторных" искажениях, нерегистрируемых измерительными приборами. Однако еще в конце семидесятых годов это явление было всесторонне исследовано и подробно объяснено в многочисленных статьях, в частности и в общедоступном радиолюбительском журнале "Радио". Там же были опубликованы схемы транзисторных усилителей, показавших при сравнительных испытаниях с ламповыми усилителями предпочтительность звука на основе субъективных экспертных оценок на различных фонограммах. Сущность явления "транзисторного" звука состоит в различной скорости спада амплитуды гармоник нелинейных искажений и в очень незначительном относительном количестве четных гармоник у транзисторных усилителей. Для ламповых усилителей характерно экспоненциальное (гораздо более быстрое), а для транзисторных усилителей 1/x (медленное) убывание амплитуд гармоник с ростом частоты. При этом в ламповых усилителях наблюдается психо-акустическое явление (к стати положенное в основу стандарта звуковой компрессии MPEG) маскирования несколькими первыми гармониками почти всех более высокочастотных гармоник. Таким образом субъективно к сигналу в ламповом усилителе добавляются всего несколько первых четных и нечетных гармоник, причем их уровень должен быть довольно значительным. Обычно Hi-End ламповый усилитель имеет коэффициент нелинейных искажений от 0.5% и даже до 3.0% (например, усилитель "Первый" за $900, упомянутый в обзоре Hi-End усилителей в журнале Салон Audio-Video, N6, стр. 61). Следует отметить, что по такому же принципу добавления нескольких первых гармоник к исходному сигналу работают студийные эффекты обработки звука эксайтеры. В некотором роде ламповый усилитель и есть эксайтер. Именно поэтому ламповые усилители с очень малыми нелинейными искажениями не пользуются популярностью в среде аудиофилов. Их звук они характеризуют как отстраненный, не эмоциональный, без добавления яркости сигналу, близкий к звуку транзисторного усилителя с очень малыми нелинейными искажениями. Для транзисторных усилителей эффект маскирования проявляется на порядок слабее, а эффект эксайтинга из-за этого превращается в эффект добавления звуковой "грязи" и "песка". Это требует соответствующего уменьшения на порядок коэффициента нелинейных искажений для получения звучания, хотя бы немного приближающегося к "ламповому". Естественно, достижение на порядок меньшего коэффициента нелинейных искажений является сложной технической задачей, и ее решение современными методами не всегда экономически оправдано. Проще говоря, ламповый усилитель, произведенный в Юго-восточной Азии, может стоить значительно дешевле транзисторного Hi-End усилителя американского или европейского производства при субъективно одинаковом качестве звука. Что на самом деле и привело к кризису и разорению в начале 1998 года многих небольших американских фирм, работавших на рынке Hi-End (см. журнал "Class A", Март 1998). Для дешевых АЦП и ЦАП характерно отсутствие уменьшение амплитуд гармоник с ростом частоты. Проведенные мной измерения на звуковых картах в ценовом диапазоне от $10 до $60 показали, что для этих карт все гармоники вплоть до частоты дискретизации деленной на два могут иметь одинаковую амплитуду. Это очень тяжелая с точки зрения психоакустики ситуация. Такие АЦП/ЦАП, несмотря на довольно низкий коэффициент гармоник (обычно 0.02--0.04%) имеют как бы утрированное транзисторное звучание и очень хорошо "убивают" звук. Более дорогие модели АЦП/ЦАП имеют спад амплитуд гармоник по закону 1/x и, соответственно, звук с обычным "транзисторным" звучанием. Однако сейчас появились 22..24-битные АЦП/ЦАП производства фирмы Analog Devices с очень низким (до 0.002%) коэффициентом гармоник. Они, например, используются в цифровом процессоре эффектов BOSS GX700, имеющим, по отзывам многих знаменитых западных музыкантов, даже более ламповое звучание, чем многие истинно ламповые Hi-Fi усилители. К сожалению, почему-то в продаже до сих пор нет дешевых массовых звуковых карт на основе этих последних наиболее совершенных и недорогих (всего $75) моделей АЦП от фирмы Analog Devices. Интересно, что в Петербурге сразу несколько небольших фирм предлагают заказные многоканальные студийные оцифровщики на основе этих АЦП. Конечно цена на них несколько больше $75.

Некоторые методы "борьбы" с "цифровыми" искажениями.

Иногда ламповые усилители используются для "оживления звука" при окончательной подготовке фонограммы. На некоторых Российских и зарубежных фирмах полностью записанная и сведенная в "цифре" фонограмма переводится из цифры в аналог, пропускается через несколько ламповых эквалайзеров (например, TL Audio G400) или усилителей и снова оцифровывается и записывается на CD-R или магнитооптический диск. Конечно, какой то положительный эффект от этой процедуры будет, но, по-видимому, только в случае прослушивания записи через транзисторный усилитель. В случае же использования конечным слушателем лампового усилителя двойное прохождение сигнала через лампы (на стадии записи и воспроизведения) может и окончательно "убить" звук. Предпринимались попытки цифрового моделирования лампового усилителя. Однако plug-in для WaveLab "RedValve" не впечатлил меня, хотя некоторое сходство со звуком недорогого лампового усилителя, несомненно, ощущается. И потом, воспроизведение ламповыми усилителями самых высоких частот (8..20 Кгц) не столь уж и хорошо. Рекомендую проделать простой опыт. Отфильтровать цифровым (аналоговый вносит фазовые искажения) фильтром в фонограмме диапазон 8..20 Кгц и воспроизвести его через ламповый и транзисторный усилитель с обычными параметрами АЧХ от 20 Гц до 30 Кгц и нелинейными искажениями на уровне 0.01% (такой стоит не более $100). Строгие математические определения АЧХ и коэффициента нелинейных искажений можно прочитать в моей статье в КТ N 243. В этих условиях в моих экспериментах эксперты не отдавали никакого предпочтения ламповому усилителю. Многим экспертам не понравилось некоторое смягчение атаки лампами при воспроизведении звуков "тарелочек" и недостаточно "глубокое" воспроизведение самых низких частот из-за "врожденных" ограничений трансформаторных усилителей. Так что преимущество лампового звука, по видимому проявляется только при воспроизведении средних частот (200..8000 Гц). С точки зрения имитации "живого" звука чисто цифровыми методами очень интересен процессор обработки BOSS GX700. Он полностью "в цифре" в реальном масштабе времени создает типизированную виртуальную студию звукозаписи. Сначала входной сигнал (с электрогитары и т.д.) поступает на 20-битное высококачественное АЦП. Далее оцифрованный сигнал обрабатывается имитатором лампового усилителя и эквалайзера. Причем можно выбрать тип устройства из большого списка реально продающихся на рынке аналоговых усилителей. Затем сигнал поступает на "speaker simulator", симулятор звуковых колонок, играющих очень важную роль при "оживлении" звука. Тип виртуальных "цифровых" колонок можно выбрать из обширного списка реально существующих на аудио рынке. После "цифровых" колонок сигнал поступает на ревербератор, имитирующий акустические свойства помещений студий звукозаписи. Размеры помещений и величину коэффициента затухания процессов реверберации можно выбрать из списка и подрегулировать вручную. Кроме ревербератора на этой стадии можно подключить звуковые эффекты флэнжер, хорус, фэйзер, гармонайзер, питч-шифтер, делэй. Далее сигнал поступает на имитатор микрофона, тип которого, конечно же, можно выбрать из большого списка. Возможно, также регулировать местоположение микрофона в виртуальной студии. Затем сигнал поступает на имитатор лампового микрофонного предусилителя, тип которого выбирается из списка, и, наконец, на сигнал подается на выход процессора обработки звука BOSS GX700. И все это работает в реальном времени! К сожалению чисто программной реализации подобного устройства для персонального компьютера мне обнаружить не удалось. Поэтому сейчас я по мере сил своих и возможностей пытаюсь сам запрограммировать нечто, хотя бы приближающееся по функциональным возможностям к BOSS GX700.

На обычных музыкальных компакт дисках сигнал записан с частотой дискретизации 44.1 Кгц. Таким образом, теоретически максимально возможная частота записи будет 22.05 Кгц. На практике большинство современных ЦАП среднего ценового диапазона при данной частоте дискретизации позволяет воспроизводить без заметных искажений частоты до 18..19 Кгц. На более высоких частотах начинается действие цифрового, а затем и аналогового интерполирующих фильтров, подавляющих частоты около 22 Кгц до 40..50 и более децибел и вносящих, к сожаление, некоторые линейные, нелинейные и интермодуляционные искажения. Выбор частоты среза высоких частот около 18..19 Кгц, а не, например, выше 21 Кгц, определяется в основном экономическими причинами. Сложность цифрового интерполирующего фильтра, а, следовательно, его цена резко возрастают по мере приближения частоты среза к половине частоты дискретизации при заданном подавлении (40..50 дБ) в районе половины частоты дискретизации. Если предположить, что исходный музыкальный компакт диск записан с применением oversampling и высококачественного цифрового фильтра стоимостью несколько тысяч долларов с частотой среза в районе 21 Кгц, а в вашем CD проигрывателе или звуковой карте (если вы прослушиваете музыку на персональном компьютере) используется дешевое ЦАП со "слабеньким" цифровым фильтром с частотой среза 18 Кгц, то очевидно, при воспроизведении произойдет заметное ухудшения качества звука на самых высоких частотах. Можно легко убедиться в наличие этого эффекта и даже несколько уменьшить его проявление следующим образом. Многие даже очень дешевые звуковые карты (opti-931, Acer S23) поддерживают частоту дискретизации 48 Кгц. При ее использовании включается частота среза цифрового фильтра не 18..19 Кгц как для частоты дискретизации 44.1 Кгц, а 20..21 Кгц (так как 48 Кгц > 44.1 Кгц), то есть как у более дорогих ЦАП. Это можно использовать для получения более качественного звука на высоких частотах. Сначала надо импортировать в цифровом виде (без ЦАП/АЦП преобразований) в WAV файл дорожку (трек) с музыкального компакт диска на жесткий диск с помощью программ WaveLab 1.6 или WinDac32. Затем, используя программы WaveLab, CoolEdit или EDS TOOLS произведите передескретизацию музыкального цифрового сигнала со стандартной для частоты дискретизации 44.1 Кгц на 48 Кгц. В этих программах используется "software" реализация очень качественных 32-битных цифровых фильтров с характеристиками самых дорогих студийных устройств. Полученный WAV файл воспроизведите стандартным Windows 95 мультимедиа проигрывателем или программой WaveLab. Я проделал такие операции для звуковых карт OPTi-931, Yamaha SA700, Monster Sound 3D, Ensoniq Soundscape Ellite, Acer S23 и во всех случаях получил довольно заметное улучшение воспроизведения самых высоких частот. Очень жаль, что пока не удалось обнаружить программу, проделывающую все эти операции в реальном времени без обращения к жесткому диску персонального компьютера.

С кассеты на компакт диск…

Для начала небольшая цитата из письма читателя КТ. "Но зато есть с полдюжины обычных кассет с домашними записями группы, где я играл. Записи, как вы можете без труда догадаться, отнюдь не прекрасного качества, ностальгия прошедших дней заставляет меня искать пути высококачественной перезаписи всего материала на компакт диски… какие карты лучше оцифровывают, какие программы убирают шумы, чтобы оставался весь полезный сигнал…". По своему опыту знаю, что старые домашние записи на катушках, сделанные на магнитофонах типа Маяк-205, Ростов-102 и подобных, обычно имеют уровень шума примерно -65..-70 дБ. Спектр шумов в основном располагается на частотах от 5..6 Кгц до 16..18 Кгц. Более тяжелая ситуация в записях на компакт кассетах. Уровень шума примерно -55..-60 дБ. Спектр шума от 3..4 Кгц до 12..14 Кгц. Для таких записей характерен недостаток самых высоких частот и хорошо заметное шипение в области средних частот. Для оцифровки домашних записей по минимуму вполне подойдут любые звуковые карты на основе наборов микросхем производства фирм Analog Devices или Crystal, например Monster Sound 3D, Ensoniq SoundScape Ellite или PCI и даже Acer S23 и OPTi-931 стоимостью $10. Все эти карты обеспечивают по линейному входу уровень шума -80 дБ и нелинейные искажения около 0.02% и АЧХ 20 гц .. 20 Кгц (Читайте мою статью о звукрвых картах и их параметрах в КТ N243). Дальнейшее улучшение отношения сигнал/шум на 6..10 дБ обойдется вам в дополнительные $100..$150. Например, звуковая карта AWE 64 GOLD за $173 дает шум на уровне -86..-90 дБ по линейному входу при 0.02% нелинейных искажений, измеренных по методике и с помощью программы, описанной в КТ N243. Использовать более дорогостоящие карты типа Turtle Beach Pinnacle, Digital Wings и подобные им при стоимости в $500 и более в данном случае вряд ли целесообразно. Вам придется доплатить несколько сот долларов ради получения выигрыша по шумам на 6..10 дБ и незначительного увеличения чистоты и прозрачности звука. Оцифровку рекомендую проводить на частоте дискретизации 48 Кгц. По завершении оцифровке можно приступить и к обработке. Для катушечных записей рекомендую для начала попробовать подавить высокочастотные шумы с помошью имеющихся в программах WaveLabe, Sound Forge и CoolEdit шумоподавителей. Причем надо попробовать все программы, так как они использую разные алгоритмы и дают несколько различающиеся результаты. После так называемых пороговых щумоподавителей очень рекомендую обработать запись ревербератором. Иначе звук на высоких частотах будет неестественно "обрывитсым". Конечно, нужна умеренность. Уровень сигнала реверберации неплохо установить слегка выше порога отсечки шумоподавителя. Недостаток самых высоких частот можно поробовать компенсировать применением так называемых эксайтеров. В отличие от эквалайзеров и регуляторов тембра эксайтеры не увеличивают уровень шума вместе с подъемом высоких частот. С другой стороны высокие частоты, добавляемые эксайтерами, не на сто процентов звучат как настоящие. Звук немного неестественный. Но иногда это лучше, чем вообще ничего. Можно попробовать обойтись и без эксайтера. Отфильтруйте из исходного сигнала диапазон частот от 5 Кгц до 11 Кгц и сохраните в отдельном WAV файле. Затем с помощью pitch-shifter сдвиньте частоты сигнала на одну октаву. В результате спектр будет занимать диапазон частот от 10 Кгц до 22 Кгц. Далее уменьшите амплитуду полученного сигнала на 20..40 дБ и добавьте к исходному сигналу. Таким образом, как бы восстановятся самые высшие частотные составляющие. Огромная проблема со средне частотными шумами на записях с компакт кассет. Дело в том, что спектр таких шумов занимает те же частоты, что и спектр полезных сигналов. Поэтому отделить одно от другого крайне проблематично. Я вообще не видел программ, способных делать такое в автоматическом режиме. Вручную можно попробовать вычищать сигнал маленькими отрезочками длинной в десятые доли секунды с помощью многополосного эквалайзера и шумоподавителей с индивидуально подобранными для каждого отрезка параметрами. Так можно добиться неплохих результатов, но трудозатраты колоссальные. Несколько слов о нерешенных мной проблемах. Все протестированные мной звуковые карты от самых дешевых до самых дорогих имели крайне неудовлетворительное отношение сигнал/шум с микрофонного входа. Например, Turtle Beach Pinnacle по линейному входу имеет сигнал/шум больше 92 дБ, а по микрофонному входу только 65 дБ. А ведь эта карта считается одной из самых малошумящих. Получается, что при увеличении аналогового коэффициента усиления на 20 дБ на столько же ухудшается и отношение сигнал/шум. Что же делать? Как же получить отношение сигнал/шум по микрофонному входу хотя бы 80 дБ?

Hi-End и цифра

В среде любителей Hi-End и звукорежиссеров долгое время принято было жестоко ругать 16-битный звук обычных музыкальных компакт дисков. Все недостатки Hi-Fi усилителей, колонок и CD проигрывателей обычно списывались на врожденные пороки цифрового представления сигналов. Однако последнее время практически во всех аудиофильских журналах появились аналитические и обзорные статьи о CD проигрывателях ценового диапазона от $2000 до $5000. В них авторитетные в аудиофильской среде эксперты после сравнения современных цифровых проигрывателей компакт дисков и аналоговых проигрывателей виниловых пластинок примерно одинакового ценового диапазона начали все чаще отдавать предпочтение банальному 16 бит 44.1 Кгц звуку. И это не мое личное мнение, а это уже как бы общее место, факт общественного аудиофильского мнения (смотри, например, статью "Цифра цифре рознь" в журнале Салон Audio-Video N6 стр. 69). Поэтому предлагаю оставить бесплодные попытки опровергнуть теорему Найквиста и попробовать разобраться, какие же изменения (улучшения) произошли в Hi-End апаратуре за последние годы. В схемотехнике и элементной базе ламповых усилителей существенных сдвигов почти нет. Кроме одного. Лет десять назад, когда я увлекался конструированием ламповых усилителей, невозможно было и мечтать о выходном трансформаторе с полосой пропускания от 10 гц аж до 50 Кгц. А теперь это самое обычное дело! С таким "фантастическим" трансформатором практически любой ламповый усилитель на банальных 6П3С сразу превращается в Hi-End устройство (например усилитель Old Timer за $4700 ). CD проигрыватели постепенно дрейфуют в сторону превращения в нечто, весьма напоминающее персональный компьютер с CD-ROM и звуковой картой. Например, аппарат Audio Research CD2, принадлежащий к средней ценовой категории Hi-End, в качестве основы транспортной части проигрывателя использует "жесткую конструкцию компьютерного драйвера CD-ROM". Видимо, это во многом и определяет улчшение звука. Для цифро-аналогового преобразования применяется микросхема 20-битного ЦАП Crystal CS4329, часто используемая и в звуковых картах. Не надо удивляться 20-битности. Как я уже писал в статье о АЦП/ЦАП с помощью цифровой фильтрации и интерполяции 16-битный сигнал, обработанный алгоритмами noise shaping и дизеринг, может быть превращен в сигнал большей разрядности. Не уверен, что можно "вытащить" 4 разряда, но добавить 1..2 бита можно и по известным мне алгоритмам. Кроме того, повышенная разрядность позволяет осуществлять регулировку громкости в цифровом виде и без использования аналоговых предусилителей, что также способствует повышению качества звука. Огромное внимание в Audio Research CD2 уделяется борьбе с джитером. Судя по всему, разработчики этого аппарата все же не до конца понимают иделогию структуры персонального компьютера и сами себе создают проблемы с джитером, а затем успешно их преодолевают. Собственно CD проигрыватель Audio Research CD2 соединяется с блоком ЦАП с помощью S/PDIF! Вот тут и появляется джитер, с которым и борется великолепный специальный процессор. На мой взгляд, разумнее было бы полностью следовать идеологии ПК и соединить CD транспорт с ЦАП по IDE, SCSI, ISA, PCI или, на худой конец, через Fast Ethernet, в корне устранив джитер. Я думаю, для компьютерщиков такое решение тривиально, а для Hi-End инженеров это революция! В целом же аппараты подобные Audio Research CD2 имеют вполне Hi-End звук, "подкупающий открытостью, чистотой и особенной ясностью звуковой картины". И все это в пределах тех же старых добрых 16 бит 44.1 Кгц!

Подводя итоги, можно сделать вывод, что сегодня весь процесс создания многоканальной цифровой звукозаписи, обработки, наложения звуковых эффектов, сведения, формирования стерео панорамы, подготовки 16-битных данных со стандартной для музыкальных CD частотой дискретизации 44.1 Кгц и тиражирование музыкальных компакт дисков может быть выполнен на профессиональном уровне в домашних условиях на одном персональном компьютере.

Симаненков Дмитрий. e-mail: digital_sound@bigfoot.com