Реферат на тему «Аналоговая и цифровая звукозапись: специфика и перспективы»

Скачать пример Заказать работу Скачать пример Заказать работу

Содержание

Введение
1. Аналоговая звукозапись
2. Представление звука в цифровом виде
3. АЦП и ЦАП
4. Dithering и Noise Shaping
5. Интерфейсы для передачи цифрового звука
6. Методы эффективного сжатия цифрового звука
7. Форматы цифрового звука
8. Цифровая звуковая рабочая станция
9. Жесткие диски в рабочих станциях
10. Цифровая обработка звука
11. Компьютерные программы для обработки звука
12. Звуковые платы
Заключение
Список использованных источников

Введение

Звукозапись – это фиксирование любого аудиоматериала на конкретный носитель. С изобретения фонографа, а вернее с 12 августа 1877 года, и начинается точка отсчета истории звукозаписи. Мир развивался, а с его усовершенствованием приходили новые идеи. Постепенно задуманное воплощалось в жизнь: стало возможным аналоговая запись звука, а благодаря огромному техническому прогрессу, произошедшему в последние десятилетия, появилась и цифровая звукозапись. При подготовке программ радиовещания из всех технологических операций наиболее часто используется запись звуковых сигналов.

1. Аналоговая звукозапись

Звук как таковой имеет аналоговую природу. Он распространяется в воздухе и при этом неизбежно искажается. На искажения звука оказывают влияние самые разные условия: расстояние от источника, скорость движения относительно него, особенности отражения от окружающих предметов и т.д.

Человеческое ухо воспринимает звуковые колебания в диапазоне от 20 Hz до 20 000 Hz. Однако далеко не каждый может похвастаться такими выдающимися слуховыми возможностями. Основная масса взрослых слышит частоты до 16 000-18 000 Hz. Стоит уточнить, что даже частоты выше 6 000-8 000 Hz обычно являются только дополнительными гармониками и призвуками.

С другой стороны, качество записи во многом определяется как раз правильным воспроизведением гармоник и иных высокочастотных элементов.

При аналоговой записи звуковая волна, попадая в микрофон, превращается в электрическое колебание, которое потом подается или на механический резец, если речь идее о виниловой пластинке, или на магнитную головку, если запись производится на магнитную ленту.

Чтобы воспроизвести звук, следует протянуть намагниченную ленту вдоль магнитной головки, причем скорость этого процесса должна быть равной скорости записи.

В случае же с винилом для воспроизведения будет нужно прогнать иглу по канавке, в которой записана информация. Механические колебания будут преобразованы в электрические, которые передадутся в усилитель, а с усилителя соответственно в громкоговорители.

При внимательном ознакомлении с вышеизложенным материалом вполне очевидно несовершенство аналоговой записи.

Записывая на магнитную ленту, следует побеспокоиться о качестве магнитной головки и учесть ее калибровку относительно ленты.
Неточности лентопротяжного механизма порождают непостоянство ее скорости.
Нельзя не упомянуть о способности ленты растягиваться, об изменениях ее характеристик на всем протяжении, о случайных посторонних частицах на ней и т.д.
В случае с виниловой пластинкой имеют место детонация, попадание пыли в канавки и всевозможные механические повреждения. Кроме того, канавка, так или иначе, деформируется после каждого проигрывания.
Ну и, наконец, стоит вспомнить, что практически невозможно сделать копию виниловой пластинки или магнитной записи без потери качества. Да и все аналоговые носители со временем стареют и теряют в качестве звучания, даже если их не использовать слишком часто.

2. Представление звука в цифровом виде

Исходная форма звукового сигнала — непрерывное изменение амплитуды во времени — представляется в цифровой форме с помощью «перекрестной дискретизации» — по времени и по уровню.

Строго говоря, любой аналоговый сигнал в конечном счете тоже дискретен как по времени, так и по величине — например, звуковой сигнал является результатом взаимодействия конечного числа атомов или молекул газов и твердых тел, электрический сигнал — результатом перемещения конечного числа элементарных зарядов (электронов) и т.п. Поэтому, говоря о дискретизации аналогового сигнала, имеют в виду значительно большую степень дискретности, которая поддается измерению приборами средней точности.

Согласно теореме Котельникова, любой непрерывный процесс с ограниченным спектром может быть полностью описан дискретной последовательностью его мгновенных значений, следующих с частотой, как минимум вдвое превышающей частоту наивысшей гармоники процесса; частота Fd выборки мгновенных значений (отсчетов) называется частотой дискретизации.

Из теоремы следует, что сигнал с частотой Fa может быть успешно дискретизирован по времени на частоте 2Fa только в том случае, если он является чистой синусоидой, ибо любое отклонение от синусоидальной формы приводит к выходу спектра за пределы частоты Fa. Таким образом, для временной дискретизации произвольного звукового сигнала (обычно имеющего, как известно, плавно спадающий спектр), необходим либо выбор частоты дискретизации с запасом, либо принудительное ограничение спектра входного сигнала ниже половины частоты дискретизации.

Нужна помощь в написании реферата?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Заказать реферат

Одновременно с временной дискретизацией выполняется амплитудная — измерение мгновенных значений амплитуды и их представление в виде числовых величин с определенной точностью (квантование). Точность измерения (двоичная разрядность N получаемого дискретного значения) определяет уровень шума, вносимого квантованием, и динамический диапазон цифрового сигнала (теоретически, для цифрового сигнала в чистом виде, это взаимно-обратные величины, однако любой реальный тракт имеет также и собственный уровень шумов и помех).

Полученный поток чисел (серий двоичных цифр), описывающий звуковой сигнал, называют импульсно-кодовой модуляцией или ИКМ (Pulse Code Modulation, PCM), так как каждый импульс дискретизованного по времени сигнала представляется собственным цифровым кодом.

Чаще всего применяют линейное квантование, когда числовое значение отсчета пропорционально амплитуде сигнала. Из-за логарифмической природы слуха более целесообразным было бы логарифмическое квантование, когда числовое значение пропорционально величине сигнала в децибелах, однако это сопряжено с трудностями технического характера.

Временная дискретизация и амплитудное квантование сигнала неизбежно вносят в сигнал шумовые искажения, уровень которых принято оценивать по формуле 6N + 10lg (Fдискр/2Fмакс) + C (дБ), где константа C варьируется для разных типов сигналов: для чистой синусоиды это 1.7 дБ, для звуковых сигналов — от -15 до 2 дБ. Отсюда видно, что к снижению шумов в рабочей полосе частот 0..Fмакс приводит не только увеличение разрядности отсчета, но и повышение частоты дискретизации относительно 2Fмакс, поскольку шумы квантования «размазываются» по всей полосе вплоть до частоты дискретизации, а звуковая информация занимает только нижнюю часть этой полосы.

В большинстве современных цифровых звуковых систем используются стандартные частоты дискретизации 44.1 и 48 кГц, однако частотный диапазон сигнала обычно ограничивается возле 20 кГц для оставления запаса по отношению к теоретическому пределу. Также наиболее распространено 16-разрядное квантование по уровню, что дает предельное соотношение сигнал/шум около 98 дБ. В студийной аппаратуре используются более высокие разрешения — 18-, 20- и 24-разрядное квантование при частотах дискретизации 56, 96 и 192 кГц. Это делается для того, чтобы сохранить высшие гармоники звукового сигнала, которые непосредственно не воспринимаются слухом, но влияют на формирование общей звуковой картины.

Для оцифровки более узкополосных и менее качественных сигналов частота и разрядность дискретизации могут снижаться; например, в телефонных линиях применяется 7или 8-разрядная оцифровка с частотами 8..12 кГц.

Представление аналогового сигнала в цифровом виде называется также импульсно-кодовой модуляцией (ИКМ, PCM — Pulse Code Modulation), так как сигнал представляется в виде серии импульсов постоянной частоты (временная дискретизация), амплитуда которых передается цифровым кодом (амплитудная дискретизация). PCM-поток может быть как параллельным, когда все биты каждого отсчета передаются одновременно по нескольким линиям с частотой дискретизации, так и последовательным, когда биты передаются друг за другом с более высокой частотой по одной линии.

Сам цифровой звук и относящиеся к нему вещи принято обозначать общим термином Digital Audio; аналоговая и цифровая части звуковой системы обозначаются терминами Analog Domain и Digital Domain.

Нельзя не упомянуть, что цифровая запись не подвержена старению или каким-либо другим временным изменениям. С нее можно создать сколько угодно копий с одинаковой точностью.

Как можно заметить из всего вышесказанного, теория цифровой записи не подразумевает наличия каких-либо в ней изъянов. Давайте разберемся, что же происходит на практике.

1. Во-первых, для получения высокого качества требуется высококачественная оцифровка аналогового звука, которая главным образом зависит от качества АЦП – аналого-цифрового преобразователя. Высококлассный микрофон или дорогостоящие соединительные кабели не помогут в ситуации, когда качество работы АЦП оставляет желать лучшего.

Запись отсчетов с недостаточной точностью, создание выборок с неравномерной частотой и т.п. приведут к получению звука, далекого по качеству от оригинала, и исправить это уже не удастся потом ничем.

2. А во-вторых, оцифрованный звук нужно ведь еще и качественно воспроизвести, что возможно только при наличии качественного ЦАП – цифро-аналогового преобразователя.

Из-за неравномерной частоты дискретизации, недостаточной точности или отсутствия интерполяции звук испортится так, что никакая современная акустическая система этого не компенсирует.

Таким образом, можно понять что, на качество цифровой записи и воспроизведения главным образом влияет качество преобразователей.

Преобразователи, встроенные в современные (причем, отнюдь не в самые дешёвые) аудиоинтерфейсы, в своей основной массе не способны выдавать действительно высококачественный звук и по этой причине многие отдают предпочтение аналоговой записи.

Нужна помощь в написании реферата?

Подробнее

Но, всё же, резюмируя вышесказанное, стоит отметить, что цифровая запись обладает определёнными и достаточно выраженными преимуществами, по сравнению с аналоговой.

Хотя на практике для получения действительно качественного цифрового звука нужно потратить немало средств на высококачественные преобразователи.

3. АЦП и ЦАП

Аналогово-цифровой и цифро-аналоговый преобразователи. Первый преобразует аналоговый сигнал в цифровое значение амплитуды, второй выполняет обратное преобразование. В англоязычной литературе применяются термины ADC и DAC, а совмещенный преобразователь называют codec (coder-decoder).

Принцип работы АЦП состоит в измерении уровня входного сигнала и выдаче результата в цифровой форме. В результате работы АЦП непрерывный аналоговый сигнал превращается в импульсный, с одновременным измерением амплитуды каждого импульса. ЦАП получает на входе цифровое значение амплитуды и выдает на выходе импульсы напряжения или тока нужной величины, которые расположенный за ним интегратор (аналоговый фильтр) превращает в непрерывный аналоговый сигнал.

Для правильной работы АЦП входной сигнал не должен изменяться в течение времени преобразования, для чего на его входе обычно помещается схема выборки-хранения, фиксирующая мгновенный уровень сигнала и сохраняющая его в течение всего времени преобразования. На выходе ЦАП также может устанавливаться подобная схема, подавляющая влияние переходных процессов внутри ЦАП на параметры выходного сигнала.

При временнОй дискретизации спектр полученного импульсного сигнала в своей нижней части 0..Fa повторяет спектр исходного сигнала, а выше содержит ряд отражений (aliases, зеркальных спектров), которые расположены вокруг частоты дискретизации Fd и ее гармоник (боковые полосы). При этом первое отражение спектра от частоты Fd в случае Fd = 2Fa располагается непосредственно за полосой исходного сигнала, и требует для его подавления аналогового фильтра (anti-alias filter) с высокой крутизной среза. В АЦП этот фильтр устанавливается на входе, чтобы исключить перекрытие спектров и их интерференцию, а в ЦАП — на выходе, чтобы подавить в выходном сигнале надтональные помехи, внесенные временной дискретизацией.

4. Dithering и Noise Shaping

Это в некотором роде искусственные методы обработки цифрового звукового сигнала, направленные на улучшение субъективного качества звучания ценой очевидного ухудшения его объективных характеристик (прежде всего — коэффициента нелинейных искажений и соотношения сигнал/шум).

Dithering (сглаживание) заключается в добавлении к сигналу небольшого количества шума (псевдослучайного цифрового сигнала) разного спектра (белый, розовый и т.п.). При этом заметно ослабляется корреляция ошибок квантования с полезным сигналом («рассеиваются» ошибки округления) и, несмотря на некоторое увеличение шума, субъективное качество звучания заметно повышается. Уровень добавляемого шума выбирается в зависимости от задачи и колеблется от половины младшего разряда отсчета до нескольких разрядов.

Noise Shaping (формовка шума) заключается в преобразовании сильно зашумленного полезного сигнала с целью вытеснения чисто шумовых компонент в надтональную область с выделением в нижней части спектра основной энергии полезного сигнала. По существу, Noise Shaping является одним из видом PWM (Pulse Width Modulation — широтно-импульсная модуляция, ШИМ) с дискретной шириной импульса. Сигнал, обработанный этим методом, требует обязательной фильтрации с подавлением высоких частот — это выполняется либо цифровым, либо аналоговым способом.

Основное применение Noise Shaping находит в области представления цифровых сигналов отсчетами меньшей разрядности с повышенной частотой следования. В delta-sigma ЦАП для повышения частоты следования отсчетов увеличивается в десятки раз частота дискретизации, на которой из исходных многоразрядных отсчетов формируются серии отсчетов разрядностью 1..3. Низкочастотная часть спектра потока этих отсчетов с высокой точностью повторяет спектр исходного сигнала, а высокочастотная содержит в основном чистый шум.

В случае преобразования цифрового сигнала к отсчетам более низкой разрядности на той же частоте дискретизации Noise Shaping выполняется вместе с операцией Dithering’а. Поскольку в этом случае повышение частоты дискретизации невозможно, вместо этого спектр добавляемого шума формируется таким образом, чтобы его низкая среднечастотная часть максимально точно повторяла слабую часть сигнала, заключенную в отсекаемых младших разрядах отсчетов. Благодаря этому основная энергия шума вытесняется в верхнюю часть рабочего диапазона частот, а в наиболее слышимой области остаются вполне разборчивые следы слабого сигнала, который иначе оказался бы полностью уничтоженным. Несмотря на то, что объективные искажения сохраненного таким образом слабого сигнала очень велики, его субъективное восприятие остается вполне приемлемым, позволяя воспринимать на слух компоненты, уровень которых меньше младшего разряда отсчета.

По существу, Dithering и Noise Shaping являются частными случаями одной технологии — с той разницей, что в первом случае используется белый шум с равномерным спектром, а во втором — шум со спектром, специально сформированным под конкретный сигнал. Данная технология приводит к «нестандартному» использованию цифрового формата, основанному на особенностях человеческого слуха.

5. Интерфейсы для передачи цифрового звука

S/PDIF (Sony/Philiрs Digital Interface Format — формат цифрового интерфейса фирм Sony и Philiрs) — цифровой интерфейс для бытовой радиоаппаратуры.

AES/EBU (Audio Engineers Society / European Broadcast Union — общество звукоинженеров / европейское вещательное объединение) — цифровой интерфейс для студийной радиоаппаратуры.

Оба интерфейса являются последовательными и используют одинаковый формат сигнала и систему кодирования — самосинхронизирующийся код BMC (Biphase-Mark Code — код с представлением единицы двойным изменением фазы), и могут передавать сигналы в формате PCM разрядностью до 24 бит на частотах дискретизации до 48 кГц.

Каждый отсчет сигнала передается 32-разрядным словом (кадром), в котором 20 разрядов используются для передачи отсчета, а 12 — для формирования синхронизирующей преамбулы, передачи дополнительной информации и бита четности. 4 разряда из служебной группы могут использоваться для расширения формата отсчетов до 24 разрядов.

192 последовательных кадра образуют блок, начало которого отмечается специальным кодом преамбулы первого кадра.

Помимо бита четности, служебная часть слова содержит бит достоверности (Validity), который должен быть нулевым для каждого достоверного отсчета. В случае приема слова с единичным битом Validity либо с нарушением четности в слове приемник трактует весь отсчет как ошибочный и может на выбор либо заменить его предыдущим значением, либо интерполировать на основе нескольких соседних достоверных отсчетов. Отсчеты, помеченные как недостоверные, могут передавать CD-проигрыватели, DAT-магнитофоны и другие устройства, если при считывании информации с носителя не удалось скорректировать возникшие в процессе чтения ошибки.

В служебную часть слова входят также биты C (Channel Status — состояние канала) и U (User Bit — бит пользователя). Последовательная цепочка каждого из этих битов, взятых по одному из каждого кадра блока, образует 192-разрядное слово служебных битов блока, где передается информация о названии произведения, номере дорожки, идентификаторе передающего устройства, субкодах компакт-диска и т.п. В S/PDIF передаются параметры защиты от копирования (SCMS).

Стандартно формат кодирования предназначен для передачи одно- и двухканального сигнала, однако при использовании служебных разрядов для кодирования номера канала возможна передача многоканального сигнала.

С электрической стороны S/PDIF предусматривает соединение коаксиальным кабелем с волновым сопротивлением 75 Ом и разъемами типа RCA («тюльпан»), амплитуда сигнала — 0.5 В. AES/EBU предусматривает соединение симметричным экранированным двухпроводным кабелем с трансформаторной развязкой по интерфейсу RS-422 с амплитудой сигнала 3-10 В, разъемы — трехконтактные типа Cannon XLR. Существуют также оптические варианты приемопередатчиков — TosLink (пластмассовое оптоволокно) и AT&T Link (стеклянное оптоволокно).

6. Методы эффективного сжатия цифрового звука

В настоящее время наиболее известны Audio MPEG, PASC и ATRAC. Все они используют так называемое «кодирование воспринимаемого» (perceptual coding) при котором из звукового сигнала удаляется информация, малозаметная для слуха. В результате, несмотря на изменение формы и спектра сигнала, его слуховое восприятие практически не меняется, а степень сжатия оправдывает незначительное уменьшение качества. Такое кодирование относится к методам сжатия с потерями (lossy compression), когда из сжатого сигнала уже невозможно точно восстановить исходную волновую форму.

Приемы удаления части информации базируются на особенности человеческого слуха, называемой маскированием: при наличии в спектре звука выраженных пиков (преобладающих гармоник) более слабые частотные составляющие в непосредственной близости от них слухом практически не воспринимаются (маскируются). При кодировании весь звуковой поток разбивается на мелкие кадры, каждый из которых преобразуется в спектральное представление и делится на ряд частотных полос. Внутри полос происходит определение и удаление маскируемых звуков, после чего каждый кадр подвергается адаптивному кодированию прямо в спектральной форме. Все эти операции позволяют значительно (в несколько раз) уменьшить объем данных при сохранении качества, приемлемого для большинства слушателей.

Каждый из описанных методов кодирования характеризуется скоростью битового потока (bitrate), с которой сжатая информация должна поступать в декодер при восстановлении звукового сигнала. Декодер преобразует серию сжатых мгновенных спектров сигнала в обычную цифровую волновую форму.

Audio MPEG — группа методов сжатия звука, стандартизованная MPEG (Moving Pictures Experts Group — экспертной группой по обработке движущихся изображений). Методы Audio MPEG существуют в виде нескольких типов — MPEG-1, MPEG-2 и т.д.; в настоящее время наиболее распространен тип MPEG-1.

Существует три уровня (layers) Audio MPEG-1 для сжатия стереофонических сигналов:

1 — коэффициент сжатия 1:4 при потоке данных 384 кбит/с; 2 — 1:6..1:8 при 256..192 кбит/с; 3 — 1:10..1:12 при 128..112 кбит/с.

Минимальная скорость потока данных в каждом уровне определяется в 32 кбит/с; указанные скорости потока позволяют сохранить качество сигнала примерно на уровне компакт-диска.

Все три уровня используют входное спектральное преобразование с разбиением кадра на 32 частотные полосы. Наиболее оптимальным в отношении объема данных и качества звука признан уровень 3 со скоростью потока 128 кбит/с и плотностью данных около 1 Мб/мин. При сжатии с более низкими скоростями начинается принудительное ограничение полосы частот до 15-16 кГц, а также возникают фазовые искажения каналов (эффект типа фэйзера или фленжера).

Audio MPEG используется в компьютерных звуковых системах, CD-i/DVD, «звуковых» дисках CD-ROM, цифровом радио/телевидении и других системах массовой передачи звука.

PASC (Precision Adaptive Sub-band Coding — точное адаптивное внутриполосное кодирование) — частный случай Audio MPEG-1 Layer 1 со скоростью потока 384 кбит/с (сжатие 1:4). Применяется в системе DCC.

ATRAC (Adaptive TRansform Acoustic Coding — акустическое кодирование адаптивным преобразованием) базируется на стереофоническом звуковом формате с 16-разрядным квантованием и частотой дискретизации 44.1 кГц. При сжатии каждый кадр делится на 52 частотные полосы, результирующая скорость потока — 292 кбит/с (сжатие 1:5). Применяется в системе MiniDisk.

7. Форматы цифрового звука

Понятие формата используется в двух различных смыслах. При использовании специализированного носителя или способа записи и специальных устройств чтения/записи в понятие формата входят как физические характеристики носителя звука — размеры кассеты с магнитной лентой или диском, самой ленты или диска, способ записи, параметры сигнала, принципы кодирования и защиты от ошибок и т.п. При использовании универсального информационного носителя широкого применения — например, компьютерного гибкого или жесткого диска — под форматом понимают только способ кодирования цифрового сигнала, особенности расположения битов и слов и структуру служебной информации; вся «низкоуровневая» часть, относящаяся непосредственно к работе с носителем, в этом случае остается в ведении компьютера и его операционной системы.

Из специализированных форматов и носителей цифрового звука в настоящее время наиболее известны следующие:

CD (Compact Disk — компакт-диск) — односторонний пластмассовый диск с оптической лазерной записью и считыванием, диаметром 120 или 90 мм, вмещающий максимум 74 минуты стереозвучания с частотой дискретизации 44.1 кГц и 16-разрядным линейным квантованием. Система предложена фирмами Sony и Philips и носит название CD-DA (Compact Disk — Digital Audio). Для защиты от ошибок используется двойной код Рида-Соломона с перекрестным перемежением (Cross Interleaved Reed-Solomon Code, CIRC) и модуляция кодом Хэмминга 8-14 (Eight-to-Fourteen Modulation, EFM). Различаются штампованные (CD) однократно записываемые (CD-R) и многократно перезаписываемые (CD-RW) компакт-диски.

ИКМ-приставка (PCM deck) — система для преобразования цифрового звукового сигнала в псевдовидеосигнал, совместимый с популярными видеоформатами (NTSC, PAL/SECAM), и обратно. ИКМ-приставки применяются в сочетании с бытовыми (VHS) или студийными (S-VHS, Beta, U-Matic) видеомагнитофонами, используя их в качестве устройств чтения/записи. Устройства работают с 16-разрядным линейным квантованием на частотах дискретизации 44.056 кГц (NTSC) и 44.1 кГц (PAL/SECAM), и позволяют записывать двух или четырехканальную цифровую сигналограмму. По сути, такая приставка представляет собой модем (модулятор-демодулятор) для видеосигнала.

S-DAT (Stationary head Digital Audio Tape — цифровая звуковая лента с неподвижной головкой) — система наподобие обычного кассетного магнитофона, запись и чтение в которой ведутся блоком неподвижных тонкопленочных головок на ленте шириной 3.81 мм в двухсторонней кассете размером 86 x 55.5 x 9.5 мм. Реализует 16-разрядную запись двух или четырех каналов на частотах 32, 44.1 и 48 кГц.

R-DAT (Rotary head Digital Audio Tape — цифровая звуковая лента с вращающейся головкой) — система наподобие видеомагнитофона с поперечно-наклонной записью вращающимися головками. Наиболее популярный формат ленточной цифровой записи, системы R-DAT часто обозначаются просто DAT. В R-DAT используется кассета размером 73 x 54 x 10.5 мм, с лентой шириной 3.81 мм, а сама система кассеты и магнитофона очень похожа на типовой видеомагнитофон. Базовая скорость движения ленты — 8.15 мм/с, скорость вращения блока головок — 2000 об/мин. R-DAT работает с двухканальным (в ряде моделей — четырехканальным) сигналом на частотах дискретизации 44.1 и 48 кГц с 16-разрядном линейным квантованием, и 32 кГц — с 12-разрядным нелинейным. Для защиты от ошибок используется двойной код Рида-Соломона и модуляция кодом 8-10. Емкость кассеты — 80..240 минут в зависимости от скорости и длины ленты. Бытовые DAT-магнитофоны обычно оснащены системой защиты от незаконного копирования фонограмм, не допускающей записи с аналогового входа на частоте 44.1 кГц, а также прямого цифрового копирования при наличии запрещающих кодов SCMS (Serial Code Managenent System). Студийные магнитофоны таких ограничений не имеют.

DASH (Digital Audio Stationary Head) — система с записью на магнитную ленту шириной 6.3 и 12.7 мм в продольном направлении неподвижными головками. Скорость движения ленты — 19.05, 38.1, 76.2 см/с. Реализует 16-разрядную запись с частотами дискретизации 44.056, 44.1 и 48 кГц от 2 до 48 каналов.

ADAT (Alesis DAT) — собственная (proprietary) система восьмиканальной записи звука на видеокассету типа S-VHS, разработанная фирмой Alesis. Использует 16-разрядное линейное квантование на частоте 48 кГц, емкость кассеты составляет до 60 минут на каждый канал. Магнитофоны ADAT допускают каскадное соединение, в результате чего может быть собрана система 128-канальной синхронной записи. Для ADAT выпускается множество различных интерфейсных блоков для сопряжения с DAT, CD, MIDI и т.п. Модель Meridian (ADAT Type II) использует 20-разрядное квантование на частотах 44.1 и 48 кГц.

DCC (Digital Compact Cassette — цифровая компакт-кассета) — бытовая система записи в продольном направлении на стандартную компакт-кассету, разработанная Philips. Скорость движения ленты — 4.76 см/с, максимальное время звучания такое же, как при аналоговой записи. Частоты дискретизации — 32, 44.1, 48 кГц, разрешение — 16/18 разрядов (метод сжатия PASC). На DCC-магнитофонах могут воспроизводиться (но не записываться) обычные аналоговые компакт-кассеты. В настоящее время система DCC признана неперспективной.

MD (MiniDisk) — бытовая и концертная система записи на магнитооптический диск, разработанная Sony. Диск диаметром 64 мм, помещенный в пластмассовый футляр размером 70 x 67.5 x 5 мм, вмещает 74 минуты (60 в ранних версиях) стереофонического звучания. При обмене со внешними устройствами используется формат 16-разрядных отсчетов на частоте 44.1 кГц, однако на сам диск сигнал записывается после сжатия методом ATRAC.

Из универсальных компьютерных форматов наиболее популярны следующие:

Microsoft RIFF/WAVE (Resource Interchange File Format/Wave — формат файлов передачи ресурсов/волновая форма) — стандартный формат звуковых файлов в компьютерах IBM PC. Файл этого формата содержит заголовок, описывающий общие параметры файла, и один или более фрагментов (chunks), каждый из которых представляет собой волновую форму или вспомогательную информацию — режимы и порядок воспроизведения, пометки, названия и координаты участков волны и т.п. Файлы этого формата имеют расширение .WAV.

Apple AIFF (Audio Interchange File Format — формат файла обмена звуком) — стандартный тип звукового файла в системах Apple Macintosh. Похож на RIFF и также позволяет размещать вместе со звуковой волной дополнительную информацию, в частности — самплы WaveTable-инструментов вместе с параметрами синтезатора.

Формат «чистой оцифровки» RAW, не содержащий заголовка и представляющий собой только последовательность отсчетов звуковой волны. Обычно оцифровка хранится в 16-разрядном знаковом (signed) формате, когда первыми в каждой паре идут отсчеты левого канала, хотя могут быть и исключения.

8. Цифровая звуковая рабочая станция

Digital Audio Workstation (DAW) представляет собой специализированную или универсальную компьютерную систему, способную выполнять запись, хранение, воспроизведение и обработку цифрового звука. Специализированные системы ориентированы исключительно на работу с цифровым звуком и выпускаются в законченном исполнении, допускающем лишь ограниченное расширение, либо нерасширяемые вообще. Универсальные системы представляют собой обычный персональный компьютер, снабженный средствами для ввода/вывода звука (ЦАП/АЦП и/или цифровые интерфейсы) и набором программ для его записи, воспроизведения и обработки. Кроме этого, станция может содержать и другие компоненты — например, аппаратные модули цифровой обработки, музыкальные синтезаторы, записывающие CD-приводы и т.п.

Поскольку любая компьютерная система является сильным источником высокочастотных помех, возникают определенные проблемы в достижении профессионального качества звука при использовании встроенных АЦП/ЦАП. В таких случаях предпочтительно использование внешних модулей АЦП/ЦАП, выдающих и получающих цифровую информацию в реальном времени через универсальные или собственные цифровые интерфейсы.

9. Жесткие диски в рабочих станциях

Большинство специализированных рабочих станций используют для хранения звука жесткие диски с интерфейсом SCSI (Small Computer System Interface — интерфейс малых компьютерных систем), ставшие универсальным стандартом — любая популярная компьютерная система имеет возможность подключения этих дисков. Достоинствами SCSI является универсальность среди всех компьютерных систем, возможность подключения до семи устройств (любых, не только дисковых) к одному контроллеру, хороший арбитраж при конкуренции устройств, интеллектуальность каждого устройства, более высокое общее качество исполнения, возможность использования интерфейса для прямой связи между двумя станциями. К недостаткам SCSI следует отнести высокую стоимость интерфейсов и дисков и ограниченный спектр выпускаемых моделей.

В компьютерах типа IBM PC более популярны жесткие диски с интерфейсом IDE (Integrated Drive Electronics — электроника, встроенная в накопитель), не получившие распространения в других системах. Достоинства IDE-дисков — простота, хорошая производительность, не уступающая большинству SCSI-дисков, а в ряде случаев — превосходящая их, низкая стоимость, массовый выпуск, широкий спектр моделей. Недостатки — низкая производительность и надежность моделей низших классов, возможность подключения только двух накопителей к одному контроллеру, невозможность прямого соединения двух станций, часто худшая поддержка драйверами операционных систем.

10. Цифровая обработка звука

Прежде всего, необходимо различать «искажающие» и «неискажающие» виды обработки. К первым относятся операции, изменяющие форму и структуру сигнала — смешивание, усиление, фильтрация, модуляция и т.п., ко вторым — операции монтажа (вырезка, вклейка, наложение) и переноса (копирования).

Качество сигнала может страдать только при «искажающей» обработке, причем любой — и аналоговой, и цифровой. В первом случае это происходит в результате внесения шумов, гармонических, интермодуляционных и других искажений в узлах аналогового тракта, во втором — благодаря конечной точности квантования сигнала и математических вычислений. Все цифровые вычисления выполняются в некоторой разрядной сетке фиксированной длины — 16, 20, 24, 32, 64, 80 и более бит; увеличение разрядности сетки повышает точность вычислений и уменьшает ошибки округления, однако в общем случае не может исключить их полностью. Конечная точность квантования первичного аналогового сигнала приводит к тому, что даже при абсолютно точной обработке полученного цифрового сигнала квантованное значение каждого отсчета все равно отличается от своего идеального значения. Для минимизации искажений при обработке в студиях предпочитают обрабатывать и хранить сигналограммы на мастер-носителях с повышенным разрешением (20, 24 или 32 разряда), даже если результат будет тиражироваться на носителе с меньшим разрешением.

Кроме собственно ошибок вычислений и округления, на точность сильно влияет выбор представления числовых отсчетов сигнала при обработке. Традиционное представление PCM с так называемой фиксированной точкой (fixed point), когда отсчеты представляются целыми числами, наиболее удобно и влечет минимум накладных расходов, однако точность вычислений зависит от масштаба операций — например, при умножении образуются числа вдвое большей разрядности, которые потом приходится приводить обратно к разрядности исходных отсчетов, а это может привести к переполнению разрядной сетки. Компромиссным вариантом служит промежуточное увеличение разрядности отсчетов (например, 16->32), что снижает вероятность переполнения, однако требует большей вычислительной мощности, объема памяти и вносит дополнительные искажения при обратном понижении разрядности. Кроме того, снижению погрешности способствует правильный выбор последовательности коммутативных (допускающих перестановку) операций, группировка дистрибутивных операций, учет особенностей работы конкретного процессора и т.п.

Другим способом увеличения точности является преобразование отсчетов в форму с плавающей точкой (floating point) с разделением на значащую часть — мантиссу и показатель величины — порядок. В этой форме все операции сохраняют разрядность значащей части, и умножение не приводит к переполнению разрядной сетки. Однако, как само преобразование между формами с фиксированной и плавающей точкой, так и вычисления в этой форме требуют на порядки большего быстродействия процессора, что сильно затрудняет их использование в реальном времени.

Несмотря на то, что качество сигнала (относительно исходного аналогового) неизбежно, хоть и незначительно, ухудшается при любой «искажающей» цифровой обработке, некоторые операции при определенных условиях являются полностью и однозначно обратимыми. Например, усиление сигнала по амплитуде в три раза заключается в умножении каждого отсчета на три; если эта операция выполнялась с фиксированной точкой и при этом не возникло переполнения, с помощью деления на три потом можно будет вернуть все отсчеты в исходное состояние, тем самым полностью восстановив первоначальное состояние сигнала.

Сказанное выше демонстрирует, что ухудшение качества при «искажающей» цифровой обработке совсем не обязательно накапливается со временем, хотя в большинстве реальных применений происходит именно так. Кроме того, это не означает, что любая операция цифрового усиления всегда будет однозначно обратимой — это зависит от многих особенностей применения операции.

При сравнении аккуратности аналоговой и цифровой обработки нужно иметь в виду, что оба вида вносят в сигнал некоторое количество погрешностей, которые можно рассматривать как шум, однако каждый вид обработки имеет свои особенности. Любой элемент аналогового тракта вносит шум всегда, однако его величина колеблется в зависимости от качества тракта и вида обработки. При цифровой обработке «первичный» шум всегда вносится самим фактом квантования, а внутри цифрового тракта его могут вносить только операции с ограниченной точностью (например, описанное умножение на три шума не добавляет — оно лишь усиливает ранее внесенные шумы, и шум квантования в том числе).

Из этого следует, что точные операции не изменяют соотношения сигнал/шум цифрового сигнала, однако могут увеличивать ошибки первичного квантования. Таким образом, увеличение точности цифровой обработки само по себе не гарантирует хорошего качества сигнала — необходимо еще и достаточно точное квантование. Например, 20-разрядное квантование в сочетании с 24-разрядной обработкой уже может успешно соперничать со многими аналоговыми устройствами, в то время как такая же обработка при 16-разрядном квантовании существенно им уступает.

Грамотно и качественно реализованная цифровая обработка может давать существенно меньший уровень искажений, чем такая же аналоговая, разве что это будут искажения разных видов.

11. Компьютерные программы для обработки звука

На IBM PC наиболее популярны редакторы Cool Edit Pro (Syntrillium) Sound Forge (Sonic Foundry), WaveLab (Steinberg) и системы многодорожечной записи SAW Plus, Samplitude, N-Track и DDClip, Cubase, Fruity Loops(больше подходит для создания музыки, нежели для записи звука). На Apple Macintosh используются программ Alchemy, Deck II, DigiTracks, HyperPrism.

12. Звуковые платы

Для любительской работы со звуком, не требующей высокого качества, в принципе достаточно любой звуковой карты, качество которой удовлетворяет ее владельца. Самые дешевые карты типа Edison, Sky Rocket, Media Vision, Sound Blaster Vibra и т.п. обладают достаточно низким качеством преобразования звука. Более хорошим звучанием из простых карт обладают некоторые модели Sound Blaster AWE32, Gravis Ultrasound, Turtle Beach Tropez и некоторые другие. Все эти карты ориентированы на шину ISA и работают с 16-разрядным звуком.

Минимальным уровнем карт, пригодных для более-менее серьезной работы со звуком, принято считать снятую с производства Turtle Beach Tahiti (16 разрядов, 18-разрядный ЦАП) и ее выпускаемый ныне улучшенный вариант Fiji (20 разрядов). Эти карты также сделаны под ISA. Для Fiji существует отдельная дочерняя плата электрического интерфейса S/PDIF.

Представляет интерес 20-разрядная карта Terratec EWS64XL, АЦП и ЦАП которой обеспечивают 16и 18-разрядную точность, а электрический и оптический интерфейс S/PDIF — 20-разрядную.

Более высокий класс ISA-карт представлен серией 24-разрядных карт AdB Multi!Wav с цифровыми интерфейсами S/PDIF и AES/EBU и синхронизацией Word Clock: Digital Pro18 (18-разрядный мониторный ЦАП), Digital Pro24 (24-разрядный мониторный ЦАП), Analog Pro24 (24-разрядные ЦАП и АЦП, без цифровых интерфейсов). 20-разрядная карта Zefiro Acoustics ZA-2 имеет электрические и оптические интерфейсы S/PDIF и AES/EBU, 24-разрядный DSP и мониторный ЦАП.

Спектр карт для шины PCI открывает давно известная, хоть и устаревшая, AudioMedia III (24 разряда, четыре 18-разрядных АЦП/ЦАП, вход/выход S/PDIF, 24-разрядная обработка в DSP). В последнее время популярны три 24-разрядные карты Event Electonics с 20-разрядными ЦАП/АЦП и 24-разрядным DSP: Darla (2 АЦП, 8 ЦАП), Gina (2 АЦП, 8 ЦАП, S/PDIF) и Layla (8 АЦП и 10 ЦАП в выносном модуле, S/PDIF, MIDI, Word Clock).

Заключение

Как это ни странно, многие серьезные студии звукозаписи по-прежнему используют аналоговую аппаратуру для записи звуковых дорожек на магнитную ленту. Дело в том, что цифровая звукозапись, по своей природе, неизбежно теряет какую-то часть оригинального звучания. Поскольку цифровой файл представляет собой последовательность зафиксированных в отдельные моменты времени показателей, он всегда упускает информацию о звуке, который имел место между двумя зафиксированными состояниями. Многие гурманы качественного видео и музыки не могут смириться с таким положением вещей.

Достигнутая на сегодняшний день частота дискретизации позволяет настолько часто фиксировать отдельные кадры и изменения звука, что большинство людей уже не могут отличить цифровую запись от аналоговой — по своему качеству они уже практически сравнялись.

Однако цифровая технология имеет одно неоспоримое преимущество, которое позволяет с уверенностью говорить, что будущее принадлежит именно ей. После того как вы сделали первоначальную цифровую запись, вы можете копировать ее снова и снова и каждая новая копия ничем не будет отличаться от оригинала. Цифровая запись никогда сама по себе не изменяется.

Что касается аналоговой записи, то при каждом очередном копировании, к сожалению, часть данных теряется. Вы смотрели когда-нибудь видеокассеты или слушали аудиокассеты, которые являлись результатом многократного копирования? Их качество просто ужасно. Кроме того, цифровую запись намного проще обрабатывать и редактировать. И даже самые престижные студии звукозаписи тиражируют и распространяют свои копии на компакт-дисках.

С достигнутыми на сегодняшний день высокой частотой дискретизации и низкой стоимостью инструментов записи и редактирования цифровая технология становится очевидным выбором для энтузиастов любительской видеосъемки.

Список использованных источников

1. Загуменов А.П. Запись и редактирование звука. Музыкальные эффекты — М., «НТ Пресс», 2005
2. Маньковский В.С. «Основы звукооператорской работы»: Учебное пособие — М.: Искусство, 1984. 240 с., ил.
3. Никамин В.А. «Цифровая звукозапись. Технологии и стандарты», Наука и техника — 2002., 256 с.
4. Ратбон Э.»Модернизация и ремонт ПК для чайников» — 2003.
5. Википедия. Свободная энциклопедия wikipedia.org
6. Все о звуке и звукорежиссуре http://sound-editor.blogspot.com
7. Underground Exhibitions http://www.ugex.ru

Предыдущий пример

Следующий пример