Вуличні зручності

Майк Торнтон реставрація та очищення звукових файлів. Стара платівка: Що таке цифровий звук та реставрація звуку за допомогою цифрової обробки від користувача

Перезапис із магнітної стрічки (вініла)

Для того щоб з аудіоматеріалом можна було робити будь-які дії (чистку, корекцію та ін.) його необхідно переписати з оригінального носія (котушки, платівки, мікрофона). Методика запису з CD у цій статті не розглядається.
Я рекомендую захоплення аудіо здійснювати за допомогою програми WaveLab від Steinberg (можна використовувати будь-яку іншу програму).
Попередньо здійснюється відповідна комутація вихідних ланцюгів пристрою-джерела сигналу з лінійним (або іншим доступним) входом аудіокарти комп'ютера.

Примітка: комутацію краще здійснювати за вимкненої апаратури, т.к. висока ймовірність виходу з експлуатації кінцевих каскадів звукової карти комп'ютера.

Програма WaveLab запускається ярликом, що знаходиться в меню "Пуск" або "Робочому столі". Безпосередньо після першого запуску програми необхідно в налаштуваннях програми в якості апаратного засобу відтворення та запису вказати драйвер, що використовується системою. Інакше можливі проблеми під час запису або відтворення.

Потрібно змінити деякі параметри, визначені за замовчуванням:

Вибрати в полі "File to create" опцію "Named File (.wav)", що означає запис у фінальний файл.
Вказати розташування, куди буде записано файл та його назву.
У меню "Properties" вказати параметри (частота дискретизації та бітрейт). За замовчуванням встановлено 16 bit та 44,1 kHz. З метою підвищення якості записуваного матеріалу можна (за наявності апаратної можливості) можна встановити 24 bit / 96 kHz, однак це призведе до збільшення місця на диску, що займає отриманий файл.

Примітка: орієнтовно оцінити, який обсяг аудіоматеріалу з поточними налаштуваннями можна ще записати на HDD можна по полю «Disc Capacity».

Подати аудіосигнал та повзунками виставити оптимальний рівень(за піками -3 - -5 dB, інакше можливі нелінійні спотворення)

Якщо мікшер невидимий, його можна відкрити кнопкою «Mixer >>».

Примітка: щоб роздільно налаштовувати рівень лівого та правого каналів, необхідно переміщувати відповідний повзунок, затиснувши клавішу Ctrl на клавіатурі.

Після того, як усі налаштування зроблено, можна приступати безпосередньо до запису (кнопки "Record" та "Pause").

Примітка: для того, щоб згодом можна було здійснити шумокорекцію, необхідно захопити 2-5 секунд фонограми за відсутності корисного сигналу (шурхіт вінілової маси або шелест стрічки).

Уся сторона рулону (або платівки) пишеться в один прийом, один файл.

Після закінчення запису відкриється вікно із записаним файлом:

Отриманий файл, як і WaveLab, можна закрити (або записати ще кілька файлів – для цього відразу перейти до пункту 4).

Видалення фонового шуму

Я використовую програму CoolEdit2000 компанії Syntrillium, можна використовувати плагін для SoundForge, суть роботи не зміниться.
Ярликом запускаємо програму, далі необхідно відкрити записаний файл, що підлягає шумовидалення:

Необхідно візуально визначити стики окремих доріжок (позначено жовтим). Перший стик, звідки буде взято "зліпок" шуму, вказаний червоними стрілками.

Нижче наведено збільшений фрагмент.

Примітка: Змінити масштаб можна за допомогою колеса миші або кнопками із зображеннями лупи у вікні програми.

Необхідно виділити (лівою кнопкою миші) ділянку, тривалістю 1-4 секунди, яка не містить нічого, крім шуму.

Далі, щоб завантажити профіль у буфер шумоподавлювача, вибираємо «Transform» -> «Noise Reduction» -> «Noise Reduction…» і виставляємо опції відповідно до наступного малюнку та в зазначеному порядку (з опціями можна експериментувати і метою отримання оптимального для конкретної фонограми результату).

Після закриття вікна шумоподавлювача необхідно виділити всю фонограму (кнопка із зображенням лупи на тлі аркуша та подвійний клік в область фонограми). Далі знову відкривається вікно "Noise Reduction" із вже завантаженим профілем і виставленими налаштуваннями і запускається (кнопкою "OK") процес шумовидалення, тривалість якого залежить від обчислювальних потужностей комп'ютера.

Примітка: оптимальні параметри найкраще підбирати на коротких фрагментах, на слух та по спектроаналізатору оцінюючи отриману якість.

Розбивка записаної доріжки на окремі треки

Доріжку, що містить в собі кілька окремих творів необхідно розбити на частини. Найзручніше робити це в аудіоредакторі SoundForge 8.0.
Запустити програму ярликом, відкрити файл, що редагується:

Безпосередньо після першого запуску SoundForge необхідно вказати тип аудіопристрою:

Візуально визначаються стики треків:

Місце стику масштабується (колесом миші) до рівня. Далі в позиції, позначеної червоною стрілкою, необхідно вставити маркер. Для цього клацають правою кнопкою миші в області, виділеній зеленим:

З'явився маркер «01», який можна пересунути ближче до початку наступного треку:

Потім наприкінці треку можна плавно скинути рівень сигналу (ефект Fade). Для цього виділяється потрібна область (довжина підбирається виходячи з фонограми) та застосовується сам ефект:

Примітка: довжину коригованої області можна змінювати шляхом перетягування краю виділення.

Аналогічним чином відбувається обробка початку треку, однак, довжина області, що коректується в цьому випадку набагато менше:

Примітка: Зменшення та збільшення рівня цими опціями відбувається лінійно. Якщо потрібно отримати нелінійний (параболічний та ін) «Fade», використовують пункт «Графічне…».

Інші стики правлять так.
Підсумком перерахованих вище дій стануть оброблені стики (початок першого і кінець останнього треків коригують аналогічно) доріжок і сімейство маркерів їх розділяючих.

Іноді виникає необхідність привести рівні окремих треків до єдиного значення, що є особливо актуальним для доріжок, записаних з різних джерел. Для цього потрібно виділити один трек (достатньо двічі клікнути між маркерами) та застосувати фільтр «Нормалізація…». Налаштування підбираються експериментально.

Відразу після нормалізації одного треку його можна вставити окремий файл. Спочатку вже виділений фрагмент (якщо нарізка відбувається після нормалізації всіхтреків, то трек необхідно виділити знову) копіюється в буфер обміну:

Потім копійований шматок вставляється в новий документ так:

У результаті виходить окремий файл, що містить лише один трек:

Примітка: Переключатися між створеним і вихідним файлом можна за допомогою меню «Вікно»:

Аналогічним чином надходять з усіма треками, причому бажано робити нарізку в тій же послідовності, що і в оригіналі. Це дозволить уникнути плутанини із нумерацією, т.к. SoundForge автоматично нумерує нові файли.

Вийшов набір нумерованих файлів.

Конвертація у формат mp3

Оскільки несжатий wav-файл займає багато місця, його можна натиснути, природно за рахунок втрати частини інформації, у формат mp3. Існує безліч інших форматів компресійного аудіо, але mp3 є найпоширенішим.
Пакетне конвертування (тобто стискатимемо відразу кілька файлів) здійснюється за допомогою вже відомої нам програми WaveLab, в якій необхідно активувати опцію «Batch file encoding…»:

Знайти папку, де знаходяться оброблені нарізані файли. Виділити їх усі.
Додати їх у лист кнопкою «Відкрити»
Вказати папку-приймач для стислих файлів
Вибрати формат mp3
Встановити бажаний бітрейт (краще 192 kbps та вище)
Вибрати найвищу якість («Highest quality»)

Після встановлення всіх налаштувань вікно набуде наступного вигляду:

Після натискання на кнопку "Start" запуститься процес кодування. Оброблений файл відзначається зеленою міткою, оброблюваний – червоним.

Після закінчення процесу кодування в папці, яка була вказана в налаштуваннях, з'являться стислі mp3-файли.

Редагування інформації у mp3-тезі

Наступним кроком буде додавання до стиснених аудіо-файлів інформації про його назву, автора, альбом і т.п. Для полегшення цього завдання скористаємося програмою TagScaner (можна використовувати будь-який аналог).
Програма запускається ярликом, розташованим у меню "Пуск" або на "Робочому столі". Відразу після запуску програми необхідно вказати папку, де знаходяться mp3-файли.

На наступному малюнку видно, що mp3-тег не містить будь-якої інформації, тому його потрібно заповнити. Файл, інформація якого керується, підсвічується. Після внесення всіх необхідних виправлень інформація дописується до існуючого mp3-файлу натисканням кнопки "Зберегти", при цьому для редагування автоматично відкривається наступний трек.

Для додавання однакової інформації до всіх треків (назва альбому, рік, стиль, артист) можна, виділивши всі треки в лівій частині вікна, внести інформацію в поле, що цікавить. При цьому мітка означає, що дане поле різних треків містить відмінну один від одного інформацію і вона буде збережена. Підтвердження виконаних змін здійснюється натисканням кнопки «Зберегти».

Далі слід змінити структуру назви mp3-файлу. Як елементи назви може брати участь будь-яка інформація з тега (автор, заголовок, альбом, номер треку). Структура назви задається в полі Шаблон (в даному випадку запис %1 - %2 означає Ім'я_артиста – Назва_трека.mp3). Для перегляду отриманих назв можна скористатися кнопкою «Проба…».

Якщо результати перейменування Вас влаштовують, можна перейменувати файли, що редагуються, кнопкою «Нові імена».

Через війну перелічених вище дій має вийти група іменованих стислих mp3-файлів з доданої у тег додаткової информацией.

Запис на CD

Після того, як набереться достатньо mp3-файлів, їх можна записати на CD. Розглянемо технологію запису за допомогою програми NeroBurningROM.
Програма запускається ярликом.
Після запуску користувача запитають про характер нового проекту. Для диска, який записують повністю і який планують використовувати з IBM-сумісними комп'ютерами та mp3-плеєрами, можна вибрати тип диска CD-ROM(ISO), Немає мультисесії (ця опція заощадить близько 15 MB).

У вікно проекту перетягуються відсортовані за альбомами, виконавцями, роками файли. Об'єм, який займає файли на CD, орієнтовно можна оцінити за шкалою в нижній частині вікна проекту – стандартному 700 MB диску відповідає синя та жовта шкала (до червоної зони).

Після того як mp3-диск сформований, його необхідно записати. Перед початком процесу запису (для зручності подальшої ідентифікації диска в колекції) йому можна призначити назву, яка відповідає вмісту (наприклад, автор), а також виставити параметри запису. Для кращої сумісності з апаратними mp3-плеєрами та застарілими комп'ютерами швидкість запису встановлюється не вище 24 (оптимально 16), і метод запису диска – «Disc-at-once». Також потрібно активувати функцію захисту буфера рекордера від спустошення (BURN-Proof або аналогічну).

МІНІСТЕРСТВО ОСВІТИ

РОСІЙСЬКОЇ ФЕДЕРАЦІЇ

МОСКІВСЬКИЙ ДЕРЖАВНИЙ ІНСТИТУТ

РАДІОТЕХНІКИ ЕЛЕКТРОНІКИ ТА АВТОМАТИКИ

(ТЕХНІЧНИЙ УНІВЕРСИТЕТ)

Курсова робота з інформатики

Стара платівка: Що таке цифровий звук та реставрація звуку за допомогою цифрової обробки.

Студент Чистяков І.А.

Група ВТО 4-04

Викладач Андріанова О. Г.

Робота допущена до захисту __________________________

Курсова робота захищена з оцінкою ___________________

Москва 2005

1.Введение………………………………………………………………..3

2. Частина перша, теоретична……..………………………………..3

А. Теорія цифрового звуку……………………………….……3

Б. Оцифровка звуку та його зберігання на цифровому носії.

Г. Переваги та недоліки цифрового звуку………….14

Д. До питання про обробку звуку……………..……………….17

Е. Апаратура………………………………………..…………18

Ж. Програмне забезпечення………………………….……..22

3.Частина друга: більш практична……………..…………………25

1. Підключення програвача до комп'ютера…..……….25

2. Налаштування можливостей звукової карти……..………..26

3. Реставрація……………………………………….…………26

4. Підготовка файлів…………………………………………32

5. Поділ файлу wave на окремі композиції........32

6. Перспективи та проблематика……………………………33

7. Глосарій термінів……………………………………….34

1. Введення

Останнім часом можливості мультимедійного обладнання зазнали значного зростання, і цій області приділяється достатня кількість уваги, але все ж таки рядовий користувач ніяк не може скласти собі чіткого уявлення про те, які можливості приховує його залізний друг в області відтворення звуку, писку, шумів, бінаральних хвиль і т.д. Все обмежується відтворенням криків і вибухів в іграх і фільмах (благо технічний прогрес докотився вже до такого рівня) і прослуховування домашньої фонотеки (чи вже настав час придумати іншу назву, що-небудь типу «цифротеки»?).

Спробуємо у цій праці розібратися в основних аспектах цієї проблеми. Поговоримо трохи про анатомію, теорію цифрового звуку і що можна витягти зі старої вінілової платівки та аудіокасети.

Що ми знаємо про звукові можливості комп'ютера, крім того, що в нашому домашньому комп'ютері встановлена звукова плата і дві колонки? На жаль, ймовірно через недостатність літератури або з інших причин, але користувач, найчастіше, не знайомий ні з чим, крім вбудованого в Windows мікшера аудіо входів/виходів і Recorder^а. Для того щоб дізнатися, що ж вміє комп'ютер в області звуку, потрібно тільки поцікавитися і перед вами відкриються можливості, про які ви, можливо, навіть не здогадувалися. І все це не так складно, як може здатися на перший погляд.

2. Частина перша: більше теоретична.

Всі процеси запису, обробки та відтворення звуку так чи інакше працюють на один орган, яким ми сприймаємо звуки – вухо. Дві штуки:).
Без розуміння того, що ми чуємо, що нам важливо, а що ні, у чому причина тих чи інших музичних закономірностей – без цих та інших дрібниць неможливо спроектувати гарну аудіо апаратуру, не можна ефективно стиснути чи обробити звук. Те, що тут описано – лише самі засади.
Зовні бачимо так зване зовнішнє вухо. Нічого особливого нас тут не цікавить. Потім йде канал - приблизно 0.5 см у діаметрі та близько 3 см у довжину. Далі – барабанна перетинка, до якої приєднані кістки – середнє вухо. Ці кісточки передають вібрацію барабанної перетинки далі - на іншу перетинку, у внутрішнє вухо - трубку з рідиною, близько 0.2 мм діаметром і ще цілих 3-4 см завдовжки, закручена як равлик. Сенс наявності середнього вуха в тому, що коливання повітря занадто слабкі, щоб безпосередньо коливати рідину, і середнє вухо разом з барабанною перетинкою та перетинкою внутрішнього вуха складають гідравлічний підсилювач - площа барабанної перетинки у багато разів більша за перетинку внутрішнього вуха, тому тиск
(яке дорівнює F/S) посилюється у десятки разів.
У внутрішньому вусі по всій його довжині натягнута штука, що нагадує струну - ще одна витягнута мембрана, жорстка до початку вуха і м'яка до кінця. Певна ділянка цієї мембрани коливається у своєму діапазоні, низькі частоти – у м'якій ділянці ближче до кінця, найвищі – на самому початку. Уздовж цієї мембрани розташовані нерви, які сприймають коливання та передають їх у мозок, використовуючи два принципи:
Перший – ударний принцип. Оскільки нерви ще здатні передавати коливання
(Бінарні імпульси) з частотою до 400-450 Гц, саме цей принцип лоб використовується в області низькочастотного слуху. Там складно інакше - коливання мембрани дуже сильні і торкаються дуже багато нервів. Ударний принцип трохи розширюється приблизно до 4 кГц за допомогою трюку - кілька (до десяти) нервів ударяють у різних фазах, складаючи свою пропускну здатність. Цей спосіб хороший тим, що мозок сприймає інформацію більш повно – з одного боку, ми все-таки маємо легкий частотний поділ, а з іншого – можемо ще дивитися самі коливання, їх форму та особливості, а не просто частотний спектр. Цей принцип продовжено на найважливішу для нас частину
- Спектр людського голосу. Та й взагалі, до 4 кгц знаходиться вся найважливіша для нас інформація.

Ну і другий принцип - просто місце розташування нерва, що збуджується, застосовується для звуків більше 4 кГц. Тут уже окрім факту нас взагалі нічого не хвилює - ні фаза, ні шпару. Голий спектр.
Таким чином, в області високих частот ми маємо суто спектральний слух не дуже високої роздільної здатності, а для частот близьких до людського голосу - повніший, заснований не тільки на поділ спектру, а ще й на додатковому аналізі інформації самим мозком, даючи повнішу стерео - картину, наприклад. Про це – нижче.

Основне сприйняття звуку відбувається у діапазоні 1 - 4 кГц, у цьому діапазоні укладено людський голос (та й звуки, видані більшістю важливих нам процесів у природі). Коректна передача цього частотного відрізка – перша умова природності звучання.

Про чутливість (за потужністю та частотною)

Тепер про децибели. Коротко - адитивна відносна логарифмічна міра гучності (потужності) звуку, що найбільше добре відображає людське сприйняття гучності, і в той же час досить просто обчислюється.

В акустиці прийнято вимірювати гучність у дБ SPL (Sound Power Level – не знаю як це звучить у нас). Нуль цієї шкали знаходиться приблизно на мінімальному звуку, який чує людина. Відповідно, відлік ведеться в позитивний бік. Людина може осмислено чути звуки гучністю приблизно 120 дБ SPL. При 140 дБ відчувається сильний біль, за 150 дБ настає пошкодження вух. Нормальна розмова – приблизно 60 – 70 дБ SPL.
Далі в цьому розділі при згадці про дБ мається на увазі дБ від нуля по SPL.
Чутливість вуха до різних частот дуже різна. Максимальна чутливість у районі 1 – 4 кГц, основні тони людського голосу.
Звук 3 кГц - це той звук, який чутний при 0 дБ. Чутливість сильно падає в обидві сторони - наприклад, для звуку в 100 Гц нам потрібно вже цілих 40 дБ (у 100 разів велика амплітуда коливань), для 10 кГц - 20 дБ.
Зазвичай ми можемо сказати, що два звуки відрізняються за гучністю при різниці приблизно в 1 дБ. Незважаючи на це, 1 дБ - це швидше за багато, ніж мало. Просто у нас дуже компресоване, вирівняне сприйняття гучності.
Зате весь діапазон – 120 дБ – воістину величезний, за амплітудою це мільйони разів!

До речі, збільшення амплітуди вдвічі відповідає збільшенню гучності на 6 дБ. Увага! не плутайте: 12 дБ – у 4 рази, але різниця 18 дБ – вже 8 разів! а не шість, як могло подуматися. дБ - логарифмічний захід)

Аналогічна за властивостями та спектральна чутливість. Ми можемо сказати, що два звуки (простих тони) відрізняються за частотою, якщо різниця між ними становить близько 0.3% у районі 3 кГц, а в районі 100 Гц потрібна відмінність вже на 4%! Для довідки – частоти нот (якщо брати разом із півтонами, тобто дві сусідні клавіші фортепіано, включаючи чорні) відрізняються приблизно на 6%.
Загалом, в районі 1 - 4 кГц чутливість вуха за всіма параметрами максимальна, і становить не так багато, якщо брати не логарифмовані значення, з якими доводиться працювати цифровій техніці. Прийміть на замітку - багато що з того, що відбувається в цифровій обробці звуку, може виглядати жахливо в цифрах, і при цьому звучати не відрізняється від оригіналу.

У цифровій обробці поняття дБ вважається від нуля і донизу, в область негативних значень. Нуль - максимальний рівень, що представляється цифровою схемою.

А. Власне, про саму цифру.

Деякі факти та поняття, без яких важко обійтися.

Відповідно до теорії математика Фур'є, звукову хвилю можна представити у вигляді спектра частот, що входять до неї.

Частотні складові спектру – це синусоїдальні коливання (так звані чисті тони), кожне з яких має свою власну амплітуду та частоту. Таким чином, будь-яке, навіть найскладніше за формою коливання
(наприклад, людський голос), можна уявити сумою найпростіших синусоїдальних коливань певних частот та амплітуд. І навпаки, згенерувавши різні коливання і наклавши їх один на одного (змікшувавши, змішавши), можна отримати різні звуки.

Довідка: людський слуховий апарат/мозок здатний розрізняти частотні складові звуку в межах від 20 Гц до ~20 КГц (верхня межа може коливатися залежно від віку та інших факторів).
Крім того, нижня межа сильно коливається в залежності від інтенсивності звуку.

Б. Оцифровка звуку та його зберігання на цифровому носії

"Звичайний" аналоговий звук представляється в аналоговій апаратурі безперервним електричним сигналом. Комп'ютер оперує з даними у цифровому вигляді. Це означає, що звук у комп'ютері представляється в цифровому вигляді. Як же відбувається перетворення аналогового сигналу на цифровий?

Цифровий звук – це спосіб представлення електричного сигналу у вигляді дискретних чисельних значень його амплітуди. Допустимо, ми маємо аналогову звукову доріжку хорошої якості (говорячи «хороша якість» будемо припускати нешумний запис, що містить спектральні складові з усього чутного діапазону частот – приблизно від 20 Гц до 20 КГц) і хочемо «ввести» її в комп'ютер (тобто оцифрувати) без втрати якості. Як цього досягти і як відбувається оцифрування? Звукова хвиля - це складна функція, залежність амплітуди звукової хвилі від часу. Здавалося б, що коли це функція, можна записати їх у комп'ютер «як є», тобто описати математичний вид функції і зберегти у пам'яті комп'ютера.
Однак практично це неможливо, оскільки звукові коливання не можна уявити аналітичною формулою (як y=COSx, наприклад). Залишається один шлях – описати функцію шляхом зберігання дискретних значень у певних точках. Іншими словами, у кожній точці часу можна виміряти значення амплітуди сигналу та записати у вигляді чисел. Однак і в цьому методі є свої недоліки, тому що значення амплітуди сигналу ми не можемо записувати з нескінченною точністю і змушені їх округляти. Інакше кажучи, ми наближатимемо цю функцію за двома координатними осями – амплітудною та тимчасовою.
(наближати у точках – отже, кажучи простою мовою, брати значення функції у точках і записувати їх із кінцевою точністю). Таким чином, оцифровка сигналу включає два процеси - процес дискретизації
(Здійснення вибірки) та процес квантування. Процес дискретизації - це процес отримання значень величин сигналу, що перетворюється, в певні проміжки часу (рис. 1).

Квантування – процес заміни реальних значень сигналу наближеними з певною точністю (рис. 2). Таким чином, оцифровка – це фіксація амплітуди сигналу через певні проміжки часу і реєстрація отриманих значень амплітуди у вигляді заокруглених цифрових значень (оскільки значення амплітуди є величиною безперервної, немає можливості кінцевим числом записати точне значення амплітуди сигналу, саме тому вдаються до прокруглення). Записані значення амплітуди сигналу називають відліками.
Очевидно, що чим частіше ми робитимемо виміри амплітуди (чим вище частота дискретизації) і чим менше ми округлятимемо отримані значення (чим більше рівнів квантування), тим більш точне уявлення сигналу в цифровій формі ми отримаємо.

Оцифрований сигнал у вигляді набору послідовних значень амплітуди можна зберегти.

Тепер про практичні проблеми. По-перше, треба мати на увазі, що пам'ять комп'ютера не нескінченна, так що кожного разу при оцифровці необхідно знаходити якийсь компроміс між якістю (залежним від використаних при оцифровці параметрів) і займаним оцифрованим сигналом обсягом.

По-друге, частота дискретизації встановлює верхню межу частот оцифрованого сигналу, а саме, максимальна частотаспектральних складових дорівнює половині частоти дискретизації сигналу Просто кажучи, щоб отримати повну інформаціюпро звук у частотній смузі до 22050 Гц, потрібна дискретизація з частотою не менше 44.1 КГц.

Існують і інші проблеми та нюанси, пов'язані з оцифровкою звуку.
Не сильно заглиблюючись у подробиці зазначимо, що в «цифровому звуку» через дискретність інформації про амплітуду оригінального сигналу з'являються різні шуми та спотворення (під фразою «у цифровому звуку є такі частоти і шуми» мається на увазі, що коли цей звук буде перетворено назад з цифрового вигляду в аналоговий, то його звучанні будуть присутні згадані частоти і шуми). Так, наприклад, Джиттер (jitter)
– шум, що у результаті те, що здійснення вибірки сигналу при дискретизації відбувається через абсолютно рівні проміжки часу, і з якимись відхиленнями. Тобто якщо, скажімо, дискретизація проводиться з частотою 44.1 КГц, то відліки беруться не точно кожні 1/44100 секунди, а то трохи раніше, то пізніше. Оскільки вхідний сигнал постійно змінюється, така помилка призводить до «захоплення» не зовсім правильного рівня сигналу. В результаті під час відтворення оцифрованого сигналу може відчуватися деяке тремтіння і спотворення. Поява джиттера є результатом абсолютної стабільності аналогово-цифрових перетворювачів.
Для боротьби із цим явищем застосовують високостабільні тактові генератори.
Ще однією неприємністю є шум дроблення. Як ми говорили, при квантуванні амплітуди сигналу відбувається її заокруглення до найближчого рівня. Така похибка спричиняє відчуття «брудного» звучання.

Довідка: стандартні параметри запису аудіо компакт-дисків такі: частота дискретизації – 44.1 КГц, рівень квантування – 16 біт.
Такі параметри відповідають 65536 (2) рівня квантування амплітуди при взятті її значень 44100 разів на секунду.

На практиці процес оцифровки (дискретизація та квантування сигналу) залишається невидимим для користувача - всю чорнову роботу роблять різноманітні програми, які дають відповідні команди драйверу
(Керуюча підпрограма операційної системи) звукової карти. Будь-яка програма (будь то вбудований у Windows Recorder або потужний звуковий редактор), здатна здійснювати запис аналогового сигналу в комп'ютер, так чи інакше оцифровує сигнал з певними параметрами, які можуть виявитися важливими у подальшій роботі із записаним звуком, і саме з цієї причини важливо зрозуміти як відбувається процес оцифровки та які фактори впливають на її результати.

Ми ж його маємо почути, а цифри нам чути не дано.

2. Перетворення звуку з цифрового вигляду на аналоговий

Як після оцифрування прослуховувати звук? Тобто, як перетворювати його назад із цифрового вигляду на аналоговий?

Для перетворення дискретизованого сигналу в аналоговий вигляд, придатний для обробки аналоговими пристроями (підсилювачами та фільтрами) та подальшого відтворення через акустичні системи, служить цифроаналоговий перетворювач (ЦАП). Процес перетворення є зворотним процесом дискретизації: маючи інформацію про величину відліків
(амплітуди сигналу) та беручи певну кількість відліків в одиницю часу, шляхом інтерполювання відбувається відновлення вихідного сигналу
(Рис. 3).

Ще нещодавно відтворення звуку в домашніх комп'ютерах було проблемою, оскільки комп'ютери не оснащувалися спеціальними ЦАП. Спочатку як найпростіший звуковий пристрій у комп'ютері використовувався вбудований динамік (PC speaker). Взагалі кажучи, цей динамік досі є майже у всіх PC, але ніхто вже не пам'ятає, як його «розкачати», щоб він заграв. Якщо коротко, то цей динамік приєднаний до порту на материнській платі, у якого є два положення - 1 і 0. Так от, якщо цей порт швидко-швидко включати і вимикати, то з динаміка можна витягти більш-менш правдоподібні звуки. Відтворення різних частот досягається за рахунок того, що дифузор динаміка має кінцеву реакцію і не здатний миттєво перескакувати з місця на місце, таким чином він
«плавно розгойдується» внаслідок стрибкоподібної зміни напруги на ньому. І якщо коливати його з різною швидкістю, можна отримати коливання повітря різних частотах. Природною альтернативою динаміку став так званий Covox – це найпростіший ЦАП, виконаний на кількох підібраних опорах (або готової мікросхеми), які забезпечують переведення цифрового представлення сигналу в аналоговий – тобто реальні значення амплітуди. Covox простий у виготовленні і тому він мав успіх у любителів аж до того часу, коли звукова карта стала доступною всім.

У сучасному комп'ютері звук відтворюється і записується за допомогою звукової карти - підключається або вбудованої в материнську плату комп'ютера. Завдання звукової карти в комп'ютері – введення та виведення аудіо.
Фактично це означає, що звукова карта є тим перетворювачем, який переводить аналоговий звук у цифровий і назад. Якщо описувати спрощено, робота звукової карти може бути пояснена наступним чином.
Припустимо, що на вхід звукової карти подано аналоговий сигнал та картка включена (програмно). Спочатку вхідний аналоговий сигнал потрапляє в аналоговий мікшер, який займається змішуванням сигналів та регулюванням гучності та балансу. Мікшер необхідний, зокрема, надання можливості користувачеві керувати рівнями. Потім відрегульований і збалансований сигнал потрапляє в аналогово-цифровий перетворювач, де сигнал дискретизується і квантується, в результаті чого комп'ютер по шині даних направляється біт-потік, який і являє собою оцифрований аудіо сигнал. Виведення аудіо інформації майже аналогічне вводу, тільки відбувається у зворотний бік. Потік даних, спрямований звукову карту, долає цифро-аналоговий перетворювач, який утворює з чисел, що описують амплітуду сигналу, електричний сигнал; отриманий аналоговий сигнал може бути пропущений через будь-які аналогові тракти для подальших перетворень, у тому числі для відтворення. Якщо звукова карта обладнана інтерфейсом для обміну цифровими даними, то при роботі з цифровим аудіо ніякі аналогові блоки карти не задіяні.

Для зберігання цифрового звуку існує багато різних способів. Як ми говорили, оцифрований звук є набором значень амплітуди сигналу, взятих через певні проміжки часу. Таким чином, по-перше, блок оцифрованої аудіоінформації можна записати у файл «як є», тобто послідовністю чисел (значень амплітуди). І тут існують два способи зберігання інформації.

Перший (рис. 4) – PCM (Pulse Code Modulation – імпульсно-кодова модуляція) – спосіб цифрового кодування сигналу за допомогою запису абсолютних значень амплітуд (бувають знакове або беззнакове уявлення). Саме в такому вигляді записані дані на всіх аудіо CD.

Другий спосіб (рис. 5) - ADPCM (Adaptive Delta PCM - адаптивна відносна імпульсно-кодова модуляція) – запис значень сигналу над абсолютних, а відносних змінах амплітуд (приращениях).

По-друге, можна стиснути або спростити дані так, щоб вони займали менший обсяг пам'яті, ніж записані «як є». Тут також є два шляхи.

Кодування даних без втрат (lossless coding) - це спосіб кодування аудіо, який дозволяє здійснювати стовідсоткове відновлення даних зі стисненого потоку. До такого способу ущільнення даних вдаються у випадках, коли збереження оригінальної якості даних критично. Наприклад, після зведення звуку в студії звукозапису дані необхідно зберегти в архіві в оригінальній якості для можливого подальшого використання. Існуючі сьогодні алгоритми кодування без втрат (наприклад, Monkeys Audio) дозволяють скоротити об'єм, що займає даними, на 20-50%, але при цьому забезпечити стовідсоткове відновлення оригінальних даних з отриманих після стиснення. Подібні кодери – це свого роду архіватори даних (як ZIP, RAR та інші), призначені для стиснення саме аудіо.

Є й другий шлях кодування, у якому ми зупинимося трохи докладніше, – кодування даних із втратами (lossy coding). Мета такого кодування - будь-якими способами добитися схожості звучання відновленого сигналу з оригіналом при якомога меншому обсязі упакованих даних. Це досягається шляхом використання різних алгоритмів, що «спрощують» оригінальний сигнал (викидаючи з нього «непотрібні» слабкі деталі), що призводить до того, що декодований сигнал фактично перестає бути ідентичним оригіналу, а лише схоже звучить. p align="justify"> Методів стиснення, а також програм, що реалізують ці методи, існує багато. Найбільш відомими є MPEG-1 Layer I,II,III (останнім є всім відомий MP3),
MPEG-2 AAC (Advanced Audio Coding), Ogg Vorbis, Windows Media Audio (WMA),
TwinVQ (VQF), MPEGPlus, TAC, та інші. У середньому коефіцієнт стиснення, що забезпечується такими кодерами, знаходиться в межах 10-14 (раз). Треба особливо наголосити, що в основі всіх lossy-кодерів лежить використання так званої психоакустичної моделі, яка якраз і займається
"спрощенням" оригінального сигналу. Говорячи точніше, механізм подібних кодерів виконує аналіз сигналу, що кодується, в процесі якого визначаються ділянки сигналу, в певних частотних областях яких є нечутні людському юшку нюанси (замасковані або нечувані частоти), після чого відбувається їх видалення з оригінального сигналу. Таким чином, ступінь стиснення оригінального сигналу залежить від ступеня його
"спрощення"; сильне стиснення досягається шляхом «агресивного спрощення»
(Коли кодер "вважає" непотрібними множинні нюанси), таке стиснення, природно, призводить до сильної деградації якості, оскільки видалення можуть підлягати не тільки непомітні, але й значущі деталі звучання.

Як ми сказали, сучасних lossy-кодерів існує чимало.
Найпоширеніший формат – MPEG-1 Layer III (усім відомий MP3).
Формат завоював свою популярність абсолютно заслужено – це був перший поширений подібний кодек, який досяг такого високого рівня компресії при відмінній якості звучання. Сьогодні цей кодек має безліч альтернатив, але вибір залишається за користувачем. Переваги
MP3 – широка поширеність і досить висока якість кодування, що об'єктивно покращується завдяки розробкам різних кодерів MP3 ентузіастами (наприклад, кодер Lame). Потужна альтернатива MP3 – кодек
Microsoft Windows Media Audio (Файли.WMA та.ASF). По різних тестах цей кодек показує себе від «як MP3» до «помітно гірше за MP3» на середніх бітрейтах, і, частіше, «краще MP3» на низьких бітрейтах. Ogg Vorbis (файли
.OGG) – абсолютно вільний від ліцензування кодек, який створюється незалежними розробниками. Найчастіше веде себе краще за MP3, недоліком є лише мала поширеність, що може стати критичним аргументом при виборі кодека для тривалого зберігання аудіо. Згадаймо ще молодий кодек MP3 Pro, анонсований у липні 2001 року компанією Coding
Технології спільно з Thomson Multimedia. Кодек є продовженням, або, точніше, розвитком старого MP3 – він сумісний із MP3 назад (повністю) та вперед (частково). За рахунок використання нової технології SBR (Spectral
Band Replication), кодек веде себе помітно краще за інші формати на низьких бітрейтах, проте якість кодування на середніх і високих бітрейтах частіше поступається якості майже всіх описаних кодеків. Таким чином, MP3 Pro придатний більше для ведення аудіо трансляцій в Internet, а також створення превью пісень і музики.

Говорячи про способи зберігання звуку в цифровому вигляді, не можна не згадати і про носії даних. Всім звичний аудіо компакт-диск, що з'явився на початку
80-х років, широкого поширення набув саме в останні роки (що пов'язано з сильним здешевленням носія та приводів). До цього носіями цифрових даних були касети з магнітною стрічкою, але з звичайні, а спеціально призначені про так званих DAT-магнитофонов. Нічого примітного - магнітофони як магнітофони, проте ціна на них завжди була високою, і таке задоволення було не всім "по зубах". Ці магнітофони використовувалися в основному в студіях звукозапису. Перевага таких магнітофонів була в тому, що, не дивлячись на використання звичних носіїв, дані на них зберігалися в цифровому вигляді і ніяких втрат при читанні/запису на них не було (що дуже важливо при студійній обробці та зберіганні звуку). Сьогодні з'явилася велика кількість різних носіїв даних, крім звичних для всіх компакт-дисків. Носії вдосконалюються і з кожним роком стають більш доступними та компактними. Це відкриває великі можливості для створення мобільних аудіо програвачів. Вже сьогодні продається безліч різних моделей переносних цифрових плеєрів. І можна припустити, що це ще далеко не пік розвитку такого роду техніки.

Г. Переваги та недоліки цифрового звуку

З погляду звичайного користувача вигоди багато - компактність сучасних носіїв інформації дозволяє йому, наприклад, перевести всі диски та платівки зі своєї колекції у цифрове представлення та зберегти на довгі рокина невеликому тридюймовому вінчестері або на десятку-другому компакт-дисках; можна скористатися спеціальним програмним забезпеченням і гарненько «почистити» старі записи з бобін та платівок, видаливши з їхнього звучання шуми та тріск; можна також не просто скоригувати звучання, а й прикрасити його, додати соковитості, об'ємності, відновити частоти.
Крім перерахованих маніпуляцій зі звуком у домашніх умовах, Інтернет також приходить на допомогу аудіо-аматору. Наприклад, мережа дозволяє людям обмінюватися музикою, прослуховувати сотні тисяч різних Інтернет-радіо станцій, а також демонструвати свою звукову творчість публіці, і для цього потрібен лише комп'ютер та Інтернет. І, нарешті, останнім часом з'явилася величезна маса різної портативної цифрової аудіо апаратури, можливості навіть самого середнього представника якої часто дозволяють легко взяти з собою в дорогу колекцію музики, рівну за тривалістю звучання десяткам годин.

З погляду професіонала цифровий звук відкриває воістину неосяжні можливості. Якщо раніше звукові та радіо студії розміщувалися на кількох десятках квадратних метрів, то тепер їх може замінити хороший комп'ютер, який за можливостями перевищує десять таких студій разом узятих, а за вартістю виявляється набагато дешевше однієї. Це знімає багато фінансових бар'єрів і робить звукозапис більш доступним і професіоналу і простому любителю. Сучасне програмне забезпечення дозволяє робити зі звуком що завгодно. Раніше різні ефекти звучання досягалися за допомогою хитромудрих пристосувань, які не завжди були верхом технічної думки або були просто пристроями кустарного виготовлення. Сьогодні найскладніші і просто неймовірні раніше ефекти досягаються шляхом натискання пари кнопок. Звичайно, вищезазначене дещо утрироване і комп'ютер не замінює людину - звукооператора, режисера або монтажера, проте з упевненістю можна сказати, що компактність, мобільність, колосальна потужність і якість сучасної цифрової техніки, що призначена для обробки звуку, вже сьогодні майже повністю витіснила зі студій стару аналогову апаратуру

Втім, цифрове представлення даних має одну незаперечну і дуже важливу перевагу – при збереженому носії дані на ньому не спотворюються з часом. Якщо магнітна стрічка з часом розмагнічується і якість запису втрачається, якщо платівка дряпається і до звучання додаються клацання і тріск, то компакт-диск/вінчестер/електронна пам'ять або читається (у разі збереження), або ні, а ефект старіння відсутній. Важливо відзначити, що ми не говоримо тут про Audio CD (CD-
DA – стандарт, що встановлює параметри та формат запису на аудіо компакт-диски) так як не дивлячись на те, що це носій цифрової інформації, ефект старіння його все ж таки не минає. Це пов'язано з особливостями зберігання та зчитування аудіо даних з Audio CD. Інформація на всіх типах компакт-дисків зберігається покадрово і кожен кадр має заголовок, яким його можна ідентифікувати. Проте різні типи CD мають різну структуру та використовують різні методимаркування кадрів.
Оскільки комп'ютерні приводи CD-ROM розраховані на читання переважно Data-
CD (треба сказати, що існують різні різновиди стандарту Data-CD, кожен з яких доповнює основний стандарт CD-DA), вони часто не здатні правильно "орієнтуватися" на Audio CD, де спосіб маркування кадрів відрізняється від Data-CD (на аудіо CD кадри немає спеціального заголовка й у визначення зміщення кожного кадру необхідно ознайомитися з інформацією у кадрі). Це означає, що якщо при читанні Data-CD привод легко «орієнтується» на диску і ніколи не переплутає кадри, то при читанні з аудіо компакт-диска привід не може орієнтуватися чітко, що при появі, скажімо, подряпини або пилу може призвести до читання неправильного. кадру і, як наслідок, стрибка чи тріску звучання. Ця ж проблема
(нездатність більшості приводів правильно позиціонуватися на CD-DA) є причиною ще одного неприємного ефекту: копіювання інформації з
Audio CD викликає проблеми навіть при роботі з повністю збереженими дисками внаслідок того, що правильне «орієнтування на диску» повністю залежить від приводу, що зчитує, і не може бути чітко проконтрольовано програмним шляхом.

Повсюдне поширення та подальший розвиток вже згаданих lossy-кодерів аудіо (MP3, AAC та інших) відкрило найширші можливості розповсюдження та зберігання аудіо. Сучасні канали зв'язку вже давно дозволяють пересилати великі масиви даних за порівняно невеликий час, проте повільною залишається передача даних між кінцевим користувачем і постачальником послуг зв'язку. Телефонні лінії, за якими користувачі здебільшого зв'язуються з Інтернетом, не дозволяють здійснювати швидку передачу даних. Нема чого й казати, що такі обсяги даних, які займає несжата аудіо та відео інформація, передавати по звичних каналах зв'язку доведеться дуже довго. Однак поява lossy-кодерів, що забезпечують десяти-п'ятнадцятикратне стиснення, перетворило передачу та обмін аудіо даними на повсякденне заняття кожного користувача
Інтернету і зняло всі перепони, утворені слабкими каналами зв'язку.
Щодо цього потрібно сказати, що цифровий мобільний зв'язок, що розвивається сьогодні семимильними кроками, багато в чому зобов'язаний саме lossy-кодуванню.
Справа в тому, що протоколи передачі аудіо каналами мобільного зв'язку працюють на приблизно тих же принципах, що і відомі всім музичні кодери. Тому подальший розвиток в області кодування аудіо незмінно веде до зменшення вартості передачі даних у мобільних системах, від чого кінцевий користувач тільки виграє: дешевшає зв'язок, з'являються нові можливості, продовжується час роботи батарей мобільних пристроїв і т.д. Не меншою мірою lossy-кодування допомагає заощаджувати гроші на покупці дисків з улюбленими піснями – сьогодні варто тільки зайти в
Інтернет і там можна знайти майже будь-яку пісню, що цікавить. Безумовно, такий стан речей давно «мозолить очі» звукозаписним компаніям – у них під носом люди замість покупки дисків обмінюються піснями прямо через
Інтернет, що перетворює колись золоте дно на малоприбутковий бізнес, але це вже питання етики та фінансів. Одне можна сказати з упевненістю: з таким станом речей вже нічого не можна зробити і бум обміну музикою через
Інтернет, породжений саме появою lossy-кодерів, вже не зупинити. А це тільки на руку пересічному користувачеві.

Д. До питання про обробку звуку

Під обробкою звуку слід розуміти різні перетворення звукової інформації з метою зміни якихось характеристик звучання. До обробки звуку відносяться способи створення різних звукових ефектів, фільтрація, а також методи очищення звуку від небажаних шумів, зміни тембру тощо. Усе це безліч перетворень зводиться, зрештою, до таких основних типів:

1. Амплітудні перетворення. Виконуються над амплітудою сигналу і призводять до посилення/ослаблення або зміни за яким-небудь законом на певних ділянках сигналу.

2. Частотні перетворення. Виконуються над частотними складовими звуку: сигнал подається у вигляді спектра частот через певні проміжки часу, проводиться обробка необхідних частотних складових, наприклад, фільтрація, і зворотне згортання сигналу з спектра в хвилю.

3. Фазові перетворення. Зсув фази сигналу тим чи іншим способом; наприклад, такі перетворення стерео сигналу дозволяють реалізувати ефект обертання або «об'ємності» звуку.

4. Тимчасові перетворення. Реалізуються шляхом накладання, розтягування/стиснення сигналів; дозволяють створити, наприклад, ефекти відлуння або хору, а також вплинути на просторові характеристики звуку.

Обговорення кожного з названих типів перетворень може стати цілою науковою працею. Варто навести кілька практичних прикладів використання зазначених видів перетворень під час створення реальних звукових ефектів:

Echo (відлуння) Реалізується за допомогою тимчасових перетворень. Фактично для отримання луни необхідно на оригінальний вхідний сигнал накласти затриману в часі копію. Щоб людське вухо сприймало другу копію сигналу як повторення, а чи не як відгук основного сигналу, необхідно час затримки встановити рівним приблизно 50 мс. На основний сигнал можна накласти не одну копію, а кілька, що дозволить на виході отримати ефект багаторазового повторення звуку (багатоголосного луни).
Щоб відлуння здавалося загасаючим, необхідно на вихідний сигнал накладати не просто затримані копії сигналу, а приглушені по амплітуді.

Reverberation (повторення, відбиток). Ефект полягає у наданні звучанню об'ємності, характерної для великої зали, де кожен звук породжує відповідний, повільно згасаючий відгук. Фактично, за допомогою реверберації можна «оживити», наприклад, фонограму, створену в заглушеному приміщенні. Від ефекту «луна» реверберація відрізняється тим, що на вхідний сигнал накладається вихідний сигнал, а не затримана копія вхідного. Іншими словами, блок реверберації спрощено є петлю, де вихід блоку підключений до його входу, таким чином вже оброблений сигнал кожен цикл знову подається на вхід змішуючись з оригінальним сигналом.

Chorus (хор). В результаті його застосування звучання сигналу перетворюється на звучання хору або в одночасне звучання декількох інструментів. Схема отримання такого ефекту аналогічна схемі створення ефекту луни з тією різницею, що затримані копії вхідного сигналу піддаються слабкої частотної модуляції (в середньому від 0.1 до 5 Гц) перед змішуванням з вхідним сигналом. Збільшення кількості голосів у хорі досягається шляхом додавання копій сигналу з різним часом затримки.

Безумовно, як і в інших областях, в обробці сигналів також є проблеми, які є свого роду каменем спотикання. Так, наприклад, при розкладанні сигналів спектр частот існує принцип невизначеності, який неможливо подолати. Принцип говорить, що не можна отримати точну спектральну картину сигналу в конкретний момент часу: або для отримання більш точної спектральної картини потрібно проаналізувати більшу тимчасову ділянку сигналу, або, якщо нас цікавить більше час, коли відбувалася та чи інша зміна спектра, потрібно пожертвувати точністю самого спектра . Іншими словами не можна отримати точний спектр сигналу в точці - точний спектр для великої ділянки сигналу або дуже приблизний спектр, але для короткої ділянки.

Е. Апаратура

Немаловажна частина розмови про звук пов'язана з апаратурою. існує багато різних пристроївдля обробки та введення/виводу звуку. Щодо звичайного персонального комп'ютера слід докладніше зупинитись на звукових картах. Звукові карти прийнято поділяти на звукові, музичні та звукомузальні. За конструкцією всі звукові плати можна розділити на дві групи: основні (встановлювані на материнській платі комп'ютера і забезпечують введення і виведення аудіо даних) і дочірні (мають принципову конструктивну відмінність від основних плат - вони найчастіше підключаються до спеціального роз'єму, розташованого на основній платі ). Дочірні плати служать найчастіше забезпечення чи розширення можливостей MIDI- синтезатора.

Звукомузичні та звукові плати виконуються у вигляді пристроїв, що вставляються в слот материнської плати (або вже вбудовані в неї спочатку).
Візуально вони мають зазвичай два аналогові входи - лінійний і мікрофонний, і кілька аналогових виходів: лінійні виходи та вихід для навушників. Останнім часом карти стали оснащуватися також цифровим входом і виходом, що забезпечує передачу аудіо між цифровими пристроями. Аналогові входи та виходи зазвичай мають роз'єми, аналогічні роз'єм головних навушників (1/8”). Взагалі входів у звукової плати трохи більше, ніж два: аналогові CD, MIDI та інші входи. Вони, на відміну мікрофонного і лінійного входів, розташовані не так на задній панелі звукової плати, але в самій платі; можуть бути інші входи, наприклад, для підключення голосового модему. Цифрові входи та виходи зазвичай виконані у вигляді інтерфейсу S/PDIF (інтерфейс цифрової передачі сигналів) з відповідним роз'ємом (S/PDIF – скорочення від Sony/Panasonic Digital Interface – цифровий інтерфейс Sony/Panasonic). S/PDIF - це «побутовий» варіант складнішого професійного стандарту AES/EBU (Audio Engineering Society /
European Broadcast Union). Сигнал S/PDIF використовується для цифрової передачі
(кодування) 16-розрядних стерео даних із будь-якою частотою дискретизації.
Крім перерахованого, на звукомузичних платах є MIDI-інтерфейс з роз'ємами для підключення MIDI-пристроїв та джойстиків, а також для приєднання дочірньої музичної карти (хоча останнім часом можливість підключення останньої стає рідкістю). Деякі моделі звукових карт для зручності користувача оснащуються передньою панеллю, що встановлюється на лицьовій стороні системного блоку комп'ютера, на якій розміщуються роз'єми, з'єднані з різними входами та виходами звукової карти.

Визначимо кілька основних блоків, з яких складаються звукові та звукомузичні плати.

1. Блок цифрової обробки сигналів (кодек). У цьому блоці здійснюються аналого-цифрові та цифро-аналогові перетворення (АЦП та
ЦАП). Від цього блоку залежать такі характеристики карти, як максимальна частота дискретизації при записі та відтворенні сигналу, максимальний рівень квантування та максимальна кількість каналів, що обробляються (моно або стерео). Неабиякою мірою від якості та складності складових цього блоку залежать і шумові характеристики.

2. Блок синтезатора. Є у музичних картах. Виконується на основі або FM-, або WT-синтезу, або на обох одночасно. Може працювати як під керуванням власного процесора, так і під керуванням спеціального драйвера.

3. Інтерфейсний блок. Забезпечує передачу даних за різними інтерфейсами (наприклад, S/PDIF). У чисто звукової карти цей блок найчастіше відсутній.

4. Мікшерний блок. У звукових платах мікшерний блок забезпечує регулювання рівнів сигналів з лінійних входів; рівнів з MIDI входу та входу цифрового звуку; рівня загального сигналу; панорамування; тембру.

Розглянемо найважливіші параметри, що характеризують звукові та звукомузичні плати. Найбільш важливими характеристиками є: максимальна частота дискретизації (sampling rate) в режимі запису та в режимі відтворення, максимальний рівень квантування або розрядність
(max. quantization level) у режимі запису та відтворення. Крім того, так як звукомузичні плати мають ще й синтезатор, то їх характеристики відносять і параметри встановленого синтезатора.
Звичайно, що з більшим рівнем квантування карта здатна кодувати сигнали, тим більша якість сигналу при цьому досягається. Всі сучасні моделі звукових карт здатні кодувати сигнал з рівнем 16 біт, і в останній час з'явилися побутові карти з рівнем 24 біт (лінійка карт
Audigy, Audigy II від Creative). Однією з важливих характеристик є можливість одночасного відтворення та запису звукових потоків.
Особливість карти одночасно відтворювати та записувати називають повнодуплексною (full duplex). Є ще одна характеристика, яка часто грає вирішальну роль при покупці звукової карти - відношення сигнал/шум (Signal/Noise Ratio, S/N). Цей показник впливає на чистоту запису та відтворення сигналу. Відношення сигнал/шум - це відношення потужності сигналу до потужності шуму на виході пристрою, цей показник прийнято вимірювати в дБ. Хорошим можна вважати відношення 80-85 дБ; ідеальним
- 95-100 дБ. Однак слід враховувати, що на якість відтворення та запису сильно впливають наведення (перешкоди) з боку інших компонентів комп'ютера (блоку живлення та ін.). В результаті цього відношення сигнал/шум може змінюватися на гірший бік. Насправді методів боротьби з цим є досить багато. Деякі пропонують заземлити комп'ютер.
Інші, щоб якнайретельніше вберегти звукову карту від наведень,
"виносять" її за межі корпусу комп'ютера. Однак повністю уберегтися від наведень дуже важко, тому що навіть елементи самої карти створюють наведення один на одного. З цим теж намагаються боротися, і для цього екранують кожен елемент на платі. Але скільки б зусиль не докладалося вирішення цієї проблеми, повністю виключити вплив зовнішніх перешкод неможливо.

Ще одна не менш важлива характеристика – коефіцієнт нелінійних спотворень або Total Harmonic Distortion, THD. Цей показник також критично впливає на чистоту звучання. Коефіцієнт нелінійних спотворень вимірюється у відсотках: 1% – «брудне» звучання; 0.1% – нормальне звучання; 0.01% – чисте звучання класу Hi-Fi; 0.002% - звучання класу Hi-Fi – Hi End. Нелінійні спотворення – результат неточності у відновленні сигналу з цифрового вигляду до аналогового.
Спрощено процес вимірювання цього коефіцієнта проводиться наступним чином. На вхід звукової карти подається чистий синусоїдальний сигнал. На виході пристрою знімається сигнал, спектр якого є сумою синусоїдальних сигналів (сума вихідної синусоїди та її гармонік).
Потім за спеціальною формулою розраховується кількісне співвідношення вихідного сигналу та його гармонік, отриманих на виході пристрою. Це кількісне співвідношення є коефіцієнт нелінійних спотворень (THD).

Що таке MIDI-синтезатор? Термін «синтезатор» зазвичай використовується стосовно електронного музичного інструменту, в якому звук створюється та обробляється, змінюючи своє забарвлення та характеристики.
Звичайно, назва цього пристрою походить від його основного призначення - синтезу звуку. Основних методів синтезу звуку існує лише два: FM (Frequency modulation – частотна модуляція) та WT (Wave Table
- Таблично-хвильовий). Оскільки ми можемо тут докладно зупинятися з їхньої розгляді, опишемо лише основну ідею методів. В основі FM-синтезу лежить ідея, що будь-яке навіть найскладніше коливання є насправді сумою найпростіших синусоїдальних. Таким чином, можна накласти один на одного сигнали від кінцевого числа генераторів синусоїд та шляхом зміни частот синусоїд отримувати звуки, схожі на справжні. Таблично-хвильовий синтез ґрунтується на іншому принципі. Синтез звуку при використанні такого методу досягається за рахунок маніпуляцій над записаними заздалегідь
(оцифрованими) звуками реальних музичних інструментів. Ці звуки (вони називаються семплами) зберігаються у постійній пам'яті синтезатора.

Слід зазначити, що оскільки MIDI-дані – це набір команд, то музика, написана з допомогою MIDI, також записується з допомогою команд синтезатора. Іншими словами, MIDI-партитура – це послідовність команд: яку ноту грати, який інструмент використати, яка тривалість та тональність її звучання тощо. Знайомі багатьом
MIDI-файли (.MID) є чимось іншим, як набір таких команд. Природно, що оскільки є безліч виробників MIDI-синтезаторів, то і звучати один і той же файл може на різних синтезаторах по-різному (бо в файлі самі інструменти не зберігаються, а є лише вказівки синтезатору якими інструментами грати, в той час як різні синтезатори можуть звучати по-різному.

Повернемося до розгляду звукомузальних плат. Оскільки ми вже уточнили, що таке MIDI, не можна оминути характеристики вбудованого апаратного синтезатора звукової карти. Сучасний синтезатор, найчастіше, заснований на так званій «хвильовій таблиці» - WaveTable (стисло, принцип роботи такого синтезатора полягає в тому, що звук у ньому синтезується з набору записаних звуків шляхом їх динамічного накладання та зміни параметрів звучання), раніше ж основним типом синтезу був FM
(Frequency Modulation – синтез звуку у вигляді генерування простих синусоїдальних коливань та його змішування). Основними характеристиками WT-синтезатора є: кількість інструментів у ПЗУ та його обсяг, наявність
ОЗУ та його максимальний об'єм, кількість можливих ефектів обробки сигналів, а також можливість поканальної ефект-обробки (звісно, у разі наявності ефект-процесора), кількість генераторів, що визначають максимальну кількість голосів у поліфонічному (багатоголосному) режимі та, можливо, найголовніше, стандарт, відповідно до якого виконано синтезатор
(GM, GS чи XG). До речі, обсяг пам'яті синтезатора – не завжди фіксована величина. Справа в тому, що останнім часом синтезатори перестали мати своє ПЗУ, а користуються основним ОЗУ комп'ютера: у цьому випадку всі звуки, що використовуються синтезатором, зберігаються у файлі на диску і при необхідності зчитуються в ОЗУ.

Ж. Програмне забезпечення

Тема програмного забезпечення дуже широка, тому розглянемо невелику дещицю програм для обробки звуку.

Найважливіший клас програм – редактори цифрового аудіо. Основні можливості таких програм це, як мінімум, забезпечення можливості запису
(оцифрування) аудіо та збереження на диск. Розвинені представники такого роду програм дозволяють набагато більше: запис, багатоканальне зведення аудіо на декількох віртуальних доріжках, обробка спеціальними ефектами (як вбудованими, так і ззовні – про це пізніше), очищення від шумів, мають розвинену навігацію та інструментарій у вигляді спектроскопа та інших віртуальних приладів, управління/керованість зовнішніми пристроями, перетворення аудіо з формату на формат, генерація сигналів, запис на компакт-диски та багато іншого. Деякі з таких програм: Cool Edit Pro
(Syntrillium), Sound Forge (Sonic Foundry), Nuendo (Steinberg), Samplitude
Producer (Magix), Wavelab (Steinberg), Dart.

Основні можливості редактора Cool Edit Pro 2.0. , підтримка аудіо з параметрами 24 біт / 192 КГц, потужний інструментарії для роботи з петлями (loops), підтримка DirectX, а також управління SMPTE/MTC, підтримка роботи з відео та MIDI та інше.

Скріншот 1.

Основні можливості редактора Sound Forge 6.0a (див. Скріншот 2 – приклад робочого вікна програми): потужні можливості не деструктивного редагування, багатозадачна фонова обробка завдань, підтримка файлів з параметрами до 32 біт / 192 КГц, менеджер передустановок, підтримка файлів більше 4 Гб робота з відео, великий набір ефектів обробки, відновлення після зависань, передпрослуховування застосованих ефектів, спектральний аналізатор та інше.

Сріншот 2

Спеціалізовані реставратори аудіо грають також важливу роль обробці звуку. Такі програми дозволяють відновити втрачену якість звучання аудіо матеріалу, видалити небажані клацання, шуми, тріск, специфічні перешкоди записів з аудіо-касет, та провести інше коригування аудіо. Програми такого роду: Dart, Clean (від Steinberg
Inc.), Audio Cleaning Lab. (Від Magix Ent.), Wave Corrector.

Основні можливості реставратора Clean 3.0 (див. Скріншот 3 – робоче вікно програми): усунення всіляких потріскування і шумів, режим автокорекції, набір ефектів для обробки скоригованого звуку, включаючи функцію «surround sound» з наочним акустичним моделюванням ефекту, «інтелігентна» система підказок, підтримка зовнішніх VST плаг-інів та інші можливості.

Скрішот 3

Частина друга: більш практична

Останнім часом актуальною стала тема архівації старих вінілових дисків та касет. Сьогодні всі слухають музику на комп'ютерах і іноді прикро, що нам не доступні старі записи.

Оцифрування музики

Спробуйте дати своїм старим платівкам та аудіокасетам нове життя. До середини вісімдесятих років любителі музики поділялися на два табори: фахівців, які знали, як підтримувати дорогоцінні вінілові платівки та плівки у чудовому стані, та любителів, які не звертали уваги на сліди пальців чи подряпини на поверхні платівки. Нині таких проблем уже немає. CD компактніше і їх важче пошкодити. Коли CD набули широкого поширення, грамофонні платівки були відправлені на пенсію. Звичайно, лише у цифровому столітті музичні скарби можуть продовжити радувати слухачів: обробіть старі записи на комп'ютері та запишіть їх на CD!

1. Підключення програвача до комп'ютера

Перш за все, підключіть програвач до комп'ютера. Це можна зробити кількома способами. Деякі програвачі мають свій власний підсилювач - з'єднайте його з входом Line-in звукової карти. Якщо у вашого програвача власного підсилювача немає і сигнал занадто слабкий, використовуйте якийсь зовнішній підсилювач, наприклад музичний центр. Кабелі з різними роз'ємами для цього можна придбати в магазинах або наметах з електротехнікою. Якщо вам потрібен кабель із незвичайною комбінацією роз'ємів, якого немає у продажу, купіть необхідні штекери окремо та зробіть потрібний кабель самі. Будьте обережні і стежте, щоб не з'явилася петля: потім вона викликатиме шум. Щоб уникнути цього, з'єднайте земляний кабель програвача з корпусом комп'ютера. Ми дуже бажано попередньо прослухати те, що ми хочемо реставрувати, тому що «сюрприз» у вигляді «вжик, заїло платівку» буде не дуже до речі під час запису фонограми на HDD. Якщо така бяка виявлена, то регулюємо навантаження на звукознімач, у разі відсутності регулювання доведеться покласти якийсь вантаж на головку тонарма
(Дуже небажано, але іншого виходу немає). Якщо все пройшло успішно, то в колонках (навушниках) є шанс почути благодатні звуки піску вінілового кругляка або непригнічений шум прибою з щось на зразок МП «Яуза 221-1С» з МК-60, тип I.

2. Налаштування можливостей звукової карти

За допомогою програми "Регулятор гучності" у Windows налаштуйте рівень вхідного сигналу. Для цього двічі лівою кнопкою миші клацніть на іконці динаміка в треї. Регулятори рівня Line-in та Wave повинні бути включені.
Більш того, пересувний регулятор гучності повинен стояти не нижче за середину лінійки. Потужним джерелом завад часто є мікрофонний вхід. Часто він робить непотрібні шуми, тому для нього навпроти напису "Вимкнути" має стояти галочка. Тепер налаштуємо параметри запису. Відкрийте в
"Регулятор гучності" закладку "Параметри" - "Властивості". В опції
"Настроювання гучності" виберіть параметр "Запис", у полі "Відображати регулятори гучності" на рядку Line-in обов'язково має стояти галочка.
Натисніть кнопку OK. У "Регуляторі гучності" оберіть джерело запису - у нашому випадку це буде Line-in. Встановіть пересувний регулятор приблизно посередині лінійки. Вікно Регулятора гучності поки нехай залишається відкритим.

3.Реставрація

Тепер, власне, можна рушити від бажаного до дійсного.
Існує достатня кількість софту для реставрації старих записів.
Є професійні рішення для звукорежисерів, які ближче до звукових редакторів, в яких звичайному користувачеві розібратися можна буде років через п'ять.
За цей час те, що можна було відновити, буде втрачено безповоротно.
На щастя є в цьому світі програми, в яких можна розібратися досить швидко і отримати досить високу якість кінцевого матеріалу.
Одне з таких рішень – CoolEdit від компанії Syntrillium
(www.syntrillium.com) звуковий редактор з можливістю запису та обробки музики.
Ну як, завантажили програму? Встановили? Сподіваюся, що ви не забули і про плагін «Audio Cleanup», який нам ох як знадобиться. Давайте запустимо редактор і подивимося на головне вікно програми (мал. 2). Стандартний
Windows інтерфейс (певною мірою інтуїтивно- зрозумілий). Давайте домовимося таким чином: детальної розповіді про всі можливості програми Cool Edit 2000 версії 1.1 тут не буде.
Розглянемо лише те, що нам дійсно буде потрібно для реставрації звуку.

Тепер настав час зробити невелике, але дуже важливе налаштування деяких параметрів програми. Поясню для чого: напевно, багато користувачів, які читають ці рядки, не захочуть обмежуватися очищенням звуку з вінілових носіїв, оскільки звичайні компакт-касети ще ніхто не скасовував. А що ви скажете про запис голосу з мікрофона? Власникам картки "SB Live!" не зайве прочитати наступний невеликий абзац.

Майже всі власники стаціонарних касетників знають, що частотний діапазон записаної інформації лежить у межах 40-14 000 Гц у разі касети зі стрічкою 1-го типу. Стрічка на основі хромдіоксиду дає ширший діапазон. Але мало хто знає, що магнітофон все одно відтворює окремі "крики душі" і в ще ширшому діапазоні (20-20 000 Гц), які, будучи забиті всілякими шумами та перешкодами, не досягають ніжного вуха меломана. Програма Cool Edit дозволяє виправити цей недолік і вирівняти амплітудно-частотну характеристику касетника до цілком пристойного рівня.

Тепер спеціально для щасливих власників картки «SB Live!»: ви, напевно, знаєте, що АЧХ кодека зовсім не ідеальна, і вже після 4,5 кГц починається ступінчастий спад рівня верхніх частот, що в багатьох випадках не є добре. За допомогою Cool Edit ми подолаємо і цю перешкоду.

Для виправлення вищезгаданих недоліків займемося налаштуванням FFT-фільтра редактора, який буде нашим помічником на початковому етапіочищення звуку.
Відкриємо будь-який wav-файл або запишемо кілька секунд тиші, натиснувши кнопку з червоною точкою, розташованою в панелі кнопки в правому нижньому кутку.
Потім зайдемо в меню програми: Transform-Filters-FFT Filter. У вікні (мал. 2) створимо будь-який, абсолютно бездумний пресет (налаштування), для чого мишею трохи потягнемо жовту лінію. За допомогою кнопки «Add» обзовемо налаштування будь-яким цензурним ім'ям і збережемо. Для чого? А для того, що зараз ми редагуватимемо файл «Cool.ini», який проживає за адресою:
Х: Program Files Cool2000. А саме - шляхом внесення деяких додаткових параметрів для виправлення прикрих недоробок касетника та картки «SB Live!».
Відкриваємо файл "Сool.ini", де шукаємо розділ . Але нюанс у тому, що цей розділ у цьому файлі з'являється лише після того, як ми скористаємось послугами FFT-фільтра. Ось навіщо нам були потрібні рухи тіла зі створенням якогось абстрактного пресета. Тепер дивимося, де у розділі
знаходиться створене нами налаштування - просто знаходимо імечко, яким ми обізвали наш пресет. А далі нескладно: у вільному рядку прописуємо ось такий крихітний параметр:

Item29=МСRESTORATION,3,19,0,20,426,5,845,0,1288,0,1986,0,2259,0,2855,
6,3179,9,3444,1,3583,28,3688,42,3773,48,3848,61,3925,76,3957,96,3998,100,
4004,100,4012,5,4096,5,19,0,20,426,5,845,0,1288,0,1986,0,2259,0,2855,6,3179,

9,3444,21,3583,28,3688,42,3773,48,3848,61,3925,76,3957,96,3998,100,4004,100,

4012,5,4096,5,2,0,12000,1,2,0,0,1000,100,5,-10,100,-
0.5,12,24000,1,0,1,1,48000

Записуємо цю цифру обов'язково в один рядок! Це параметри для виправлення АЧХ у касетних магнітофонів. Ігор Бабайлов люб'язно поділився відредагованим файлом Cool.ini, над яким прокопів багато днів і ночей: www.hot.ee/uvs/Cool.zip. За що йому найнижчий уклін.
Не думаю, що параметри АЧХ у різних касетних приставок сильно відрізнятимуться. З іншого боку, якщо ви витратили багато вічнозелених на «Dragon Nacamichi» або «Maranz», то ці налаштування Вам явно не потрібні.
Для власників "SB Live!" рекомендовано будь-яку записану фонограму спочатку пропустити через цей фільтр з наступним пресетом:

Item36=SBCORRECtion,3,20,0,0,83,0,532,1,793,1,1003,2,1223,4,1713,5,2046,
10,2391,12,2569,15,2710,18,3066,24,3234,27,3398,35,3480,41,3546,47,3628,
56,3726,70,3825,89,4096,100,20,0,0,83,0,532,1,793,1,1003,2,1223,4,1713,5,
2046,10,2391,12,2569,15,2710,18,3066,24,3234,27,3398,35,3480,41,3546,47,
3628,56,3726,70,3825,89,4096,100, 2,0,12000,1,2,0,0,1000,100,3, -10,100,0,
14,24000,1,0,0,1,48000

Це значення прописуємо все в тому ж Сool.ini і в тому ж розділі
, не забуваючи, що запис параметрів повинен бути одним нерозривним рядком.
Оскільки комп'ютер з програвачем у нас з'єднані, перевірені на працездатність та готові до праці, а програма Cool Edit 2000 після внесення доповнень почувається чудово, то можна сміливо приступати до процесу запису фонограми на хард.
Починаємо запис або через "File" - "New", або натиснемо кнопку запису на панелі. Не бійтеся, запис відразу не почнеться: нам буде запропоновано вибрати характеристики сигналу, що записується. У вікні, що відкрилося, виберемо Sample
Rate = 44100 і 16-бітний звук у стереорежимі - а навіщо нам моно? Ставимо тонар на платівку, і при натисканні кнопки ОК почнеться запис, про що свідчить індикатор запису у вигляді пульсуючих червоних смуг і таймера. Було б дуже бажано зробити запис конкретної речі із захопленням порожніх ділянок на початку і наприкінці фонограми, тобто там, де чутно лише шарудіння самої маси - це нам знадобиться надалі для глибокого очищення звуку. Можна навіть захопити кілька секунд попередньої чи наступної композиції.
У потрібному місці натискаємо кнопку Stop, і у вікні програми спостерігаємо записану фонограму (рис. 3).

Рис.3
Збережемо записаний шедевр у wav-файл (File – Save as). Далі, якщо у вас використовується "SB Live!", відкриваємо вже знайомий нам FFT-фільтр (Transform-
Filters-FFT Filter) і, обравши пресет SBCORRECtion та натиснувши кнопку ОК, починаємо вирівнювати АЧХ записаного сигналу (рис. 4). Далі приступаємо до видалення трісків та клацань отриманої фонограми 2.

Для чого всі разом відправляються у меню Transform-Noise Reduction-Click/
Pop Eliminator, де у вікні вибираються найбільш оптимальні параметри очищення звуку (дані були представлені професійними реставраторами, що з'їли не одну собаку на цій справі).
На рис. 5 ці параметри представлені на загальний огляд. Але спочатку нам потрібно натиснути кнопку Auto Find All Levels, а потім на ОК для запуску процесу очищення звуку.

Якщо після збільшення ми не знайшли початкову ділянку – не лякайтеся, а підведіть курсор миші до повзунка вгорі малюнку і посуньте цей повзунок вліво, де й знайдете початок фонограми. Тепер мишкою виділяйте початкову ділянку з шумом, що відповідає приблизно 3 секундам звучання (час вказано на панелі знизу), та в меню Transform-Noise, Reduction-Noise,
Reduction за допомогою кнопки Get Profile from Selection зробимо знімок такого ненависного нам шуму. Але попередньо виставимо найоптимальніші значення деяких параметрів, які можна побачити на рис. 7 разом із знімком шуму. А щоб почути попередній результат роботи шумодава, натиснемо на кнопку Preview, не забувши заздалегідь виділити фонограму, що очищається.
Якщо результат влаштовує, натискаємо кнопку ОК і починаємо процес шумоподавлення, що триває набагато менше, ніж очищення сигналу від тріску та клацань. Після закінчення не буде зайвим зберегти отриманий результат під іншим ім'ям, щоб мати уявлення про всі щаблі очищення звуку.

Слід сказати, що після повного очищення фонограми від шумів рівень сигналу дуже відчутно знижується, а отже доведеться нормалізувати сигнал за допомогою команди Transform-Amplitude-Normalize, що займе зовсім небагато часу.
Нарешті настав час провести заключну фазу нашого процесу, а саме - обрізку нашої фонограми по краях, і збереження її, рідної, у файлі. Відразу скажу, що обрізати непотрібні початкову і кінцеву ділянку звукового файлу можна і в Cool Edit за допомогою виділення непотрібної ділянки та команди Edit-Cut.
Для тих, хто хоче перевести в цифрову форму запису з компакт-касет, завдання спрощується рівно на один етап – очищення фонограми від шуму та клацань. Після закінчення запису музики на хард, у FFT-фільтрі вибираємо налаштування MCRESTORation, вирівнюємо АЧХ сигналу з касетника, а далі просто починаємо процес шумоподавлення та нормалізації сигналу.
Ну-с, наведений у божеський вигляд, очищений та підстрижений шматок фонограми зберігаємо кому як подобається – wav-формат чи інший. З першим можна робити будь-що, аж до кодування в МР3. Та мало не забув, треба ще записати всю цю справу на CD, щоб потім зручно можна було послухати десь на плеєрі у друзів, роздмухуючи щоки і ніздрі від своєї значущості в процесі оновлення звуку.

У підсумку, ви повинні записати на CD підготовлені звукові файли.

4. Підготовка файлів

Тепер запишемо музику на CD. Використовуємо Nero. Інші програми, зрозуміло, працюють аналогічно. Запустіть Nero та виберіть Compile a new CD та Audio-CD.
Відкриється перегляд композицій та диспетчер файлів. Перетягніть файли WAV у вікно композицій. Перетягуванням у цьому вікні можна змінити порядок файлів.
Потім виділіть всі композиції, клацніть правою кнопкою по них і виберіть
Properties. Встановіть довжину пауз між композиціями. Якщо паузи існують у самих файлах, це значення краще встановити як нуль. Після цього викличте закладку Filters. Тут також є інструменти для поліпшення якості звуку. За допомогою функції нормалізації можна вирівняти гучність окремих композицій: Натисніть поле Normalize і в якості методу встановіть Maximum. Nero налаштує у всіх композицій можливу максимальну гучність таким чином, щоб не було спотворень звуку.
Закрийте діалог клацанням по ОК.

5. Поділ файлу wave на окремі композиції

Тепер розділіть великі файли на окремі частини, щоб програвач CD розпізнав композиції. Натисніть відповідний файл і знову відкрийте діалог Properties. Викличте закладку Indexes, Limits, Split.
Nero послідовно відобразить звукові хвилі. Потім здійсніть поділ: там, де у хвилі відобразиться зарубка, знаходиться передбачуваний початок композиції. Чи це дійсно так, ви з'ясуйте, якщо клацніть на цьому місці і натисніть Play. Якщо мова йде про перехід, виділіть діапазон і натисніть Zoom In. Клацніть мишу вставте сіру лінію в місце, де ви хочете розділити композиції. Потім клацніть Split. Перейдіть до Full
View, у разі потреби повторіть все ще раз і на закінчення підтвердіть зроблене натисканням ОК. За допомогою "Властивостей" надайте назви окремим композиціям. Після цього натисніть на панелі інструментів кнопку для запису CD, встановіть швидкість, клацніть по Write - і все, Ви володар власного шедевра!

6. Перспективи та проблематика

Перспективи розвитку та використання цифрового аудіо бачаться дуже широкими. Здавалося б, усе, що можна було зробити у цій галузі, вже зроблено. Однак, це не так. Залишається маса ще зовсім незайманих проблем.

Наприклад, область розпізнавання мови ще не розвинена. Давно вже робилися і робляться спроби створити програмне забезпечення, здатне якісно розпізнавати мову людини, проте вони поки що не призводять до бажаного результату. Адже довгоочікуваний прорив у цій галузі міг би спростити введення інформації в комп'ютер. Тільки уявіть собі, що замість набору тексту його можна було б просто надиктовувати, попиваючи каву десь неподалік комп'ютера. Є безліч програм нібито здатних надати таку можливість, проте всі вони не є універсальними і збиваються при незначному відхиленні голосу читаючого від заданого тону.
Така робота приносить не так зручностей, як прикростей. Ще більш складним завданням (цілком можливо, що й нерозв'язною зовсім) є розпізнавання загальних звуків, наприклад, звучання скрипки в звуках оркестру або виділення партії рояля. Можна сподіватися, що колись таке стане можливим, адже людський мозоклегко справляється з такими завданнями, проте сьогодні говорити про хоча б найменші зрушення у цій галузі рано.

У галузі синтезу звуку також є простір вивчення. Способів синтезу звуку сьогодні існує кілька, проте жоден із них не дає можливості синтезувати звук, який не можна було б відрізнити від сьогодення. Якщо, скажімо, звуки рояля чи тромбону ще більш-менш піддаються реалізації, до правдоподібного звучання саксофона чи електрогітари добитися ще так і не змогли – існує безліч нюансів звучання, які майже неможливо відтворити штучно.

Таким чином, можна сміливо сказати, що в галузі обробки, створення та синтезу звуку та музики ще дуже далеко до того вирішального слова, яке поставить крапку на розвитку цієї галузі людської діяльності.

7.Глосарій термінів

1) DSP – Digital Signal Processor (цифровий сигнальний процесор).
Пристрій (або програмний механізм) призначений для цифрового оброблення сигналів.

2) Бітрейт - стосовно потоків даних - кількість біт за секунду
(bits per second). Щодо звукових файлів (наприклад, після lossy-кодування) – якою кількістю біт описується одна секунда аудіо.

3) Звук - акустична хвиля, що розповсюджується у просторі; у кожній точці простору може бути представлена функцією амплітуди від часу.

4) Інтерфейс - сукупність програмних та апаратних засобів, призначених для організації взаємодії різних пристроїв.

5) Інтерполяція - відшукання проміжних значень величини за деякими відомими її значеннями; відшукання значень функції f(x) у точках x, що лежать між точками xo

Розділ 3 Реставрація старих записів

Якісні комп'ютерні системи шумопониження уможливили появу безлічі програм для реставрації старих звукозаписів. Система реставрації – це шумопониження. Це цілий комплекс взаємодоповнюючих функцій, таких, наприклад, як деклікер (видалення клацань), система розпізнавання та видалення характерного шипіння грамплатівки та ін. Одне з найважчих завдань при реставрації звукозаписів – усунення нелінійних спотворень.

Як відомо, архівні записи, що зберігаються на магнітофонних стрічках та вінілових пластинках, згодом втрачають початкову якість звучання. На них з'являються різні шуми та перешкоди, що заважають нормальному прослуховуванню та псують загальне враження від запису. Найчастіші дефекти – це імпульсні перешкоди (клацання) і фонові шуми (шипіння магнітофонної стрічки, шум при відтворенні з вінілового диска), викликані поганими умовами зберігання або недостатньо гарною якістюпочаткового запису.

Зі зростанням потужності сучасних комп'ютерів та появою складніших алгоритмів обробки звукових сигналів відкрилася можливість відновлювати архівні фонограми шляхом складної обчислювальної обробки вихідного сигналу за допомогою комп'ютера. Такий спосіб відновлення звуку має надзвичайно високу ефективність та гнучкість, дозволяє усувати перешкоди, клацання, фоновий шум та інші дефекти запису. Безперечно, це одне з найважливіших досягнень у галузі комп'ютерної обробки звуку. Головна перевага даного методу полягає в тому, що на відміну від звичайних системшумопониження, що діють за принципом фільтрації частот, комп'ютерна реставрація, на думку розробників програм, не надає практично жодного негативного впливу на основний сигнал (це твердження, проте, заперечується багатьма експертами та аматорами музики).

Засоби видалення шумів з фонограм включаються до професійних редакторів звуку зазвичай у вигляді додаткових програмних модулів. Крім того, розроблено програми, призначені спеціально для відновлення аудіозаписів. Однією з них є фірма ZH Computer, Inc. програма DART Pro 32, яка містить повний набір засобів, що дозволяють якісно видалити із запису імпульсні перешкоди та фонові шуми. Крім того, користувач може редагувати відновлену фонограму. Таким чином, DART Pro 32 дозволяє досягти відмінних результатів під час реставрації будь-яких фонограм.

Для аудіо редактора Sound Forge фірма Sonic Foundry випускає додатковий модуль Noise Reduction,що видаляє шипіння магнітної стрічки, перешкоди, викликані електромагнітними наведеннями електромереж, та інші шуми.

У програмі WaveLab для реставрації використовуються два додаткові модулі – DeNoiserі DeClicker.

Крім того, до базового комплекту поставки WaveLab входить модуль ефектів Grungelizer,який виконує функції, прямо протилежні описаним вище. Він використовується для імітації старих «зашумлених» записів шляхом додавання у вихідний сигнал таких специфічних перешкод, як фон, створюваний наведеннями змінної напруги, клацання та тріск, характерні для вінілових звуконосіїв, високочастотне шипіння, яке спостерігається при відтворенні звуку за допомогою аналогового магнітоф. На додаток до всього перерахованого за допомогою модуля можна звужувати частотний діапазон сигналу і імітувати перевантаження підсилювача.

Давайте створимо компілятор! автора Креншоу Джек

З книги Запис CD та DVD: професійний підхід автора Бахур Віктор

Реставрація запису Програма Adobe Audition 1.5 має велику кількість інструментів, що дозволяють відновити звук, записаний на комп'ютер з вінілових пластинок, касетних та бобінних магнітофонів, а також видалити шипіння, клацання, навантаження та інші небажані

З книги Windows Vista без напруження автора Жвалевський Андрій Валентинович

Сумісність старих програм з Windows Vista Більшість програм, створених для попередніх версій Windows, успішно працюють і в Windows Vista, але в роботі деяких програм виявляються збої або повна відмова від запуску. Все через те, що система відмовляється запускати

З книги Windows Vista автора Вавілов Сергій

Сумісність старих програм з Windows Vista Більшість програм, створених для попередніх версій Windows, успішно функціонують і в Windows Vista, однак у деяких з них виявляються збої. Іноді зустрічається повна відмова від запуску через несумісність програми з

З книги Обробка баз даних на Visual Basic®.NET автора Мак-Манус Джеффрі П

З книги UNIX: взаємодія процесів автора Стівенс Вільям Річард

РОЗДІЛ 9 Блокування записів

З книги Scrum та XP: нотатки з передовою автора Кніберг Хенрік

Підхід №2: «Починати реалізовувати нові історії, але найвищим пріоритетом ставити доведення старих до розуму» Ми віддаємо перевагу цьому підходу. Принаймні, досі так і було. По суті він полягає в наступному: коли ми закінчуємо спринт, ми переходимо до наступного, але

З книги Тайм-менеджмент для системних адміністраторів автора Лімончеллі Томас

Видалення старих процедур Іноді доводиться оновлювати процедури. В історії із заправкою автомобіля, розказаною раніше в цьому розділі, я зазначив, що в якийсь момент забув, з чого почалася ця процедура, але продовжував виконувати її. Це викликає певну тривогу. Чи правильно

З книги Налаштування Windows 7 своїми руками. Як зробити, щоб працювати було легко та зручно автора Гладкий Олексій Анатолійович

Глава 5 Настроювання та використання облікових записів користувачів В операційній системі Windows 7 обліковий запис користувача – це набір відомостей, які визначають, до яких папок та файлів користувач має доступ, та які зміни можуть вноситися користувачем у роботу

З книги Розробка програм у середовищі Linux. Друге видання автора Джонсон Майкл До.

25.4.1. Додавання записів Нові та оновлені записи заносяться в базу даних з використанням функції dpput(). int int dpput який згодом може використовуватися для отримання інформації,

З книги Linux: Повне керівництво автора Колісниченко Денис Миколайович

25.4.2. Видалення записів Видалення записів з бази даних здійснюється шляхом виклику функції dpout() та передачі їй ключа, дані якого необхідно видалити.int dpout(DEPOT , після чого повертається

З книги Linux та UNIX: програмування у shell. Посібник розробника. автора Тейнслі Девід

6.2.5. Налаштування мережі в старих дистрибутивах Якщо вам недоступні графічні конфігуратори, то можна налаштувати мережевий інтерфейс і з командного рядка.

Як заробити в Інтернеті. 35 найшвидших способів автора Фоміна Ольга

З книги Встановлення, налаштування та відновлення Windows 7 на 100% автора Ватаманюк Олександр Іванович

1. Заробити на старих речах: сайти аукціони в мережі, як заробити на них Інтернет-аукціон (він же онлайновий аукціон) - це торги, що відбуваються через мережу інтернет. Відрізняються від звичайних аукціонів, тим, що проводяться на відстані (на відстані) і в них можна

З книги Цифрова фотографія. Трюки та ефекти автора Гурський Юрій Анатолійович

Розділ 11 Настроювання контролю облікових записів користувачів З механізмом контролю облікових записів користувачів вже встигли познайомитися ті, хто працював у Windows Vista. Як і у Vista, у Windows 7 цей механізм покликаний захистити операційну системувід запуску різноманітних

З книги автора

17.12. Фарбування старих фотографій людей Більшість старих фотографій виконані у монохромному кольорі. Це надає знімку шарму і підкреслює його поважний вік. З іншого боку, при погляді на таку фотографію виникає відчуття, що частина інформації була втрачена