Як вирізати вокал з пісні

Етап перший - конвертація пісні в wav формат.

Введення в основи цифрового звуку

Так як працюємо ми з записом, - то розуміння основ цифових звуку просто необхідно для того щоб вирізати вокал або ж інший інструмент. Після відкриття файлу, перед Вами з'явиться дві криві, на зразок цих:

1. Гучність, рівень звуку і амплітуда

Чим більше амплітуда коливань кривих - тим більшою гучністю володіє звук:

Як Ви помітили - в нашій композиції гучність звуку постійно варіюється. При цьому відображається загальна гучність композиції, яка складається з усіх інструментів. Відповідно після вирізання вокалу, а точніше придушення всіх інших інструментів - загальна гучність композиції повинна значно впасти.

При цьому потрібно розуміти те що гучність - це поняття відносне. Абсолютна поняття рівня звуку в певний момент - це амплітуда. Якщо збільшити масштаб відображення кривих, то ми побачимо наступну картину:

На зображенні видно то що при збільшенні масштабу відображення (можна судити за розміром білої області), криві на початку приймають вид періодично колеблющеёся кривої, а після ряду точок. Кожна точка (відлік) - це значення амплітуди звуку в певний момент часу. Чим більше таких точок - тим детальніше відображається динаміка композиції, що впливає на якість звуку. Саме з амплітудою відліків ми і будемо працювати, штучно зменшуючи рівень звуку тих відліків, які не несуть корисної інформації, тобто не відображують партію вокалу. Звичайно ж, ми не будемо це робити вручну, ми будемо працювати з частотами.

2. Частота, частотний діапазон певного інструменту, конфліктні частоти

Спектрограма відображає частоти, які присутні в аудіо файлі. Низькі частоти розташовані знизу, високі - зверху. В даному прикладі видно то що є фонова підкладка зі своїм шумом, видно це з постійного фіолетового заповнення нижньої і середньої частин спектрограми. Це джерело звуку не володіє великим рівнем гучності, але зате постійний. Чого не можна сказати про ритмічної частини. Ритмічна частина - це вертикальні, що періодично повторюються червоні (бо гучніші) смужки. Видно то що в ударних інструментах є більш високі частоти ніж в фонової підкладці (який представлений фіолетовим шумом на спектрограмі). Також в нижній області спектрограми знаходиться бас і інші інструменти, включаючи вокал (середні частоти, залежить від типу голосу, в цілому чоловічий голоси володіє більш низьким частотним діапазоном, ніж жіночий). Після вирізання вокалу (а точніше вирізання всього іншого) - нічого цього не повинно залишитися. Однак працювати ми будемо не з спектрограммой. Взагалі, спектрограмма - це просто зручне відображення частот, які присутні в композиції. По справжньому ж інформація про частоти знаходиться під все тих же прищепити.

Зверніть увагу на те що при поступовому збільшенні частоти - поступово зменшується період хвилі. Так і є, кожна частота має свій періодом хвилі, при зміні періоду хвилі - змінюється частота звуку. Чим більше період хвилі - тим нижче частота звуку. Чим менше період хвилі - тим вище частота звуку. Наша запис пісні, яка представлена єдиної кривої, є об'едінаніем величезної кількості хвиль певних частот, які звучать в певний час. Наше завдання - позбавити від хвиль з певним періодом коливань.

Далі я згенерував в лівому і правому каналах два окремих тони з певною постійною частотою:

Після чого конвертував аудіофайл в моно (при конвертації стерео в моно - обидва канали складаються) і потім знову конвертував моно файл в стерео:

Форма кривих змінилася, на спектрограмі видно то що в звуки присутній тільки дві частоти. Далі я незалежно обробив канали, з лівого вирізавши верхню частоту, а з правого - нижню (скористався FFT фільтром, так як він набагато краще працює всяких еквалайзерів):

Як бачите досвід вдався - отже вирізати можна все що завгодно, головне вміти. В даному випадку ми не втратили якості, проте втратили половину гучності, що зовсім не страшно, тому що з спектрограми видно то що в лівому і правому каналах немає шумів, отже можна збільшити гучність в 2 рази і отримати початковий сигнал.

По суті всі методи вирізання вокалу зводяться до вирізання певних частот (хвиль певного періоду) з пісні. Однак перед тим як перейти до їх розгляду давайте розглянемо ще один параметр звукової хвилі:

Пояснити що таке фаза найпростіше на малюнку:

Спочатку це була проста синусоїдна хвиля. Після чого я виділив її другу частину (виділено синім кольором) і інвертованого фазу. По суті я помножив криву на -1. Ми бачимо те що в результаті функція змістилася на половину періоду, це особливо добре видно в центрі зеленої області. Для чого ж це було зроблено. Давайте виконаємо те ж саме, але тільки знову таки з одним з двох каналів. Першу частину я не чіпав, в обох каналах одна і та ж частота, у другій частині я інвертовану один з каналів:

При конвертації стерео в моно - відбувається складання значень амплітуди правого і лівого каналів. Я конвертував криві в одну криву (моно), після чого знову конвертіовал її в стерео формат:

Отже, щоб вирізати вокал з пісні потрібно працювати з фазою, частотою і амплітудою. Давайте розберемося що і коли потрібно застосовувати.

1 етап - вирізаємо частоти, які не присутні в вокалі

Дуже важливо залишити поза увагою частотний діапазон вокалу, так як наша слухова система особливо чутлива до зміни його тембру. Композиція складається з декількох партій інструментів, які часто звучать разом. При цьому кожен з інструментів звучить в певному частотному діапазоні (так, бас бочка і бас гітара звучать переважно в низькочастотному діапазоні, при належному рівні звуку вони б'ють по грудях, а ось пташки або тарілки - співають і звучать переважно на високих частотах, які до слова швидше поглинаються навколишнім середовищем). Якщо частотні діапазони інструментів не перетинаються - отже їх можна розділити один від одного без втрати якості. Якщо частотні діапазони інструментів перетинаються - то розділити їх без втрати якості методом вирізання частот можна тільки в тих випадках, коли ці два інструменти не перетинаються за часом, тобто просто не звучать одночасно. Якщо ж інструменти перетинаються, то їх загальні частоти називаються конфліктними.

Першим кроком з композиції Ви можете вирізати все що знаходиться нижче частотного діапазону вокалу (бас бочку, бас гітару). Визначити частотний діапазон можна за допомогою будь-якого жквалайзера, по черзі підвищуючи / знижуючи певну частоту і слухаючи - чи не змінилося звучання вокалу. З високими частотами справа йде гірше - тому що свистячі і шиплячі знаходяться на високих частотах. Просто обрізавши високі частоти - Ви втратите якість.

2 етап - вирізаємо з пісні все що можна фазовим інвертуванням

Хочу зауважити то що виконання 1-го етапу перед другим ніяк не вплине на якість виконання другого етапу. Так як нашою метою є вокал, то звучання всіх інших партій нас не цікавить - вони будуть удалени.Етот метод особливо добре працює при роботі з електронною музикою. Справа в тому що в електронній музиці коли, наприклад, грає бас бочка - то використовується один семпл або ж один і той же алгоритм синтезу звуку. Коли ж іде запис з живою, акустичної ударної установки - то тут записується все, в резонансі (синтезі) звуку бере участь безліч різних процесів, що робить кожен новий удар кілька несхожим на попередній. В електронній музиці теж можна змінювати параметри синтезу та обробки звуку - але ці зміни дуже часто носять циклічний, періодичний характер, що не так важливо для методу вирізання вокалу з допомогою інвертування фази.

При вирізанні певних партій методом інвертування фази нам знадобиться частина пісні, в якій окремо звучить один або кілька інструментів. Ми виділяємо цей відрізок, бажано щоб виділення охоплювало петлю, всю партію інструменту ( "початок - середина - кінець" бита). Після виділення необхідно копіювати цю частину (ctrl + c) і вставити в іншу, порожню частину проекту (ctrl + v). Після чого зробіть операцію инвертирования фази (effects - invert через головне меню). Заново скопіюйте виділену партію і перемістіть курсор в ту частину пісні, де звучить та ж партія (скажімо біт), але з вокалом. Постарайтеся максимально точно визначити початок петлі. Після чого вставте нашу інвертовану версію партії. Якщо Ви точно підібрали місце для вставки - то партія цього інструменту повинна вирізатися, подібно раніше наведеним прикладом з інвертуванням правого каналу і складання його з лівим. Те ж саме необхідно зробити і з іншими партіями пісні.

3 етап - вирізаємо вокал в ручну

Після того як ми вирізали все явно не концліктние частоти і скористалися методом інвертування фаз - напевно щось залишилося. І це щось тепер не прибрати крім як своїми ручками. Ви зробили все що могли автоматичними методами, проте вони не дозволяють повністю вирізати вокал з пісні. Перше що ми робимо - це видаляємо все ті частини пісні, в яких відсутня вокал. А точніше не видаляємо - а робимо нормалайз = 0 (або просто даємо команду "silence" - заповнити тишею). Після цього у нас залишиться вокал з певними призвуками. Після перших двох етапів рівень звуку повинен був зменшитися. Виділіть всю пісню і зробіть нормалайз до 100%. Зверніть увагу на те що вокал - це одноголосний інструмент. Це не піаніно в якому одночасно можуть звучати як високі, так і низькі октави. Коли людина співає або говорить, в кожен певний момент часу він вимовляє тільки одну букву. Отже, в кожний певний момент, розподіл корисних частот змінюється. Крім того, є ряд букв, повторне вимова яких однією людиною практично не змінюється. Що випливає з усього цього?

Якось раз я провів експеримент. У мене був відрізок вокалу, де вокаліст з одним і тим же характером вимовляв букву "а". Будь то один відрізок пісні або два різних - не важливо. Важливим є те що в одному випадку ця буква була чиста, у другому випадку вона глушить ударом снера. Спочатку я пробував заглушити снер вищепереліченими методами глушіння не корисно частот і інвертування фаз, - але результат мене не влаштовував, тому що змінювалося звучання вокалу і це звучало жахливо. Просто замінивши одну букву такий же (без снера), з іншої частини пісні - я отримав результат, який потім ніхто не зміг відрізнити, а тільки питали і дивувалися: "яким чином ти отримав такий чистий вокал?". Так, це ручна обробка, після автоматичної обробки - так і тільки так можна домогтися високої якості звуку. Ви відновлюєте вокал, домагаючись максимальної якості звуку. Ідеальна якість Вам отримати не потрібно, але запевняю Вас в тому, що після автоматичної і ручної обробки - Ви отримаєте необхідну якість. Особливо з огляду на те що при подальшій роботі з вокалом (додаванням своїх партій в реміксі) - вокал звучатиме набагато краще, завдяки так званому ефекту маскування (Ваші партії будуть маскувати мінімальні призвуки в партії вокалу). Так і тільки так можна вирізати вокал з пісні. Не існує якоїсь магічної чудо-програми яка сама все зробить за Вас.

Звичайно ж, є такий варіант - коли у Вас є окремо записані партії компощіціі (окремо вокал, окремо клавішні, окремо ударні), і в цьому випадку Вам просто достатньо скласти інвертовані партії непотрібних інструментів. Але в цьому випадку і говорити нема про що, так як якщо є окремо записані партії інструментів - то і окремо записаний вокал повинен бути. Що ще хочу згадати - це те що у випадку з електронною музикою, потрібно враховувати те що все в якійсь мірі використовують чужий матеріал. Так, наприклад, у творчості електронної групи Продиджи - дуже багато запозичень, знаючи звідки були запозичені семпли (про що часом говорять самі виконавці в інтерв'ю) - можна їх знайти і скористатися ними для вирізання цих партій. Ще один трюк - це панорама. Адже частина інструментів знаходяться строго по центру, частина інструментів іноді знаходяться строго в правому / лівому каналах. Якщо Ви інвертіруете один з них і складіть - то отримаєте моно запис, в якій не буде центру а залишаться тільки ті інструменти, які грають в правому або лівому каналах. Після чого заново конвертуйте пісню в стерео формат, як це було показано раніше, і видаліть з правого каналу все що в оригіналі звучить в лівому каналі, теж саме виконайте з іншим каналом. Якщо партії лівого та правого інструменту не сильно перетинаються - то таким чином Ви можете позбутися від цих партій (склавши з інвертованою версією оригінал). Як бачите, відновлення записів, в тому числі вирізання вокалу з пісні - це мистецтво, я бажаю Вам в ньому досягти успіху.