Mi is a zene? - IIIe.
A felharmonikus-konszonancia II.
S most itt az idő, hogy játsszunk egy kicsit az előző fejezetben felfedezett felharmonikusokkal!
S most itt az idő, hogy játsszunk egy kicsit!
Ez az elmés játék nem jöhetett volna létre, ha nincs Derzsi Zoltán volt tanítványom (aki azóta már Angliában sikeres, 2 diplomás mérnökké vált)...
...aki sok egyéb elfoglaltsága mellett lelkes rádióamatőr, így fel tudta hívni figyelmemet egy igen sokoldalú (shareware) rádióamatőr programra, amelyben található egy spektrográf opció is. A program neve MixW és ingyenes próbaverziója letölthető a www.mixw.net címről (2008).
A spektrográf képes egy hangtartomány teljes frekvencia-analízisére, ebben a minőségében tehát megmutatja a keletkező zenei hangok felharmonikusait is.
(Derzsi Zoli meghatározása szerint: a spektrográf és a spektrumanalizátor között elvi felépítésében nincs különbség, azonban igen fontos megjegyezni, hogy míg az analizátor az amplitúdót mutatja a frekvencia függvényében, addig a spektrográf a spektrumot mutatja az idő függvényében, a spektrum egyes részein az amplitúdót pedig színváltozással jelzi. Ez egy szükségmegoldás, hiszen háromdimenziós megjelenítőink nincsenek, így valahogy meg kellett oldani a problémát. Az általa készített képeket pedig spektrogramnak nevezzük.)
Ismerkedjünk meg ezzel a programopcióval!
A képen egy vizualizált frekvenciatartományt láthatunk 0 Hz-től nagyjából 9500 Hz-ig. Ezt mutatja a felső fekete sáv, amely tehát frekvenciákat mutató sáv. A kép színei annál sötétebbek, minél kisebb hangerejű hangról beszélhetünk, a nagyon erős hangok pirossal rajzolódnak ki, az átlagosak zölddel, míg a kék színnel jelöltek már csak azonosíthatatlan zörejek. A kép közepén egy UFO-szerű zöld fej: ezt röviden én füttyentettem. A kép jobb oldalán láthatjuk, hogy 9000 Hz felett a kép kezd átmenni koromfeketébe: nos, ez egyértelműen a szuperolcsó, 500 forintos HAMA mikrofonom frekvenciaátviteli határa. A spektrum nem statikus, hanem folyamatosan mozog fentről lefelé, az időtengely tehát a függőleges, míg a frekvenciatengely a vízszintes, a hangerő (amplitúdó) pedig a színek.
Ezzel a módszerrel azt fogjuk megvizsgálni, hogy a különböző, sokszor zeneileg is értelmezhető hangok hangszínei miként rajzolódnak ki 0 Hz-től 9500 Hz frekvenciatartományban.
De álljunk csak meg egy pillanatra! Mit is szeretnénk tenni: veszteséges tömörítési eljárással kódolt zenéket (mert az mp3 ilyen) kívánunk megszólaltatni egy nem túl jó minőségű, szélessávú erősítőn keresztül úgy, hogy közben mindezt a szuperolcsó HAMA mikrofon közvetíti a számítógép felé?
Mindez abszolút amatőr megvalósításnak tűnik és valóban az. Ugyanakkor Derzsi Zoli is jelezte, hogy számára gyanús a HAMA mikrofon 10kHz-es frekvenciaátviteli határa, szerinte ez messze alatta van. Ebben az esetben viszont programozási hibáról van szó. Mindenesetre a programot ismert frekvenciákkal tesztelve nekem korrekt eredmények jöttek ki. Kérem a Tisztelt Olvasót, hogy mindezt számolja bele az alábbiakba (azaz ne vegye túl komolyan az egészet)...
Először nézzük meg az ominózus, sokat vitatott asztalra csapást:
A spektrumban kiértékelhető nincs; a hangerőtől gyakorlatilag minden kiakadt, még a szomszéd is. Annál érdekesebb a következő spektrum, amelyen lassan azt mondom ki, hogy "Pénzes-féle Gitáriskola":
Az alapfrekvencia néhány száz Hz környékén van, ám folyamatosan felharmonikus koszok is felfedezhetők. Az emberi beszéd felharmonikusban eléggé szegényes a zenei hangokhoz képest. Ám dúdoljunk csak egy rövid ideig azonos hangmagasságon!
Hoppá! A dúdolás zöldes alapfrekvenciája után jól behatárolható és szabályos felharmonikusok jelennek meg!
A következő képen a "Tavaszi szél" című népdal első sorát éneklem:
A dallam 500 Hz alatt mozog, a felharmonikusok kissé elmosódottak, de karakteresen jelentkeznek a spektrum bizonyos részeiben.
Itt az idő hangszerek tesztelésére!
Először az Ibanez akusztikus gitáromról bejátszott egyetlen A5 húrpendítés (110 Hz)...
...majd ugyanez az E1 húr A hangján (5. fekvés - 440 Hz):
Ennél sokkal karakteresebben jelentkeznek a felharmonikusok Casio szintetizátoromból bejátszva; folyamatos orgonahang 440 Hz-en. Láthatjuk, hogy a legalsó vonal (itt balról az első) a frekvenciasáv szerint tényleg 440 Hz körüli:
Még egyszer ellenőrizzük le a pontosságot 880 Hz-en is:
Ezután egy A-dúr skála Ibanez akusztikus gitárom alsó regiszterében, azaz E6 húr A hangjáról indítva (5. fekvés):
Hoppá, igazi felharmonikus kavalkád! Kezd érdekessé válni a dolog! Most ugyanez az A-dúr skála a felső regiszterben (12. fekvés felett):
Alohe Oe! Ez aztán a tökéletes spektrumrajzolat! Láthatjuk, hogy a felső 3 húr (G3-H2-E1) mennyivel gazdagabb felharmonikusban.
Ezt az A-dúr kísérletet a fenti skálapozíciókban végezzük el elektromos gitáron is (Fender Squier Affinity Fender-pickup, nyaki állásban):
Az akusztikus és elektromos gitár spektrumát összehasonlítva felfedezhetjük a nyilvánvaló különbséget: a pickup nem képes annyira élethűen felvenni a felharmonikus hangokat. Ezzel egyúttal talán meg is határozhatjuk a minőségi pickup egyik legfontosabb ismérvét: nem vágja le a felharmonikus hangokat, azaz élethű hangkaraktert ad vissza. Ez persze nemcsak kizárólag ezen a momentumon múlik, hanem minden olyan alkatrészen, amely az elektromos gitáron a hangképzésben vagy a hangátvitelben részt vesz (azaz gyakorlatilag mindegyiken). Az állítással persze nem mondtunk nagyot, bár azon érdemes elgondolkodnunk, hogy érdemes-e méregdrága pickupokkal tuningolni gitárunkat, ha csak egy is silány minőségű a hangképzési vagy a hangátviteli alkatrészek között...
A következő lépésben arra keressük a választ, hogy más lesz-e nyaki és a húrláb-pickup nyújtotta felharmonikus átvitel? Először a nyaki pickup spektruma, majd a húrláb-pickupé:
Sejtésem beigazolódott: kis mértékben, de a húrláb-pickup élesebb hangzása valóban azt jelenti, hogy felharmonikusokban valamennyivel gazdagabb. Azonban ez az akusztikai különbség szerintem nem a pickup minőségén, hanem húrhoz viszonyított pozícióján múlik.
Most Casio szintetizátorom Grand Piano hangját vizsgáljuk meg a már bejáratott A-dúr skálával, először az alsó, majd a felső regiszterben:
Az igazi érdekesség, hogy a szintetizátor esetében nem természetes, hanem mesterséges úton előállított hangokat teszteltünk.
Most pedig jöjjön a többi hangszer!
Kezdjük a zongorával! Részlet Frederic Chopin Cisz-moll keringőjéből ultramodern megjelenítésben (azaz már hallgatni sem kell, csak nézni, ám így is mennyei élvezet!):
Orgona - Bach: D-moll toccata és fúga - a híres bevezető téma:
Cselló - Camille Saint Saens: A hattyú - zongorakísérettel:
Hegedű - Massenet: Meditáció a "Thais" című operából - nagyzenekari kísérettel:
Mandolin - Vivaldi: C-dúr mandolinkoncert - kamaraegyüttessel:
Trombita - Haydn - Esz-dúr trombitaverseny - nagyzenekari kísérettel:
Vonósok és fúvósok - Wagner: Trisztán és Izolda - előjáték (a híres Trisztán-akkord):
Zenekari és vegyes kórus tutti - Mozart: Requiem - Introitus
Zenekari és női kórus tutti (Halleluja...) - Handel: A Messiás
Férfi kar - gregorián:
Férfi hang zenekarral (Pavarotti hangja) - Schubert: Ave Maria
Látjuk a fodrozódásokat? A művész ott remegteti hangszálait (tremolózik)...
Most nézzünk meg néhány könnyűzenei stílust!
Nu Metal-backing track:
Laid Back - Sunshine Reggae:
Malmsteen arpeggio-szóló:
Valójában ezek már inkább tűnnek félresikerült tapétáknak, semmint zenei spektrumoknak. Ennek azonban speciális, hangmérnöki oka van. A mai könnyűzenei számokat a stúdióban úgy próbálják keverni, hogy a dal spektruma egyenletes legyen, azaz a dal minden egyes frekvenciakomponense (nagyjából) azonos hangerővel rendelkezzen. Ebben az ideális esetben a dal spektruma tökéletes téglalapot mutatna, nem úgy, mint az alábbi képen, ahol láthatóan alig van basszus-hangerő és a középtartomány is horpadt kissé:
A tökéletes téglalap-spektrumot klasszikus hangmérnöki eszközökkel valójában elég nehéz elérni, bár lehetséges, hogy azóta erre is megírták a megfelelő algoritmust. (Ez igencsak elképzelhető, elvégre ha a felvett zenei anyagot digitalizáljuk -amilyen módon ma már a legtöbb stúdió dolgozik-, akkor innentől ez a feladat pusztán algoritmus kérdése. Igazam van vagy tévedek, kedves hangmérnök bácsik? Legyenek szívesek írják meg nekem!)
Amit tehát a fenti könnyűzenei tapétákon láthatunk, az a dalok mesterségesen, azaz keverési utómunkálatok során kiegyenlített frekvenciaspektruma, illetve még pontosabban: annak csak "árnyékvetületei", hiszen a hangmérnökök valós zenei frekvenciákkal, nem pedig azok felharmonikusaival dolgoznak. Ráadásként a masszív ritmusszekció sokféle, magas frekvenciájú ütőhangszere (például a cinek) a tapétát még jobban és még egyenletesebben "meg is vonalazzák".
Derzsi Zoli az alábbi levéllel reagált a fenti "hangmérnöki" állításaimra:
"Ez így nem teljesen állja meg a helyét. Az emberi fül frekvenciaérzékelése
nem lineáris, a kétszeres frekvenciaviszonyt nem kétszeres hangmagasságnak
(azaz oktávnak) hallja. Ezt Te magad is láthatod, ha egy skálán lépkedsz felfelé:
növekedni fognak az egyes hangok közötti távolságok (frekvenciában),
pedig úgy hallod, hogy az az éppen aktuális skálának megfelelő hangköz.
Az ember (és nagy valószínűséggel minden élőlény) hangmagasság-érzékelése a frekvencia
függvényében nem lineáris. Sőt, az egész spektrum (az infrahangtól a
kozmikus sugárzásig) sem lineáris. A MixW programja viszont lineárisan
mutatja a spektrumot, aminek főként rádióamatőr okai vannak: SSB (USB)
üzemmódban a rádió hangja van bevezetve a számítógép hangbemenetébe, tehát a
berendezés mindenkori vivőfrekvenciájához képest mutatja a spektrumot: 110
MHz +50 Hz, +1 kHz, stb. Be lehet úgy is állítani, hogy a program logaritmikusan
mutassa a spektrumot, de a jelen pillanatban az alacsony
frekvenciáknál lévő kis felbontás miatt ez csak rontana a helyzeten. Erről
tehet a hangkártya, hiszen már a digitalizálásnál is veszteségesen
dolgozik és a CPU is véges számítástechnikai kapacitása miatt.
Az emberi fül felépítéséből következik, hogy a hangok magasságát sem
egyenletes hangerőként érzékeljük: ezért kell egy 50W-os hangrendszerhez
150 W-nyi mélysugárzó és csupán 5-6W-nyi magas. (Az arányok kissé
túlzottak, de itt most az elvet hangsúlyozom.)
A hangmérnök munkája tehát annyi, hogy a felvételi rendszer frekvenciamenetét igazítsa az emberi fülhöz, hogy aztán jelalakhűen (Hi-Fi, High-End,
Audiofil, professzionális) visszaadó rendszeren hallgathassuk meg az adott
zenedarabot. Nem is olyan egyszerű dolog ez...
Tovább bonyolítva a dolgot: az ember hallásának frekvenciamenete
függ a hangerőtől is. Emlékezetem szerint, ha halkan szól a zene,
kevesebb mélyhangot hallunk, ha azonban hangosítjuk, kevesebb középhangot
(és közben több mélyhangot) érzékelünk, amely érzékelés ronthatja a hangképet, ezért
kellemes például a komolyzenei darabokat nagyobb hangerőn hallgatni. A
jobb minőségű hangrendszerek (például a régi Videoton RA63xxS hifik is)
rendelkeznek fiziológiai hangerőszabályzással, amivel ezt kompenzálják.
Tehát a hallásküszöb és a fájdalomküszöb frekvenciánként változik,
ráadásul nem egyenlő mértékben. Valójában ezért szólnak rosszabbul a
koncert-, mint a stúdiófelvételek, holott ugyanazt a technikát használják.
Ezért más élmény 10W-on, és 1000W-on gitározni, hiszen teljesen máshogy
halljuk.
Ez utóbbit saját felvételek készítésénél én is tapasztalom és csendesszoba
híján eléggé
megnehezíti a feladatomat. És még szót sem ejtettem az
irányérzékelésről..."
A válaszom:
"Igen, ez mind igaz, ám én egy szót sem ejtettem az emberi hallástartomány frekvencia-anomáliáiról. Én csupán azt állítom, hogy a zenének hangmérnöki szempontból igenis létezik-létezhet egy olyan idealizált spektruma, amely nevezetesen téglalap alakú. Mindenképpen idealizált ez, mert értekezésedből egyértelműen kiderült: az emberi hallás tökéletlenségei miatt ideális megoldás nem lehetséges."
A fenti vizsgálódás utolsó gondolataként jegyzem meg, hogy egy hang felharmonikus dúsultsága függ az alaphang hangerejétől is. Egy nagyobb hangerejű hangnak több és jobban mérhető felharmonikusa van.
Ha az alaphangból következő, járulékos frekvenciákat tovább elemezzük, akkor további, még érdekesebb felfedezésekre juthatunk.
Először is, egy zenei hang megszólalásakor a fül belső szerkezete az alaphanghoz egy oktávot ad hozzá (Kerényi Miklós György - Az éneklés művészete és pedagógiája - 31. oldal). Ez több mint döbbenetes, elvégre itt már nem külső fizikai-akusztikai, hanem belső, anatómiai jelenségről van szó. Ennél azonban létezik még egy elképesztőbb jelenség: ez olyan hangközök felcsendülésekor szokott létrejönni, ahol a 2 hang hangmagasságban nincs nagyon távol egymástól. Ekkor lép fel az úgynevezett hanglebegés, amely során nemcsak maga a hangköz, hanem az alaphangok frekvenciájának összege, sőt különbsége is megszólal.
Például egy 200 és 300 Hz-es jel egyidejű felhangzásakor nagyon halkan, de összeghangként meg fog jelenni egy 500 Hz frekvenciájú jel (200 + 300 = 500) és különbségi hangként egy 100 Hz-es jel is (mert 300 - 200 = 100). Az igazi probléma mindig az összeghanggal van, mert az általában disszonáns, míg a különbségi hang legtöbbször konszonáns.
Nagyon sokáig tagadták a különbségi és összeghangok puszta létezését, mert sok zenész és zenetudós úgy vélte, hogy azok csupán a zene során fellépő pszichikai délibábok. Később rezonátorok segítségével -olyan eszközökkel, amelyek egy adott frekvenciára hangolva felerősítik a kívánt hangot-, sikerült bebizonyítani észleléstől független, fizikai létezésüket. A különbségi hangokra először Sorge német orgonista hívta fel a figyelmet 1745-ben, de tőle függetlenül a híres hegedűs Tartini is észlelte a jelenséget. Az összeghangokat Helmholtz fedezte fel 1863-ban.
Vajon lehetséges-e valamilyen módon hasznosítani ezt a páratlan akusztikai jelenséget?
Igen, lehetséges, például az orgonasípok építésénél. Ezek a sípok a legalsó hangtartományban már olyan hosszúak, hogy egyszerűen nem éri meg az elkészítésük. Helyette 2 rövidebb, az alaphang 2. vagy 3. felharmonikusát generáló sípot használnak fel és a kettő egyidejű megszólaltatásával, különbségi hangként hozzák létre a kívánt alaphangot.
A magam részéről sikertelenül próbáltam ezeket a járulékos hangokat megjeleníteni a MixW spektrográfján keresztül. Véleményem szerint ehhez túl gyöngék voltak, az észlelő eszközök pedig érzéketlenek; kimutatásuk minimum rezonátorok közbeiktatásával lett volna lehetséges.
Kesztler Lőrinc kitűnő zenepedagógus egyik könyvében azt írta (1957-ben), hogy a többi hangtulajdonsággal ellentétben a hangszín nem mérhető tényező. Ez az állítás manapság már nem nagyon állja meg a helyét, mert élt egyszer Franciaországban egy Joseph Fourier nevű polihisztor (1768-1830), aki megfogalmazta: minden periodikus mozgás előállítható szinuszos jelek összegeként (Fourier-sor). Eme mértani sorozat alapján következtethetünk a felharmonikusokból az alaphangra és fordítva is. Ez a matematikai lehetőség a mérhetőség mellett érvel. Abban sem vagyok biztos, hogy 2009-ben nem létezik olyan algoritmus vagy tudományos műszer, amely ne volna képes egy adott hangforrás teljes hangszín-spektrumának feltérképezésére...
Az alábbi, a Fourier-sort tudományos szinten magyarázó értekezés PDF-formátumban dr. Pápay Zsolt munkája, a publikáció a szerző írásos engedélyével történt.