Designa en webbplats som denna med WordPress.com
Kom igång

Frekvensmodulation

Jag befinner mig på resande fot och har med mig min Yamaha Reface DX eftersom 1) den får precis plats i min resväska, och 2) den är en FM-synth och FM-synthar är koola. Därför tänkte jag ta tillfället i akt att skriva några rader om FM-syntes, och ge en ytterst handviftande idé om matematiken bakom.

Först, några fundamentala grejer: Den i någon mening enklaste av toner kan beskrivas med sinusfunktionen g(t) = sin (ωt), där ω = 2πf. ω står för vinkelfrekvensen och f är frekvensen. Tonen vi hör – dvs om vi uppfattar den som en hög eller låg ton – brukar man säga avgöras av frekvensen – exempelvis motsvarar ett A i mitten på ett piano en frekvens på 440 Hz – men eftersom det enda som skiljer ω och f åt är en konstant på 2π, skippar jag frekvensen och talar bara om ω från och med nu (eller så gör jag ingen skillnad på dem, utan blandar ihop dem hejvilt), eftersom det blir lite enklare i sammanhanget.

En ren sinuston är väldigt tråkig att lyssna på – ni ska snart få höra hur en sådan låter – och därför ska vi nu modifiera vår ursprungliga funktion för att göra allt lite roligare. Betrakta en modifierad g(t):

g(t) = sin (ωct + A sin (ωmt) )

Vad vi har infört är nu två olika vinkelfrekvenser: något vi kallar för bärvågens, ωc, samt modulatorns, ωm. Dessutom har vi en ny parameter som vi kan kalla för modulationsindexet, A. Ser det jobbigt ut? Låt oss visualisera det hela i nedanstående gif, i ett fall där ωm = 0.1ωc – dvs där modulatorns frekvens är markant lägre än bärvågens – och där man sveper A från 0 till 6:

Vad är det som händer här? Vid A = 0 har vi en omodulerad våg och g(t) har bara reducerats till en enkel sinusvåg, sin (t). Men ökar vi A, ser vi att avståndet mellan sinusvågens toppar och dalar kommer att variera med avseende på tiden: Vid vissa tidpunkter kommer det att vara glesare, vid vissa tidpunkter tätare. Detta motsvarar en situation där frekvensen på tonen kommer att vara lägre respektive högre, och vad vi bör höra är en ton som ibland låter lägre och ibland högre. Varsågoda att lyssna!

Hörde ni? Vad vi har skapat är en matematisk funktion som beskriver vad man inom musiken kallar vibrato. Den första halvsekunden börjar med en ren sinuston, vilket ni hör låter rätt så tråkigt, ungefär som de där standardhörseltesterna ni nog fått göra vid några tillfällen i era liv, kanske hos skolsköterskan. Därefter börjar vi successivt att öka A, vilket också ökar ”svängrummet” mellan den lägsta och högsta ton som vi hör; i mitten av ljudklippet håller jag kvar A på sitt maximum ett ögonblick, för att därefter dra ner det till noll vid klippets slut.

Vad vi har gjort är att vi har modulerat vågens frekvens. Detta är en teknik som vissa kanske känner igen: ”Hmm, är det inte detta man gör med radiovågor?” Och, jo, det heter ju FM-radio, och FM står för precis detta – frekvensmodulation. Skillnaden är att i FM-radiotekniken är det radiovågor som man modulerar, och dessa kan vi inte höra (utan att mixtra med dem en del, och det är ju det vi har radioapparater till) eftersom 1) de är elektromagnetiska vågor, dvs inte ljudvågor, och 2) de har en frekvens på hundratals MHz, och örat kan bara uppfatta frekvenser på max 20 kHz. Tekniken bakom FM-radio uppfanns på 1930-talet, men det var inte förrän framåt slutet på 1960-talet som någon systematiskt började undersöka hur frekvensmodulation lät för frekvenser som det mänskliga örat kan uppfatta. Då nära nog snubblade en forskare vid Stanford vid namn John Chowning över tekniken medan han experimenterade med datorgenererade ljud. Chowning fick nämligen ett infall: Han testade att se vad som hände om man snabbade upp vibratot på en datorgenererad sinuston – vad skulle hända om man modifierade ljudets frekvenser med en frekvens lika stor som ljudets egen – eller snabbare? I nedanstående gif har vi en snarlik situation som tidigare, men vi har nu satt ωm = ωc.

Ser ni vad som händer när vi nu ökar A? Istället för att få en rad av sinusvågor som långsamt ändrar frekvens får vi nu en helt annan vågform som inte alls ser ut som en sinuston. För låga värden på A blir vågformen lite skev, men komplexiteten ökar ju högre A är, och undan för undan tycks vi skapa vågformer med högre frekvens än vad vi hade från början. Låt oss lyssna på det också:

Hör ni? Vi uppfattar inte längre ett vibrato, utan ett i princip helt nytt ljud. Vi hör också att ljudet blir allt mer diskant – det innehåller fler övertoner – desto högre A vi har. Vad händer om vi nu ändrar förhållandet mellan bärvågs- och modulationsfrekvensen till, säg, ωm = 2ωc?

Återigen, en komplex vågform, men utseendet är annorlunda än tidigare, och om vi lyssnar på vågformen hör vi en helt annan karaktär på ljudet:

Båda dessa exempel ger oss alltså mer komplexa toner, med olika karaktär. Karaktären avgörs dels av A, dels av förhållandet mellan ωm och ωc. Vi har nu lyssnat på fallen där förhållandet mellan frekvenserna ges av ett heltal, med vad händer om vi väljer något helt annat, säg, ett… irrationellt tal? Låt oss sätta ωm = √2ωc:

Om vi jämför detta resultat med tidigare, så ser vi återigen en komplex vågform med mycket diskanter för höga värden på A, men vågformen tycks inte upprepa sig, i alla fall inte över de 3-4 ursprungsperioder som vi har zoomat in på. Hur låter det då?

Ja, smaken är ju som bekant delad, men jag vågar nog hävda att detta låter betydligt mer antonalt och ”alien” än de tidigare exemplen. Faktum är att FM-syntes i det allmänna fallet oftast låter så här – det är bara i de specialfall där förhållandet mellan bärvågs- och modulationsfrekvens utgörs av enkla heltal, där det blir ljud som man kan göra melodier av.

Vad gjorde Chowning efter sin upptäckt då? Ptja, han publicerade sina första resultat i en artikel (finns att ladda ner som pdf här), där han redogjorde för den grundläggande teorin samt hur man kunde generera ljud som lät mer som trumpeter, flöjter och slagverk. Sedan patenterade Stanford tekniken och lyckades till slut göra en instrumenttillverkare intresserad av den, nämligen japanska Yamaha. Yamaha implementerade FM-syntes i en synth som kom ut på marknaden 1983 – Yamaha DX7 – och vars sound man lite slängigt skulle kunna säga definierade hela 80-talet. Tyvärr sägs det att den var så krånglig att programmera, så musikerna använde sig mest av de ljud som hade förprogrammerats av Yamahas ingenjörer. Muhaha.

Det finns mycket mer att säga om detta, men det får vi spara till en eventuell ytterligare text.

Annons

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com-logga

Du kommenterar med ditt WordPress.com-konto. Logga ut /  Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut /  Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut /  Ändra )

Ansluter till %s

%d bloggare gillar detta: