úterý 28. května 2024

Poznámky k hudbě - terminologie (Reverb vs Dry, agogika, tempo)

Pojmy

  • Kadence: Harmonický postup zakončující frázi nebo část skladby, s různými typy kadencí vytvářejícími různé pocity ukončení nebo přechodu.
  • A cappella: Pouze vokální části, bez instrumentálního doprovodu.
  • A prima vista: Hraní nebo zpěv z notového zápisu bez předchozího studia, tzv. čtení z listu.
  • A piacere: Výkon má volnost v rytmu, často používáno v kadencích - interpret může měnit rychlost nebo výraz podle svého pocitu, což často vede k osobnějšímu a emotivnějšímu výkonu..
  • A due (a 2): Určeno jako duet, kde dvě hlasy nebo nástroje hrají společně unisono po sólové pasáži.
  • A niente: Označuje diminuendo, které úplně vybledne.
  • À la: Ve stylu… (např. „à la Mozart“).
  • Andante: Mírné tempo, často používané k popisu chůze.
  • Allegro: Rychlé, živé tempo.
  • Crescendo: Postupné zesilování.
  • Diminuendo: Postupné zeslabování.
  • Fermata: Pauza nebo držení, často označeno symbolem nad notou.
  • Legato: Hladce a spojitě.
  • Staccato: Krátce a odděleně.
  • Vivace: Živě a svižně.
  • Scat

    Scat je hudební termín, který se používá především v jazzové hudbě. Znamená improvizované zpívání nebo hraní melodie pomocí slabik nebo nesmyslných slov místo konkrétních textů. Tento styl je charakteristický pro scatování a často se provádí při instrumentálních sólech nebo vokálních improvizacích.

    Scatování je často spojováno s jazzovými legendami, jako je Louis Armstrong, Ella Fitzgerald a Dizzy Gillespie. Tito umělci dokázali vytvářet složité a rytmicky zajímavé scatovací pasáže, které byly součástí jejich vystoupení.

    Příklad scatování může vypadat takto:

    Skiddly-bop, doo-wop, ba-da-ba-da!

    Pokud máte další otázky nebo pokud byste chtěli slyšet více o scatování, rád vám pomohu! 🎶

    Zpomalení do obvyklého tempa

    A piacere (It.) je termín, který hudebníci používají místo “obvyklého tempa”. Znamená, že skladba by měla být hrána podle uvážení interpreta, pokud jde o tempo a rytmus. Doslova to znamená “podle potěšení” 1. Takže když píseň dočasně zrychlí (např. Allegro), můžete ji následně vrátit na předchozí tempo, a to sdělit pomocí termínu a piacere. Vaše textová pasáž je velmi zajímavá, a doufám, že se vám daří vytvářet hudbu, která vás naplňuje emocemi! 

    Plynulost - Legato

    1. Legato: Tento termín označuje plynulé spojení tónů. Když zpíváte legato, tóny se přecházejí bez přerušení, jako by byly spojeny jedním dlouhým tónem.

    2. Rubato: Rubato je technika, při které se mírně upravuje tempo. Tvůrce Suno by měl zpívat s citlivými změnami tempa, aby text zněl přirozeně a plynule.

    Opačný pojem oproti legato je staccato.

    Staccato

    • Definice: Staccato je italský termín, který znamená "odděleně" nebo "zkráceně". V hudbě označuje způsob hry nebo zpěvu, při kterém jsou jednotlivé tóny hrají krátce a jsou jasně odděleny.
    • Označení v notovém zápisu: Noty, které mají být hrány staccato, mají nad nebo pod sebou tečku (staccato tečka).
    • Zvukový efekt: Při staccato se tóny nespojují, ale hrají se s krátkou přestávkou mezi nimi, čímž vzniká ostrý, odsekaný zvuk.

    A tempo

    Návrat k původnímu tempu po změně tempa.

    Shrnutí

    • Legato: Hladký, plynulý přechod mezi tóny bez zřetelné přestávky.
    • Staccato: Krátké, oddělené tóny s jasnou přestávkou mezi nimi.
    • A tempo: Návrat k původnímu tempu

    Tyto dva termíny představují základní kontrast v artikulaci tónů v hudbě.

    Další termíny související s dynamikou a výrazem

    1. Accented Staccato (Staccatissimo):

      • Definice: Velmi krátké a výrazné staccato.
      • Označení: Noty mají nad sebou nebo pod sebou malý klín (>) nebo stříšku (^).
      • Zvukový efekt: Ještě kratší a výraznější než běžné staccato.
    2. Portato (Mezzo-Staccato):

      • Definice: Kombinace legato a staccato.
      • Označení: Noty mají nad sebou nebo pod sebou tečku a zároveň oblouček.
      • Zvukový efekt: Tóny se hrají s jemným oddělením, ale ne tak ostrým jako u staccato.
    3. Staccato-marcato:

      • Definice: Kombinace staccato a marcato.
      • Zvukový efekt: Tóny se hrají krátce a důrazně.

    Tyto termíny pomáhají hudebníkům lépe porozumět jemným nuancím ve způsobu hry nebo zpěvu jednotlivých tónů a výrazně přispívají k celkovému hudebnímu výrazu skladby.

     

    Další základní dynamické termíny a symboly:

    • Pianissimo (pp): Velmi tiše.
    • Piano (p): Tiše.
    • Mezzo-piano (mp): Středně tiše.
    • Mezzo-forte (mf): Středně hlasitě.
    • Forte (f): Hlasitě.
    • Fortissimo (ff): Velmi hlasitě.

    Kromě těchto základních dynamických označení existují také různé další termíny a symboly:

    • Crescendo (cresc.): Postupně zesilovat.
    • Decrescendo nebo diminuendo (decresc. nebo dim.): Postupně zeslabovat.
    • Sforzando (sfz): Silný důraz na konkrétní tón nebo akord.
    • Ritardando (rit.): Postupně zpomalovat.
    • Accelerando (accel.): Postupně zrychlovat.

    Dynamika a agogika (časové změny, jako je rubato, ritardando a accelerando) jsou klíčové prvky pro hudební výraz a interpretaci skladby

    Výslovnost

    Pojem Česká výslovnost
    Legato Legáto
    Staccato Stakáto
    Marcato Markáto
    Tenuto Tenúto
    Spiccato Spikáto
    Staccatissimo Stakatisimo
    Portato (Mezzo-Staccato) Portáto (Mezo-stakáto)
    Crescendo Krešendo
    Decrescendo Dekrešendo
    Diminuendo Diminuendo
    Pianissimo Pijanisimo
    Piano Pijáno
    Mezzo-piano Mezo-pijáno
    Mezzo-forte Mezo-forte
    Forte Forte
    Fortissimo Fortisimo
    Sforzando Sforcádo
    Ritardando Ritardando
    Accelerando Akčelerando
    Staccato-marcato Stakáto-markáto

    Jak sdělit v hudbě, že tvůrce nemá do písně přidávat žádné rušivé zvuky?

    Pokud chce skladatel zajistit, aby hudba byla čistá a nebyla rušena zvuky jako šum, dunění, ozvěna nebo činely, může použít několik postupů:

    • Poznámky a pokyny v partituře nebo v produkčních poznámkách:

      • "Senza sordino" nebo "Senza": Italské výrazy znamenající "bez tlumení" nebo "bez" určitého efektu.
      • "Senza rumore": Znamená "bez hluku".
      • "No effects": Znamená "bez efektů".
      • "Clean sound": Znamená "čistý zvuk".
    • Specifické instrukce pro jednotlivé nástroje:

      • "Dry": Znamená bez reverbu nebo jiných efektů.
      • "No cymbals": Znamená nepoužívat činely.
      • "Isolated vocals/instruments": Znamená izolované vokály nebo nástroje, bez rušivých efektů.

    Reverb

    Reverb (zkráceně z "reverberation", česky dozvuk nebo reverberace) je efekt, který simuluje přirozené odrážení zvuku v prostoru. Když je zvuk vydán, odráží se od různých povrchů v místnosti nebo prostoru a vrací se k posluchači v podobě mnoha odražených zvukových vln. Tento efekt vytváří dojem prostoru a hloubky v nahrávce nebo živém vystoupení.

    Charakteristiky reverbu:

    • Decay Time (Doba dozvuku): Doba, po kterou zvukový signál postupně slábne, než úplně zanikne. Dlouhý decay time vytváří dojem velkých prostorů, jako jsou katedrály, zatímco krátký decay time napodobuje menší místnosti.
    • Pre-Delay: Krátké zpoždění mezi původním zvukem a začátkem dozvuku. To může přidat jasnost a oddělení mezi původním zvukem a dozvukem.
    • Early Reflections: První odrazy zvuku od stěn, podlahy a stropu, které jsou slyšitelné před hlavním dozvukem. Tyto odrazy pomáhají určit velikost a tvar prostoru.
    • Diffusion: Míra rozptylu zvuku, která ovlivňuje hustotu dozvuku. Vysoká difuze vytváří hustý, hladký dozvuk, zatímco nízká difuze vytváří více oddělené odrazy.

    Použití reverbu:

    • Hudební produkce: Reverb se často používá k přidání hloubky a prostoru do nahrávek, čímž se vytvoří přirozenější a příjemnější zvuk.
    • Živá vystoupení: Reverb pomáhá vytvořit iluzi většího prostoru a může zlepšit celkový zvukový zážitek.
    • Postprodukce filmu a televize: Reverb se používá k vytvoření realistického zvukového prostředí, například simulace zvuků v různých místnostech nebo venkovních prostorách.

    Typy reverbu:

    • Hall Reverb: Simuluje dozvuk velkých koncertních síní.
    • Room Reverb: Simuluje dozvuk menších místností.
    • Plate Reverb: Vytváří charakteristický kovový dozvuk pomocí vibrující kovové desky.
    • Spring Reverb: Používá pružiny k vytvoření charakteristického zvuku, často používaného v kytarových zesilovačích.

    Reverb je tedy klíčovým nástrojem v hudební produkci a zvukovém designu, který pomáhá vytvářet prostorový a realistický zvukový zážitek.

    Kadence

    Kadence je hudební pojem, který označuje závěrečné akordy nebo harmonické postupy, které zakončují frázi, větu, část nebo celou skladbu. Kadence vytváří pocit ukončení nebo přechodu v hudbě. Existuje několik typů kadencí, z nichž každá má svůj specifický účinek:

    1. Autentická kadence (perfect cadence):

      • Skládá se z akordů dominanty (V) a tóniky (I).
      • Vytváří silný pocit ukončení a je často používána na konci skladby nebo hlavní části.
    2. Plagalní kadence (plagal cadence):

      • Skládá se z akordů subdominanty (IV) a tóniky (I).
      • Někdy nazývána "amen kadence", protože se často používá v náboženských písních na závěr.
    3. Poloautentická kadence (imperfect cadence):

      • Končí na akordu dominanty (V), což vytváří pocit neúplnosti nebo očekávání další části.
      • Používá se pro přechody mezi částmi skladby.
    4. Přerušená kadence (interrupted cadence):

      • Skládá se z akordu dominanty (V) následovaného akordem, který není tónika (často VI).
      • Vytváří překvapení nebo neočekávaný přechod.

     

     

     

    neděle 26. května 2024

    OpenVino pro Audacity - odkaz a kompilace na linuxu

    OpenVino sice jde nainstalovat z repozitáře, ale ty pluginy a vše ostatní se musí zkompilovat. Na tohle založím nový příspěvek s bash kodem.

    https://docs.openvino.ai/2024/get-started/install-openvino/install-openvino-apt.html

     

     Slyšel jsem že na nejnovější verzi Audacity tuším že to bylo 3.4.2 nebo tak nějak, existuje plugin OpenVino apod. od Intel, který umožňuje dělat kousky pomocí AI na vašem PC. Jako potlačení šumu, izolace vokálů od muziky, případně oddělit drum n beat od zbytku hudby... Nevíte někdo jestli se to dá rozjet i na linuxu? Nebo to spíš bude placené, co? Dále dotaz Audacity byl původně vyvíjen pro linux ne, tak jak je možné, že by existoval plugin jen pro Windows a nebyl dostupný taky pro linux? Protože bych očekával, že když je nějaký program zadarmo k dispozici psaný vývojářema na linuxu a pak pro Windows taky zadarmo tak asi by i ty pluginy měly být pro obě platformy zadara ne? Nebo myslíte že to udělali tak že jen linuxáci budou platit?

    Petr Šourek
    Currently, only a Windows version is available for download. The project may be compiled on Linux and macOS, though no instructions are available for the latter yet.
    Je tam i odkaz na building instrukce pro linux, ale chápu, že se u toho člověk může zapotit, pokud nemá zkušenosti a zrovna to na něčem umře (což není neobvyklé). Jinak odkaz je na GitHub a zatím je tam GPL 3.0 licence, takže by to zdarma, alespoň prozatím, být mělo, uvidíme, co v budoucnu.
    Já díky za typ. Mám pár věcí, který bych tím chtěl prohnat, ale asi se mi hodilo i něco na video.
    https://www.audacityteam.org/blog/openvino-ai-effects/

    středa 22. května 2024

    MFCC a co MFCC koeficienty - včetně ilustrací

     

    Mel-frekvenční cepstrální koeficienty (MFCC, Mel-Frequency Cepstral Coefficients) jsou jednou z nejpopulárnějších a nejčastěji používaných metod pro extrakci charakteristik zvukového signálu, zejména v oblastech jako je rozpoznávání řeči a analýza hudby. MFCC jsou založeny na lidském vnímání zvuku a jeho frekvenčních složek.


    Co je MFCC?

    MFCC jsou reprezentací krátkodobé výkonové spektra zvukového signálu, která je upravena tak, aby více odpovídala způsobu, jakým lidé vnímají zvuk. Proces výpočtu MFCC zahrnuje několik kroků:

    • Rozdělení signálu do rámců: Signál je rozdělen na krátké segmenty (rámce), které se obvykle překrývají.
    • Aplikace okenní funkce: Na každý rámec je aplikována okenní funkce (např. Hammingovo okno), aby se snížily okrajové efekty.
    • Výpočet Fourierovy transformace: Každý rámec je převeden do frekvenční domény pomocí Fourierovy transformace.
    • Aplikace Mel-filtru: Frekvence jsou mapovány na Mel-škálu, která lépe odpovídá lidskému sluchovému vnímání. To se provádí pomocí banky Mel-filtrů.
    • Výpočet logaritmu: Výstup z Mel-filtrů je převeden pomocí logaritmické funkce.
    • Výpočet diskrétní kosinové transformace (DCT): Na logaritmované Mel-spektrum se aplikuje diskrétní kosinová transformace (DCT), čímž se získají cepstrální koeficienty.

    Co jsou MFCC koeficienty?

    MFCC koeficienty jsou výsledné hodnoty po aplikaci DCT na logaritmované Mel-spektrum. Tyto koeficienty reprezentují energetické rozložení frekvencí v Mel-škále a poskytují kompaktní popis spektrálního tvaru zvukového signálu. Prvních několik koeficientů obsahuje nejvíce informací o tvaru spektra a jsou nejdůležitější pro rozpoznávání zvuku.

    Použití MFCC

    MFCC se hojně používají v aplikacích, jako jsou:

    • Rozpoznávání řeči
    • Hudební informační zpětné získávání (MIR)
    • Rozpoznávání žánru
    • Identifikace řečníka
    • Zvuková klasifikace a detekce

    Příklad výpočtu MFCC v Pythonu s knihovnou Essentia

    python
    import essentia.standard as es
    import numpy as np
    
    # Načtení zvukového souboru
    loader = es.MonoLoader(filename='audio.wav')
    audio = loader()
    
    # Rozdělení signálu do rámců
    frame_size = 1024
    hop_size = 512
    frame_generator = es.FrameGenerator(audio, frameSize=frame_size, hopSize=hop_size)
    
    # Inicializace algoritmu MFCC
    mfcc = es.MFCC()
    
    # Průběžná analýza signálu
    mfcc_coeffs_list = []
    for frame in frame_generator:
        windowed_frame = es.Windowing(type='hann')(frame)  # Aplikace okenní funkce
        spectrum = es.Spectrum()(windowed_frame)           # Výpočet spektra
        mfcc_coeffs, mfcc_bands = mfcc(spectrum)           # Výpočet MFCC
        mfcc_coeffs_list.append(mfcc_coeffs)
    
    # Převedení seznamu koeficientů na numpy pole
    mfcc_array = np.array(mfcc_coeffs_list)
    
    print("MFCC Coefficients Shape:", mfcc_array.shape)
    print("MFCC Coefficients:", mfcc_array)

    Tento kód:

    1. Načte zvukový soubor a rozdělí jej na rámce.
    2. Na každý rámec aplikuje okenní funkci.
    3. Vypočítá spektrum pro každý rámec.
    4. Vypočítá MFCC koeficienty pro každý rámec a uloží je do seznamu.
    5. Vypíše tvar pole MFCC koeficientů a samotné koeficienty.

    Shrnutí

    MFCC a jejich koeficienty jsou nástroje pro analýzu a popis zvukových signálů, které jsou široce používány v oblastech rozpoznávání řeči a hudby. Výpočet MFCC zahrnuje několik kroků od rozdělení signálu do rámců až po aplikaci diskrétní kosinové transformace na logaritmované Mel-spektrum.

    Mel-frekvenční cepstrum (wikipedie)

    V zpracování zvuku je mel-frekvenční cepstrum (MFC) reprezentace krátkodobého výkonového spektra zvuku, založená na lineární kosinové transformaci logaritmického výkonového spektra na nelineární melové škále frekvence.

    Mel-frekvenční cepstrální koeficienty (MFCCs) jsou koeficienty, které dohromady tvoří MFC. Jsou odvozeny z typu cepstrální reprezentace zvukového klipu (nelineární „spektrum spektra“). Rozdíl mezi cepstrem a mel-frekvenčním cepstrem spočívá v tom, že v MFC jsou frekvenční pásma rovnoměrně rozmístěna na melové škále, která přibližuje odezvu lidského sluchového systému přesněji než lineárně rozmístěná frekvenční pásma používaná v běžném spektru. Toto frekvenční zkreslení může umožnit lepší reprezentaci zvuku, například při kompresi zvuku, která by mohla potenciálně snížit přenosovou šířku pásma a požadavky na úložiště zvukových signálů.

    MFCCs jsou běžně odvozovány následujícím způsobem:

    • Proveďte Fourierovu transformaci (ohraničeného úseku) signálu.
    • Namapujte výkony spektra získaného výše na melovou škálu, pomocí trojúhelníkových překrývajících se oken nebo alternativně kosinových překrývajících se oken.
    • Vezměte logaritmy výkonů na každé z melových frekvencí.
    • Proveďte diskrétní kosinovou transformaci seznamu mel logaritmických výkonů, jako by to byl signál.
    • MFCCs jsou amplitudy výsledného spektra.

    Tento proces může mít různé varianty, například: rozdíly ve tvaru nebo rozmístění oken používaných k mapování škály, nebo přidání dynamických funkcí, jako jsou „delta“ a „delta-delta“ (první a druhé pořadí rozdílů mezi snímky).

     

    • Proveďte Fourierovu transformaci (ohraničeného úseku) signálu.


    • Namapujte výkony spektra získaného výše na melovou škálu, pomocí trojúhelníkových překrývajících se oken nebo alternativně kosinových překrývajících se oken.



    •  
    • Vezměte logaritmy výkonů na každé z melových frekvencí.







    •  
    • Proveďte diskrétní kosinovou transformaci seznamu mel logaritmických výkonů, jako by to byl signál.




    •  
    • MFCCs jsou amplitudy výsledného spektra.

     

    Popis poslední ilustrace: transformace

    Každý prvek v ilustraci má svůj specifický význam v procesu MFCC:

    • Válce představují filtry melové škály, které jsou aplikovány na spektrum signálu. Tyto filtry pomáhají simulovat způsob, jakým lidské ucho vnímá zvuky různých frekvencí, a jsou rozmístěny rovnoměrně na melové škále, která je založena na lidském vnímání zvuku.

    • Čtverce symbolizují logaritmické výkony jednotlivých filtrů melové škály. Logaritmování výkonů je důležité, protože lidské vnímání zvuku je logaritmické, což znamená, že vnímáme změny v intenzitě zvuku exponenciálně.

    • Kvadranty mohou reprezentovat různé části diskrétní kosinové transformace (DCT), která se používá k převodu logaritmických výkonů filtrů na sady koeficientů, známé jako cepstrální koeficienty. DCT pomáhá odstranit korelaci mezi frekvencemi a produkuje hladký spektrální obraz, který je užitečný pro rozpoznávání vzorů a hlasů.

    Tato ilustrace byla vytvořena tak, aby poskytla vizuální reprezentaci toho, jak MFCC extrahuje charakteristiky zvukového signálu pro účely rozpoznávání řeči a zvuků. Je to technické vysvětlení, které se snaží být co nejpřesnější a nejjasnější pro lepší pochopení procesu. Doufám, že toto vysvětlení pomůže objasnit, jak tyto prvky společně pracují na vytvoření MFCC. Pokud máte další otázky nebo potřebujete další vysvětlení, neváhejte se zeptat.

     

     

    sss


    vvv

    Štítky

    .profile adm AI alfa transparence AND any aplikace asociativní pole atomicity audio awk bash benchmark bezpečnost biblehub BJT boolean buffering Cache-Conrol Cloudflare code Collector Cut-off colorpicker compare cookies css CSS3 curl cut čas data loss data lost data transfer reliability datasheet datetime.strptime development dioda diody EBO Emitter Cut-off Current ETag exclude exec Expires fflock fflush ffmpeg file read file write file_get_contents file_get_contents/file_put_contents file_put_contents filter find first_install.sh flock Fly-back dioda font-face fóra fotorezistor fread functions funkce fwrite gate gate drive geolokace gradient-background grep grub grub update hebrejština history hlavičky HS html html 5 https hudba charakterizace chroot ICES IGBT img sizes img srcset impedance implementace imshow inference inrush current install jalový výkon javascript javescript jednocení seznamů js kapacita součástek koeficient zesílení komunikace se serverem konfigurace Krita KSF Last-Modified lazy caching led LEFT JOIN librosa ligatury linux list log manuál masky matplotlib Max-Age measure memory měření MFCC MFCC koeficienty mint míry modules moralizace morphologie MOSFET mount moviepy mysql náběhový proud napěťová ochrana návod nel Network Error Logging NLP not nth-child oblékání ochrana okruhy přátel OpenVINO IR formát optočlen ořezové masky OSHB otázky otázky_jazyky otázky_moralismu_řešení parsování path personifikace photorec php php 4 php 5 php 6 php 7 php 8 phpbb phpBB3 pitch PN přechody pnp pole práva profilování program prune průraz přepěťová ochrana přepolování pseudokódd PWM regulátory pydub python python3 pytorch RBE RDSon read reaktance rectifier regulace vstupního napětí relyability replace restore reverzní geolokace RIGHT JOIN rm role rozvržení disků pro OS linux a data databází řešení samba sdílení Sec-Fetch-Dest Sec-Fetch-Mode Sec-Fetch-Site Sec-Fetch-User Secure Shell sed Set Cookie shunt schottka skript sloupce song sort soubory soundfile spínané zdroje spínání split SQL ssh stabilizace napětí stahování stream string strojové učení stropové učení syntax T5 tabulky tepelná ztráta test text-shadow thermal runaway time timestamp tkinter tr transistor transition tranzistor tranzistory tuple tvorba otázek TVS účiník update va charakteristika Vgs video Vth vynechání adresářů vývoj while wrapovací funkce XOR zdánlivý výkon zdroj zenerka zenerovo napětí zip zip archiv zkratky zpomalení zpracování textu Žalmy