čtvrtek 11. září 2025

Maskování hlasu v Audacity (robotický hlas, prskání a přebuzení) a formant-preserving morphing

Pozor! Nutno aplikovat na stereo stopu, kde jsou dvě identické stopy

 

Nejprve Modulace hlasu - Efekt: Tremolo 40% per 40 Hz



Potom Modulace hlasu - Efekt: Vocoder - vzdálenost 2, 40 bands + jehly

 


Audacity je na tyhle věci nejpohodlnější.

Kde najdeš efekt Vocoder

  1. Otevři Audacity.

  2. Nahraj nebo otevři zvukový soubor.

  3. Označ část stopy (nebo celou stopu).

  4. V horním menu klikni na:
    Efekty → Vocal Modulation / Distortion → Vocoder
    (v češtině podle překladu: Efekty → Zkreslení hlasu → Vocoder – záleží na jazykové mutaci Audacity).

Pokud používáš novější verzi Audacity (3.x a vyšší), efekty jsou seřazené abecedně v nabídce Efekty. Tam najdeš Vocoder rovnou.


Jak funguje Vocoder

  • Kombinuje tvoji hlasovou stopu s tzv. carrier wave (nosičem, typicky sinusový tón nebo šum).

  • Výsledkem je „robotický“ nebo „anonymizovaný“ hlas, hodně podobný tomu, co se používalo v TV pořadech devadesátých let.

  • Můžeš si nastavit počet pásem (Bands), frekvenci nosiče, úroveň šumu atd. → čím víc pásem, tím srozumitelnější řeč; čím méně, tím „cizejší“.

🔧 Doporučené nastavení Vocoderu v Audacity

📋 Vysvětlení jednotlivých voleb:

  • Vzdálenost → určuje, jak moc bude hlas „rozmazán“ (něco jako časový krok).

  • Počet pásem → kolik frekvenčních pásem se použije pro modulaci (víc pásem = čitelnější, míň pásem = anonymnější a robotické).

  • Rozkmit původního zvuku v procentech → kolik procent původní stopy má zůstat slyšet (dej to hodně nízko, třeba 10–20 %, aby se hlas ztratil).

  • Rozkmit bílého šumu v procentech → kolik bude přimícháno bílého šumu (vyšší hodnota = větší anonymizace).

  • Rozkmit jehel radaru v procentech → přidává zvláštní syntetický „pípavý“ podklad, obvykle se nepoužívá, pokud nechceš sci-fi efekt.

  • Kmitočet jehel radaru v Hz → určuje, jak rychle budou ty „jehly“ pulzovat.


🔧 Doporučené nastavení pro anonymizaci hlasu (styl „TV pořad 90. let“)

  • Vzdálenost: 30–40

  • Počet pásem: 20–25

  • Rozkmit původního zvuku: 10–20 %

  • Rozkmit bílého šumu: 70–80 %

  • Rozkmit jehel radaru: 0 % (nech vypnuté, pokud nechceš sci-fi efekt)

  • Kmitočet jehel radaru: libovolné, ale při 0 % stejně nemá vliv


🎧 Tip na vylepšení

Pokud chceš ještě lepší „anonymizační“ efekt:

  1. Nejprve použij Efekt → Změna výšky tónu a sniž hlas o 3–5 půltónů.

  2. Pak aplikuj Vocoder s výše uvedenými parametry.

To dá velmi podobný výsledek, jaký se používal v pořadech typu Tabu.

* * *

Požadujou stopu sterea, jak mám v novém souboru přidat stopu R?

efekt Vocoder v Audacity opravdu vyžaduje stereo stopu (jedna stopa je „modulátor“ = hlas, druhá je „carrier“ = šum nebo jiný signál). Pokud máš jen mono nahrávku, musíš přidat druhý kanál.


🛠 Postup, jak přidat druhou stopu (pravý kanál)

  1. V menu nahoře klikni:
    Stopy → Přidat novou → Stereofonní stopa
    (nebo Stopy → Přidat novou → Mono stopa, pokud chceš pracovat jen s pravým kanálem a pak to převést).

  2. Do té nové stopy vlož bílý šum:

    • Generovat → Šum… → Typ: Bílý

    • nastav délku šumu stejně dlouhou jako tvoje nahrávka hlasu.

  3. Teď máš dvě stopy: hlas (modulátor) a šum (carrier).

  4. Vyber obě stopy současně (myší nebo Ctrl+A na timeline).

  5. Aplikuj efekt Vocoder → teď už by neměl hlásit chybu o stereo.


🎧 Tip

Pokud máš původní hlasovou nahrávku už jako stereo, ale se stejným signálem v L/R, tak:

  • Rozděl stereo stopu na mono:
    Stopy → Rozdělit stereo na mono

  • Do jedné stopy necháš hlas, do druhé vložíš šum.

 Jak mám vybral levý kanál?

🔹 Jak vybrat levý kanál stereo stopy

  1. Najdi vlevo panel u stopy (s názvem, tlačítky Mute/Solo, posuvníky).

  2. Klikni na malý šipečkový rozbalovací menu (u názvu stopy).

  3. V nabídce vyber:
    Rozdělit stereo stopu na mono.

Tím se jedna stereo stopa rozdělí na dvě samostatné mono stopy:

  • Horní = levý kanál (L)

  • Dolní = pravý kanál (R)

  1. Teď už můžeš kliknout přímo do levé stopy → tím ji označíš a pracuješ jen s ní.


🎧 Tipy navíc

  • Pokud chceš pouze levý kanál a pravý nepotřebuješ → pravou stopu můžeš hned zavřít kliknutím na X vlevo.

  • Pokud chceš oba kanály znovu spojit → použij Stopy → Udělat stereo stopu.

Jak vypnout přehrávání zvuku jedné stopy? Mám ji už vybranou

V Audacity můžeš dočasně ztlumit přehrávání jedné stopy bez smazání nebo změny zvuku:


1️⃣ Použití tlačítka Mute

  • Na levé straně stopy (v panelu s názvem stopy) je tlačítko Mute.

  • Kliknutím na Mute se tato stopa během přehrávání neuslyší.

  • Stopa zůstává ve projektu, jen se přestane přehrávat.


2️⃣ Použití posuvníku Gain

  • Vedle tlačítka Mute je Gain posuvník.

  • Posunutím úplně doleva stoupí hlasitost na –∞ dB, což efektivně stopu ztlumí.

  • Výhodou je, že můžeš hlasitost kdykoliv plynule upravit, místo úplného ztlumení.

 * * *

 

Mám tam ten zvuk zkopírovaný do obou stop co dál?

hlas ve dvou stopách (L i R) a chceš z toho udělat stereo vhodné pro Vocoder. Tady je krok za krokem postup, jak připravit správně modulátor + carrier:


1️⃣ Připravit modulátor a carrier

  • Modulátor (hlas): vyber levou stopu (L) – to bude hlas, který se má anonymizovat.

  • Carrier (nosič): pravou stopu přepiš šumem (nebo jiným nosičem):

    1. Klikni na pravou stopu, aby byla aktivní.

    2. Generovat → Šum → Typ: Bílý, Amplituda: kolem 0,5, Délka: stejná jako hlasová stopa.

Teď máš:

  • L = hlas (modulátor)

  • R = bílý šum (carrier)


2️⃣ Vybrat obě stopy

  • Klikni do časové osy a označ obě stopy (nebo Ctrl+A v oblasti stop).


3️⃣ Aplikovat Vocoder

  • Menu: Efekty → Vocoder

  • Nastavení podle předchozího doporučení:

    • Počet pásem: 20–25

    • Rozkmit původního zvuku: 10–20 %

    • Rozkmit bílého šumu: 70–80 %

    • Rozkmit jehel radaru: 0 %


4️⃣ Export hotového zvuku

  • Po aplikaci efektu můžeš zkontrolovat, zda výsledek zní anonymně.

  • Export: Soubor → Exportovat → WAV nebo MP3.


🎯 Tip: Pokud chceš, aby hlas zněl ještě „temněji“ a roboticky, před Vocoderem použij Efekt → Změna výšky tónu (Pitch Shift) a snížíš hlas o 3–5 půltónů.


Chceš, abych ti teď připravil ukázkový postup v Audacity přesně krok za krokem od importu nahrávky po export, tak aby šel rovnou použít?

Jak zesílit stopu?

1️⃣ Použití efektu Amplify (Zesílit)

  1. Vyber stopu, kterou chceš zesílit (klikni do její časové osy).

  2. Menu: Efekty → Zesílit… (Amplify)

  3. V okně nastav „Amplification (dB)“ – kladná hodnota = zesílení, záporná = snížení hlasitosti.

  4. Klikni OK – stopa se upraví.

Tip: Pokud je zaškrtnuté „Allow clipping“ (povolit přebuzení), může dojít k deformaci zvuku. Lepší je nezaškrtávat a použít rozumné zesílení.


2️⃣ Použití Gain posuvníku

  1. Na levé straně stopy je posuvník označený Gain.

  2. Posuň doprava → zesílíš stopu, doleva → zeslabíš.

  3. Toto je rychlejší, ale méně přesné než Amplify.


3️⃣ Normalizace (pro rovnoměrné zesílení celé stopy)

  • Efekty → Normalizovat…

  • Hodí se, když chceš, aby celá stopa byla na maximální možné úrovni bez přebuzení.


🎯 Tip: Pokud zesiluješ stopu, která půjde do Vocoderu, je lepší nejprve ji zesílit a pak aplikovat efekt. To zvýší účinnost „maskování“ hlasu.

* * *

Smíchání přirozeného hlasu s hlasem, kde byl aplikovaný effekt tremolo + vocer:

Když mám jednu stopu upravenou tím vocerem a druhou normální, ale ta první není moc srozumitelná je to jako poslouchat trubkou co někdo říká za zdá, tak dá se to nějak smíchat, aby hlas byl srozumitelnější, ale aby tam nebyl ten úplně originální hlas, který je dobře srozumitelný? Prostě vytvořit něco mezi dvěma stopama? Chci speciální efekt, který porovná dva signály a vytvoří něco mezi. Takový Vocoder2... Hledám něco inteligentnějšího než běžný mix, něco, co porovná dva signály (originální + Vocoder) a vytvoří hybridní stopu, která má zachovanou srozumitelnost, ale není originální.

To co popisuju, není klasický Vocoder, ani obyčejný mix – je to spíše formant-preserving morphing nebo signal morphing.

RE:

🔹 Princip

  1. Analyzuje spektrum obou signálů (frequencí a formantů).

  2. Interpoluje mezi nimi – bere charakter Vocoderu, ale část spektrální struktury originálního hlasu pro srozumitelnost.

  3. Výsledkem je „mezi-verze“ hlasu – anonymní, ale stále dobře čitelná.


🔹 Software / pluginy, které to umí

  • Zynaptiq Zynaptiq Zynaptiq Morph / Zynaptiq Morph Bundle – komerční, high-end, podporuje Linux přes Wine/VM.

  • MeldaProduction MTransformer – plugin VST, umí morphing mezi dvěma zvuky (Linux přes Carla/DAW).

  • Spektrální morphing přes Pure Data nebo SuperCollider – open-source, plně konfigurovatelné.

  • Python + librosa / pyo – skriptově analyzuje dva zvuky a interpoluje frekvenční spektrum.


🔹 Poznámka

  • Audacity nenabízí „Vocoder2“ nebo spektrální morphing přímo.

  • Nejblíž, co v Audacity jde, je mix + EQ + kompresor + jemné doladění formantů, ale není to čistý morphing.

Takže mám soubor se stereo stopou; v jedné ten vocoderový modifikovaný hlas, a v druhé je původní hlas. Dej mi ten skript pro Python + librosa / pyo – skriptově analyzuje dva zvuky a interpoluje frekvenční spektrum.

Zbytek se dělá skriptem.

Ten skript funguje, jen ten původní soubor má tu druhou stopu více hlasitě, tak to asi musím zeslabit, aby nový hybridní hlas nebyl tak jasně slyšet. 

Je to klasický mix problém – když je druhý kanál (originál) výrazně hlasitější než modifikovaný (vocoder), interpolace se „přitáhne“ k hlasitějšímu kanálu a hybridní efekt je utopený.

Možnost je zesílit/zeslabit kanály tak, aby měly přibližně stejnou RMS nebo max amplitudu:

# RMS normalizace (python)
rms_l = np.sqrt(np.mean(left**2))
rms_r = np.sqrt(np.mean(right**2))

left  = left  / rms_l * 0.8   # uprav 0.8 podle potřeby
right = right / rms_r * 0.8


    Tím se vyrovná hlasitost a interpolace nebude „utopená“.

(Na mono stopu) PROBLÉM S VENKOVNÍM PROSTOREM A SLABOU HLASITOSTÍ ZVUKU

Maskování hlasu v uzavřené místnosti se povedlo s efektem 1. tremolo: počátek 0 stup. , ostrá úroveň 40 procent. Následně vocoder: vzdálenost 2, počet pásem 40, rozkmit původního 100%, rozkmit bílého šumu 10%, rozkmit jehel radaru 90%, kmitočet jehel 43,40 Hz. Následně jsem provedl mix s původním hlasem. Výsledkem byl efekt mírně robotického hlasu s občasným přebuzením. Nicméně v otevřeném prostoru venku je nižší hlasitost a zvýšený výskyt okolních zvuků a tyto stejné parametry voceru nejsou znát, není dosaženo stejného výsledku ačkoliv když mluvím sám sebe slyším docela dobře, ale ne tak hlasitě jako na nahrávce pořizované doma.

Tremolo

  • Počátek (Phase):

  • Hloubka (Depth / Ostrá úroveň): 40 % (můžeš zkusit zvýšit na 50–60 %, aby efekt víc „prokousal“ i přes šum)

  • Frekvence (Rate): nech kolem 4–6 Hz – to dává přirozený „chvějící“ efekt hlasu.

👉 venku můžeš lehce zvýšit hloubku, aby byl efekt slyšitelnější i při nižší hlasitosti hlasu.


Vocoder (můj základ)

  • Vzdálenost (Spacing): 2

  • Počet pásem: 40 (doporučuji venku zvýšit na 60–80, aby zachytil víc detailů řeči)

  • Rozkmit původního zvuku: 100 % (venku zkus snížit na 70–90 %, aby originál nebyl tak dominantní)

  • Rozkmit bílého šumu: 10 % (venku zvýš na 20–30 %, bílý šum pomáhá zakrýt šum prostředí a zvýrazní maskovací efekt)

  • Rozkmit jehel radaru: 90 % (pokud slyšíš přebuzení, zkus snížit na 60–70 %)

  • Kmitočet jehel radaru: 43,4 Hz (to je OK, můžeš mírně experimentovat kolem 40–50 Hz)


Mix s originálem

  • Doma: 70 % vocoder + 30 % originál

  • Venku: raději 80–85 % vocoder + 15–20 % originál, protože originál je rušený šumem a přehluší efekt.


👉 Kombinace silnější tremolo (50–60 %) + více pásem ve vocoderu + více bílého šumu a menší podíl originálu ti dá slyšitelnější robotický/zkreslený hlas i venku.

 * * *

Na tremolo beru hloubku 40, vocoder počet pásem 40 (80 je příliš silně robotický).

(Na mono stopu) Ted používám staré nastavení a je to příliš silné. To nedává smysl. je rozdíl v tom jestli ten vocoder aplikuju na stereo stopu nebo mono i když ve stereu jsou dvě stopy se stejným signálem?

* * *

Audacity Vocoder není psaný „kanálově“ úplně čistě:

  • některé jeho režimy (hlavně když je vstup stereo) používají levý kanál jako modulátor a pravý jako nositele;

  • pokud oba kanály obsahují totéž, výsledkem je „silnější“ nebo přebuzený efekt, protože signál se vlastně násobí sám sebou místo aby byl jen jeden vstup;

  • proto slyšíš rozdíl, i když stopy jsou identické.


Shrnutí

  • Mono stopa: vocoder → výsledek „normální“ síly.

  • Stereo stopa (oba kanály stejné): vocoder používá jeden kanál jako modulátor a druhý jako nositele → efekt je silnější, zkreslenější, někdy až přebuzený.


👉 Pokud chceš konzistentní výsledek a nemít to přebuzené:

  • pracuj jen v monu → aplikuj tremolo + vocoder,

  • a až nakonec si výsledek duplikuj do sterea (pro stereo export).

Žádné komentáře:

Okomentovat

Maskování hlasu v Audacity (robotický hlas, prskání a přebuzení) a formant-preserving morphing

Pozor! Nutno aplikovat na stereo stopu, kde jsou dvě identické stopy   Nejprve Modulace hlasu - Efekt: Tremolo 40% per 40 Hz Potom Modulace...

Štítky

.profile adm administrace Adobe Aho-Corasick AI akcelerace alfa transparence analýza AND any aplikace apt ar archiv asociativní pole atomicity audacity audio autentifikace awk balíčkovací systém bash beacon beacon_hint benchmark Bézierovy křivky bezpečnost biblehub BJT blogger boolean brainstorming BRE buffer buffering bufferované čtení Cache-Conrol Cloudflare code Collector Cut-off ColorManager colorpicker common compare config cookies CPU CPU pipe crop css CSS3 curl current code cut čas data loss data lost data transfer reliability datasheet datetime.strptime deb deb-systemd-helper debian debián depricated development dict dioda diody disonance dpkg dpkg -S dpkg-deb drivers EBO efekt Emitter Cut-off Current eps ETag exclude exec Expires extrakce jediného extrakce názvu balíčku souboru extrakce obrázků extrakce souboru .deb fflock fflush ffmpeg FIFO file read file write file_get_contents file_get_contents/file_put_contents file_put_contents filter find first_install.sh flock Fly-back dioda font-face fóra formant-preserving morphing fotorezistor fread functions funkce fwrite gate gate drive GDVfs gedit gedit-common geolokace getdata Ghostscript GIO glib gnome gnome settings GNU Privacy Guard gnupg gpg gradient-background grafika grep grep -v groupadd grub grub update gs gsettings gtk gtk.css gtk+ hebrejština history hlavičky HS html html 5 https hudba hunspell charakterizace chatGPT chroot chyba ICES IGBT Image img sizes img srcset impedance implementace imshow inference inkscape inrush current install jalový výkon javascript javescript jednocení seznamů js jsonData kapacita součástek koeficient zesílení komponenty xFce komunikace se serverem koncept konfigurace kontejner korekce barev Krita KSF kvantifikátor Last-Modified lazy caching led LEFT JOIN librosa ligatury light-locker lightdm linux list log maják manuál map mapování maskování maskování hlasu maskování služby masky matplotlib Max-Age measure memory měření meta MFCC MFCC koeficienty mint Mint 21.3 Mint xFce míry modules moralizace morphologie MOSFET mount moviepy mysql náběhový proud napěťová ochrana nastavení šablony návod nel Network Error Logging NLP normalizace šedi po resize not Notifications NTFS nth-child oblasti oblékání ochrana okruhy přátel OpenVINO IR formát oprava oprava balíčku optočlen org.gnome.desktop.screensaver org.gnome.nm-applet ořezové masky OSHB otázky otázky_jazyky otázky_moralismu_řešení overlay ovladače panely parsování path pdf personifikace photorec php php 4 php 5 php 6 php 7 php 8 phpbb phpBB3 PipeWire pitch plus PN přechody pnp pole Policykit postscript práva profilování program prune průraz přeinstalování přepěťová ochrana přepolování příkazy připojení k síti připojení k wifi pseudokódd pstoedit PulseAudio PWM regulátory pydub python python3 pytorch ramdisk RBE RDSon read reaktance rectifier regex regulace vstupního napětí reinstall relyability remount replace restore reverzní geolokace RIGHT JOIN rm robotický hlas role rozvržení disků pro OS linux a data databází řešení samba scan scroll sdílení sdílení souborů Sec-Fetch-Dest Sec-Fetch-Mode Sec-Fetch-Site Sec-Fetch-User Secure Shell sed Set Cookie show-manual-login show-remote-login shunt schemas schémata schottka signal morphing skript skupiny sledovanost sloupce slučování seznamů služby small song sort soubory soundfile spínané zdroje spínání splines split spojování správa diskových zařízení SQL ssh stabilizace napětí stahování stíny stream string strojové učení stropové učení supplicant svg syntax systemctl systemd-logind T5 tabulka tabulky Tangentové úsečky tar témata tepelná ztráta terminologie test text-shadow themes thermal runaway time timestamp tkinter tr transformace transistor transition transpose tranzistor tranzistory tuple tvorba otázek TVS ubuntu účiník udiskd udisks unconfined underrun unity-greeter update usermod uživatelé va charakteristika vala vektorová grafika Vgs video vocoder Vth výkon vynechání adresářů vývoj while wpa wpa_supplicant wrapovací funkce x xandr xapp-watt xargs -I xed xed-common xfdesktop xml xmp XOR Xorg Xorg Thumbnails xrandr závislosti zdánlivý výkon zdroj zenerka zenerovo napětí zip zip archiv zkratky zpomalení zpracování textu zrychlení zvuk Žalmy