středa 21. ledna 2026

Python: Mapování polských souborů pomocí českého překladu, vytvoření playlistu pro nalezený soubor

- Mapování polských souborů pomocí mapy s českým překladem.

- fuzzywuzzy najde v českém překladu podobný název.

- Následně se vybere správný soubor s polským názvem.

- Podle toho se vytvoří playlist .m3u s tímto videem a jeho zpomalenou verzí

- Tento playlist se otevře ve vlc a přehrává se první video.

 

#!/usr/bin/env python3
import os
import subprocess
import sys
from fuzzywuzzy import process, fuzz  # Potřebuješ nainstalovat fuzzywuzzy: pip install fuzzywuzzy python-Levenshtein

# Mapování českých názvů na polské názvy souborů (bez 'Tatiana Stachak - ' a '.mkv')
# Přeložené české názvy na základě polských originálů
mapping = {
    "Pohádka jiskřičky": "Bajka iskierki (Sparkle\\'s tale - Das Märchen des Funkens)",
    "Byla jednou malá žabička": "Była sobie żabka mała",
    "Byl jednou král": "Był sobie król (There once was a king  -  Es war einmal ein König)",
    "Černý beran": "Czarny baran (A black ram - Schwarzes Schaf)",
    "Jedou, jedou děti cestou": "Jadą, jadą dzieci drogą",
    "Jede vlak": "Jedzie pociąg (Train is coming - Aus der Ferne kommt ein Zug)",
    "Kukačka": "Kukułka (Cuckoo - Der Kuckuck)",
    "Tři kuřátka": "Kurki trzy (Twinkle, twinkle little star - Blinde, blinke kleiner Sterm)",
    "My jsme trpaslíci": "Mujesteśmy krasnoludki (We arę little dwarfs - Wir sind kleine Zwerge)",
    "Na mostě v Avignonu": "Na moście w Avignon (Sur le pont d\\'Avignon)",
    "Padá sníh": "Pada śnieg  (Jingle bells)",
    "Pane Janie": "Panie Janie (Frère Jacques)",
    "Sedí si zajíc": "Siedzi sobie zając (There\\'s a Hare - Sitzender Hase)",
    "Šedý mráček": "Siwa chmurka (A grey cloud - Graues Wölkchen)",
    "Starý Donald": "Stary Donald (Old MacDonald)",
    "Starý medvěd tvrdě spí": "Stary niedźwiedź mocno śpi",
    "Zlá zima": "Zła zima  (Bad winter - Böser Winter)"
}

def find_polish_name(czech_input):
    # Použijeme fuzzy matching pro nalezení nejlepší shody (na část nebo celý název)
    czech_names = list(mapping.keys())
    best_match, score = process.extractOne(czech_input, czech_names, scorer=fuzz.partial_ratio)
    if score >= 70:  # Minimální skóre pro shodu, můžeš upravit
        return mapping[best_match]
    else:
        print(f"Žádná shoda pro '{czech_input}' nalezena.")
        sys.exit(1)

def create_m3u_playlist(polish_name, directory):
    # Předpokládáme, že soubory jsou v aktuálním adresáři nebo specifikovaném
    original_file = f"Tatiana Stachak - {polish_name}.mkv"
    slowed_file = os.path.join("4", f"Tatiana Stachak - {polish_name}.mkv")
    
    if not os.path.exists(original_file):
        print(f"Originální soubor '{original_file}' neexistuje.")
        sys.exit(1)
    if not os.path.exists(slowed_file):
        print(f"Zpomalený soubor '{slowed_file}' neexistuje.")
        sys.exit(1)
    
    playlist_name = "temp_playlist.m3u"
    with open(playlist_name, 'w', encoding='utf-8') as f:
        f.write("#EXTM3U\n")
        f.write(f"#EXTINF:-1,Originál\n{os.path.abspath(original_file)}\n")
        f.write(f"#EXTINF:-1,Zpomalená verze\n{os.path.abspath(slowed_file)}\n")
    
    return playlist_name

def open_in_vlc(playlist):
    try:
        subprocess.call(['vlc', playlist])
    except FileNotFoundError:
        print("VLC není nainstalováno nebo není v PATH.")
    finally:
        # Smazat dočasný playlist po otevření (volitelně)
        os.remove(playlist)

if __name__ == "__main__":
    if len(sys.argv) < 2:
        print("Použití: python script.py 'český název nebo část'")
        sys.exit(1)
    
    czech_input = ' '.join(sys.argv[1:])
    polish_name = find_polish_name(czech_input)
    playlist = create_m3u_playlist(polish_name, os.getcwd())
    open_in_vlc(playlist)

Jak funguje FuzzyWuzzy?

from fuzzywuzzy import fuzz, process

mapping = {
    "My jsme trpaslíci": "Mujesteśmy krasnoludki",
    "Jede vlak": "Jedzie pociąg",
}

vstup = "trpaslíci"
nejlepsi, skore = process.extractOne(vstup, mapping.keys(), scorer=fuzz.partial_ratio)
print(f"Nalezeno: {nejlepsi} (skóre {skore})")
print(f"Polský soubor: {mapping[nejlepsi]}")
 

Má vrátit podobný výstup:

Nalezeno: My jsme trpaslíci (skóre 86)
Polský soubor: Mujesteśmy krasnoludki

Popis skriptu

Aktuální verze s fuzzywuzzy a scorer=fuzz.partial_ratio najde výsledek i při zadání jen části názvu, například: 
  • script.py Jedou
  • script.py jedou
  • script.py děti
  • script.py vlak
  • script.py král
  • script.py zajíc
  • script.py sníh
  • script.py donald
všechny by měly fungovat (většinou s vysokým skóre shody 80–100 %).Proč to funguje dobře i s krátkými/částečnými vstupyPoužíváme fuzz.partial_ratio, což hledá nejlepší shodu kdekoliv v řetězci.
Příklady reálného chování (testováno na podobných datech):
 
Zadáno
Pravděpodobně najde
Skóre (přibližně)
Jedou
Jedou, jedou děti cestou
100 %
jede
Jede vlak
100 %
děti
Jedou, jedou děti cestou
100 %
vlak
Jede vlak
100 %
král
Byl jednou král
100 %
zajíc
Sedí si zajíc
100 %
sníh
Padá sníh
100 %
donald
Starý Donald
100 %
kuka
Kukačka
~86–100 %
medvěd
Starý medvěd tvrdě spí
77–100 %
zima
Zlá zima
100 %
Kdyby to občas selhalo (velmi krátké nebo nejednoznačné slovo)Můžeš snížit práh shody z 70 na např. 60: 
python
if score >= 60:   # ← změň z 70 na 60 nebo i 50
    return mapping[best_match]
Nebo ještě lepší varianta (doporučuji):
python
def find_polish_name(czech_input):
    czech_input = czech_input.lower().strip()
    czech_names = list(mapping.keys())
    
    # Nejprve zkusíme přesnou podřetězcovou shodu (case-insensitive)
    for name in czech_names:
        if czech_input in name.lower():
            return mapping[name]
    
    # Pokud nic nenajde → fuzzy
    best_match, score = process.extractOne(czech_input, czech_names, scorer=fuzz.partial_ratio)
    if score >= 65:
        return mapping[best_match]
    
    print(f"Nenašel jsem shodu pro: '{czech_input}' (nejlepší byl '{best_match}' se skóre {score})")
    sys.exit(1)
Tento přístup je ještě o něco tolerantnější a rychlejší u běžných zadání.Takže ano – python script.py Jedou by mělo spolehlivě otevřít „Jadą, jadą dzieci drogą“ (originál + zpomalená verze). Pokud bys chtěl ještě vylepšit robustnost, napiš a můžeme to doladit.

Python: Mapování polských souborů pomocí českého překladu, vytvoření playlistu pro nalezený soubor

- Mapování polských souborů pomocí mapy s českým překladem. - fuzzywuzzy najde v českém překladu podobný název. - Následně se vybere správný...

Štítky

.profile adm administrace Adobe Aho-Corasick AI akcelerace alfa transparence analýza AND any aplikace apt ar archiv asociativní pole atomicity audacity audio audio redirect autentifikace awk balíčkovací systém bash beacon beacon_hint benchmark Bézierovy křivky bezpečnost biblehub BJT blogger boolean Braessův paradox brainstorming BRE buffer buffering bufferované čtení Cache-Conrol Cloudflare code Collector Cut-off ColorManager colorpicker common compare config cookies CPU CPU pipe crop css CSS3 curl current code cut čas data loss data lost data transfer reliability datasheet datetime.strptime deb deb-systemd-helper debian debián depricated development dict dioda diody disonance doprava dpkg dpkg -S dpkg-deb drivers EBO efekt Emitter Cut-off Current eps ETag evtest exclude exec Expires extrakce jediného extrakce názvu balíčku souboru extrakce obrázků extrakce souboru .deb fflock fflush ffmpeg FIFO file read file write file_get_contents file_get_contents/file_put_contents file_put_contents filter find first_install.sh flock Fly-back dioda font-face fonty fóra formant-preserving morphing fotorezistor fread functions funkce FuzzyWuzzy fwrite gate gate drive GDVfs gedit gedit-common geolokace getdata Ghostscript GIO glib gnome gnome settings GNU Privacy Guard gnupg gpg gradient-background grafika grep grep -v groupadd grub grub update gs gsettings gtk gtk.css gtk+ hebrejština history hlavičky HS html html 5 https hudba hunspell charakterizace chatGPT chroot chyba ICES IGBT Image img sizes img srcset impedance implementace imshow inference inkscape inrush current install IQ jalový výkon javascript javescript jednocení seznamů js jsonData kapacita součástek klávesnice koeficient zesílení komponenty xFce komunikace se serverem koncept konfigurace kontejner korekce barev Krita KSF kvantifikátor Last-Modified lazy caching led LEFT JOIN librosa ligatury light-locker lightdm linux list log m3u maják manuál map mapování maskování maskování hlasu maskování služby masky matplotlib Max-Age measure memory měření meta MFCC MFCC koeficienty mint Mint 21.3 Mint xFce míry modules moralizace morphologie MOSFET mount moviepy multimedia mysql náběhový proud napěťová ochrana nastavení šablony návod nel Network Error Logging NLP normalizace šedi po resize not Notifications NTFS nth-child oblasti oblékání ochrana okruhy přátel OpenVINO IR formát oprava oprava balíčku optočlen org.gnome.desktop.screensaver org.gnome.nm-applet ořezové masky OSHB otázky otázky_jazyky otázky_moralismu_řešení overlay ovladače panely parsování path pdf personifikace photorec php php 4 php 5 php 6 php 7 php 8 phpbb phpBB3 PipeWire pitch plus PN přechody pnp pole Policykit postscript práva profilování program prune průraz přeinstalování překlad přepěťová ochrana přepolování příkazy připojení k síti připojení k wifi pseudokódd pstoedit pulse PulseAudio PWM regulátory pydub python python3 pytorch ramdisk RBE RDSon read reaktance rectifier regex regulace vstupního napětí reinstall relyability remount replace restore reverzní geolokace RIGHT JOIN rm robotický hlas role rozvržení disků pro OS linux a data databází řešení samba scan scroll sdílení sdílení souborů Sec-Fetch-Dest Sec-Fetch-Mode Sec-Fetch-Site Sec-Fetch-User Secure Shell sed Set Cookie show-manual-login show-remote-login shunt schemas schémata schottka signal morphing sink skript skupiny sledovanost sloupce slučování seznamů služby small song sort soubory soundfile spínané zdroje spínání splines split spojování správa diskových zařízení SQL ssh stabilizace napětí stahování stíny stream stream redirect string strojové učení stropové učení subprocess.call supplicant svg syntax systemctl systemd-logind T5 tabulka tabulky Tangentové úsečky tar témata tepelná ztráta terminologie test text-shadow themes thermal runaway time timestamp tkinter tr transformace transistor transition transpose tranzistor tranzistory ttf tuple tvorba otázek TVS typografie ubuntu účiník udiskd udisks unconfined underrun unity-greeter update usermod uživatelé va charakteristika vala věda vektorová grafika Vgs video virtual devices vocoder Vth vyhledávání vyhledávání soborů výkon vynechání adresářů vytvoření playlistu vývoj while wpa wpa_supplicant wrapovací funkce x xandr xapp-watt xargs -I xed xed-common xfdesktop xml xmp XOR Xorg Xorg Thumbnails xrandr závislosti zdánlivý výkon zdroj zenerka zenerovo napětí zip zip archiv zkratky zpomalení zpracování textu zrychlení zvuk Žalmy