pátek 30. května 2025

Kód pro opravu barev na nascanovaném dokumentu

Kód má mírně stáhnout modrou barvu (což není přesně co jsem chtěl - na původním obrázku se trochu odráží modré LED světlo, tak jsem to chtěl stáhnout). Nicméně to by bylo třeba vybrat jen ty pixely kde je ta modrá barva a neaplikovat to na celý dokument. Nastavení kontrastu je pro dokument, který má nízký kontrast.

 

from PIL import Image, ImageEnhance
import os
import glob

# Funkce pro úpravu obrázku
def adjust_image(image_path, output_path):
    # Otevření obrázku
    img = Image.open(image_path).convert("RGB")
    
    # 1. Odstranění modrého nádechu (snížení modrého kanálu)
    r, g, b = img.split()
    # Snížíme intenzitu modrého kanálu (např. o 20 %)
    b = b.point(lambda x: int(x * 0.8))
    img = Image.merge("RGB", (r, g, b))
    
    # 2. Zesvětlení pozadí a zvýšení kontrastu pro tmavší text
    # Převod na šedotón (pro OCR je lepší černobílé zobrazení)
    img = img.convert("L")
    
    # Úprava jasu (zesvětlení středních tónů)
    enhancer = ImageEnhance.Brightness(img)
    img = enhancer.enhance(1.2)  # Mírné zesvětlení (1.2 je jemná úprava)

    # Úprava kontrastu
    enhancer = ImageEnhance.Contrast(img)
    img = enhancer.enhance(2.0)  # Zvýšíme kontrast (hodnota 2.0 je dobrý základ)
    
    # Úprava jasu (zesvětlení středních tónů)
    enhancer = ImageEnhance.Brightness(img)
    img = enhancer.enhance(1.4)  # Mírné zesvětlení (1.2 je jemná úprava)
    
    # Uložení upraveného obrázku
    img.save(output_path, "JPEG")
    print(f"Upravený obrázek uložen jako: {output_path}")

# Hlavní funkce pro zpracování všech obrázků v adresáři
def process_images(input_folder, output_folder):
    # Vytvoření výstupní složky, pokud neexistuje
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)
    
    # Najdeme všechny JPG soubory v input složce
    image_files = glob.glob(os.path.join(input_folder, "*.jpg"))
    
    # Zpracujeme každý obrázek
    for image_path in image_files:
        # Vytvoříme název výstupního souboru
        filename = os.path.basename(image_path)
        output_path = os.path.join(output_folder, f"adjusted_{filename}")
        
        # Upravíme obrázek
        adjust_image(image_path, output_path)

# Spuštění skriptu
if __name__ == "__main__":
    # Nastavte cestu k adresáři s vyextrahovanými obrázky a výstupní složku
    input_folder = "/home/user/Dokumenty/Knihy/scan music theory 1/test"  # Nahraďte cestou k vašim obrázkům
    output_folder = "/home/user/Dokumenty/Knihy/scan music theory 1/output"  # Nahraďte cestou k výstupní složce
    
    # Zpracujeme obrázky
    process_images(input_folder, output_folder)




Kód pro extrakci nascanovaných obrázků z poškozeného .pdf

Soubor byl poškozen ve smyslu, že nebyl dokončen zápis .pdf pro nedostatek místa na disku. První skript najde začátky streamů se značkou JFIF a druhý provádí extrakci těch fotek.

# Import potřebných knihoven
import re

# Otevření PDF souboru v binárním režimu
with open('music theory part 3.pdf', 'rb') as file:
    content = file.read()  # Načtení obsahu souboru

# Vyhledání pozic řetězce "stream"
positions = [m.start() for m in re.finditer(b'stream', content)]

# Tisk prvních dvaceti bajtů od každé nalezené pozice
for pos in positions:
    start = pos  # Pozice začátku řetězce "stream"
    end = start + 20  # Konec prvních dvaceti bajtů
    print(f'Pozice: {pos}, Prvních 20 bajtů: {content[start:end]}')


EXTRAKCE

import re

# Funkce pro extrakci obrázků
def extract_images(pdf_file):
    with open(pdf_file, 'rb') as file:
        content = file.read()  # Načtení obsahu souboru

    # Procházení všech výskytů "stream"
    for match in re.finditer(b'stream', content):
        start = match.start()  # Pozice začátku "stream"
        
        # Tisk pozice a prvních 20 bajtů od "stream"
        print(f'Pozice: {start}, Prvních 20 bajtů: {content[start:start + 20]}')
        
        # Hledání konce streamu (použijeme "endstream" místo "endobj" pro přesnost)
        endstream_match = re.search(b'endstream', content[start:])
        if endstream_match:
            # Začátek obrazových dat je po "stream\n"
            newline_pos = content.find(b'\n', start)
            if newline_pos == -1:
                continue  # Pokud není newline, přeskočíme
            data_start = newline_pos + 1
            data_end = start + endstream_match.start()  # Konec před "endstream"
            image_data = content[data_start:data_end]
            
            # Kontrola, zda je to platný JPEG (začíná \xff\xd8)
            if image_data.startswith(b'\xff\xd8'):
                # Uložení obrázku
                with open(f'image_{start}.jpg', 'wb') as img_file:
                    img_file.write(image_data)
                print(f'Obrázek uložen: image_{start}.jpg')

# Spuštění funkce s vaším PDF souborem
extract_images('music theory 2 - chordsn rhytms.pdf')



 

čtvrtek 8. května 2025

Zrychlení videa mp4 se zachováním původního pitch / tóniny

TENTO KOD JSEM OVĚŘIL A SKUTEČNĚ FUNGUJE.

import subprocess

# Vstupní video a seznam požadovaných rychlostí
input_file = '/home/user/Videa/LOOP-tremolo-song-training-200-120-bpm.mp4'
bpm_speeds = {
    '350_BPM': 2.92,
    '352_BPM': 2.93,
    '354_BPM': 2.95,
    '357_BPM': 2.975,
    '356_BPM': 2.967,
    '358_BPM': 2.983
}

for label, ratio in bpm_speeds.items():
    output_file = f'/home/user/Videa/LOOP-tremolo-song-training-{label}.mp4'
    
    cmd = [
        'ffmpeg', '-y', '-i', input_file,
        '-filter_complex',
          # zrychlíme obraz i zvuk najednou
          f"[0:v]setpts=PTS/{ratio}[v];"
          f"[0:a]rubberband=tempo={ratio}[a]",
        '-map', '[v]', '-map', '[a]',
        '-c:v', 'libx264', '-preset', 'fast', '-crf', '23',
        '-c:a', 'aac', '-b:a', '192k',
        output_file
    ]
    
    print(f"Spouštím zpracování {label} (faktor {ratio})…")
    subprocess.run(cmd, check=True)
    print(f"✔ Hotovo: {output_file}\n")

Kód pro opravu barev na nascanovaném dokumentu

Kód má mírně stáhnout modrou barvu (což není přesně co jsem chtěl - na původním obrázku se trochu odráží modré LED světlo, tak jsem to chtě...

Štítky

.profile adm administrace Adobe AI akcelerace alfa transparence AND any aplikace apt ar archiv asociativní pole atomicity audio autentifikace awk balíčkovací systém bash beacon beacon_hint benchmark Bézierovy křivky bezpečnost biblehub BJT blogger boolean buffer buffering Cache-Conrol Cloudflare code Collector Cut-off ColorManager colorpicker common compare config cookies CPU CPU pipe css CSS3 curl cut čas data loss data lost data transfer reliability datasheet datetime.strptime deb deb-systemd-helper debian debián development dioda diody dpkg dpkg -S dpkg-deb drivers EBO Emitter Cut-off Current eps ETag exclude exec Expires extrakce jediného extrakce názvu balíčku souboru extrakce obrázků extrakce souboru .deb fflock fflush ffmpeg FIFO file read file write file_get_contents file_get_contents/file_put_contents file_put_contents filter find first_install.sh flock Fly-back dioda font-face fóra fotorezistor fread functions funkce fwrite gate gate drive GDVfs gedit gedit-common geolokace Ghostscript GIO glib gnome gnome settings GNU Privacy Guard gnupg gpg gradient-background grafika grep grep -v groupadd grub grub update gs gsettings gtk gtk.css gtk+ hebrejština history hlavičky HS html html 5 https hudba charakterizace chroot chyba ICES IGBT img sizes img srcset impedance implementace imshow inference inkscape inrush current install jalový výkon javascript javescript jednocení seznamů js kapacita součástek koeficient zesílení komponenty xFce komunikace se serverem konfigurace korekce barev Krita KSF Last-Modified lazy caching led LEFT JOIN librosa ligatury light-locker lightdm linux list log maják manuál maskování maskování služby masky matplotlib Max-Age measure memory měření MFCC MFCC koeficienty mint Mint 21.3 Mint xFce míry modules moralizace morphologie MOSFET mount moviepy mysql náběhový proud napěťová ochrana nastavení šablony návod nel Network Error Logging NLP not Notifications NTFS nth-child oblékání ochrana okruhy přátel OpenVINO IR formát oprava oprava balíčku optočlen org.gnome.desktop.screensaver org.gnome.nm-applet ořezové masky OSHB otázky otázky_jazyky otázky_moralismu_řešení ovladače panely parsování path pdf personifikace photorec php php 4 php 5 php 6 php 7 php 8 phpbb phpBB3 PipeWire pitch PN přechody pnp pole Policykit postscript práva profilování program prune průraz přeinstalování přepěťová ochrana přepolování příkazy připojení k síti připojení k wifi pseudokódd pstoedit PulseAudio PWM regulátory pydub python python3 pytorch ramdisk RBE RDSon read reaktance rectifier regulace vstupního napětí reinstall relyability remount replace restore reverzní geolokace RIGHT JOIN rm role rozvržení disků pro OS linux a data databází řešení samba scan scroll sdílení sdílení souborů Sec-Fetch-Dest Sec-Fetch-Mode Sec-Fetch-Site Sec-Fetch-User Secure Shell sed Set Cookie show-manual-login show-remote-login shunt schemas schémata schottka skript skupiny sloupce služby song sort soubory soundfile spínané zdroje spínání splines split správa diskových zařízení SQL ssh stabilizace napětí stahování stream string strojové učení stropové učení supplicant svg syntax systemctl systemd-logind T5 tabulky Tangentové úsečky tar témata tepelná ztráta test text-shadow themes thermal runaway time timestamp tkinter tr transistor transition tranzistor tranzistory tuple tvorba otázek TVS ubuntu účiník udiskd udisks unconfined underrun unity-greeter update usermod uživatelé va charakteristika vala vektorová grafika Vgs video Vth vynechání adresářů vývoj while wpa wpa_supplicant wrapovací funkce x xandr xapp-watt xargs -I xed xed-common xfdesktop xml XOR Xorg Xorg Thumbnails xrandr závislosti zdánlivý výkon zdroj zenerka zenerovo napětí zip zip archiv zkratky zpomalení zpracování textu zrychlení Žalmy