úterý 24. prosince 2024

balíčky deb: archiv ar vs tar - Extrakce jediného souboru .deb

 

Rozdíl mezi formáty ar a tar spočívá v jejich struktuře a účelu:

1. Formát ar (Archive)

  • Formát používaný pro archivaci souborů v Debian balíčcích (.deb).
  • Má jednoduchou strukturu, která se skládá z několika částí:
    • Header: Informace o archivu, jako je název, velikost a čísla verzí.
    • Data: Vlastní soubory a jejich metadata.
    • Control files: Soubory, které obsahují informace o balíčku (např. control, postinst, prerm).
  • Tento formát je optimalizovaný pro balíčky Debianu a slouží k rozdělení balíčků na různé části, přičemž zbytek souborů je uložen v tar archivu uvnitř.

2. Formát tar (Tape Archive)

  • Formát používaný pro ukládání souborů do archivu bez komprese nebo s kompresí (např. tar.gz, tar.xz).
  • Jednoduchý souborový archiv: Používá se pro balení souborů do jedné "krabice" pro účely zálohování nebo distribuce.
  • Každý soubor v archivu je obvykle zařazen do archivu bez změny jeho struktury.

Jak souvisí ar a tar v .deb balíčku?

  • Balíček .deb je ve formátu ar, který obsahuje:
    • debian-binary: Textový soubor s verzí balíčku.
    • control.tar.*: Archiv ve formátu tar, který obsahuje všechny řídící soubory (např. control, postinst, atd.).
    • data.tar.*: Archiv ve formátu tar, který obsahuje soubory, které budou nainstalovány na systém.

Když používáte příkaz dpkg-deb --ctrl-tarfile, získáte právě control.tar.* (který je ve formátu tar). Tento příkaz neovlivňuje soubory uvnitř archivu ar ve smyslu jejich "převodu" na tar - jednoduše pouze extrahuje část balíčku (kontrolní soubory).

Proč dpkg-deb nemá přímo možnost extrahovat jeden soubor?

Jak správně uvádíte, není přímá možnost extrahovat pouze jeden soubor z .deb balíčku pomocí dpkg-deb. Tento nástroj je navržen pro rozbalení celého balíčku. Při rozbalování pomocí dpkg-deb --extract je soubor rozbalen celý, protože struktura balíčku není navržena pro extrakci jednotlivých souborů na úrovni balíčku — je třeba rozbalit všechny soubory z data.tar.* a pak podle potřeby vybrat konkrétní soubor.

Pokud tedy potřebujete extrahovat jeden soubor, musíte:

  1. Rozbalit celý balíček do nějakého dočasného adresáře (např. dpkg-deb --extract).
  2. Ručně vybrat soubor, který potřebujete, nebo použít skript na kopírování požadovaného souboru.

Alternativní přístup

Pokud chcete extrahovat soubor z .deb balíčku bez rozbalování celého balíčku, můžete použít ar přímo:

  1. Použití ar k extrakci souborů z .deb:

    ar x "$nazev_baliku"
    

    Tento příkaz vytvoří 3 soubory:

    • debian-binary
    • control.tar.*
    • data.tar.*
  2. Použití tar pro extrahování konkrétního souboru:

    tar -xf data.tar.* "$cesta_k_souboru" -C "$cilovy_adresar"
    

    Tento příkaz extrahuje konkrétní soubor z data.tar.*.

Závěr

  • dpkg-deb nemá přímou podporu pro extrakci jednoho souboru z .deb, protože je navržen pro rozbalení celého balíčku.
  • Můžete použít ar k extrahování částí balíčku a následně použít tar pro extrahování konkrétního souboru, ale i tento proces vyžaduje určitou přípravu.
  • Příkaz --ctrl-tarfile pouze extrahuje kontrolní soubory a neprovádí "převod" formátu ar na tar.

* * *

Rozumím vašemu dotazu! Pojďme to upřesnit:

Příkaz ar x rozbalí obsah .deb balíčku, ale pouze na první úroveň balíčku, tj. vyextrahuje soubory jako debian-binary, control.tar.* a data.tar.*. Nerozbalí však obsah těchto tar archivů, které jsou uvnitř (POZNÁMKA: TZN. INSTALACE VYŽADUJE DVOJNÁSOBEK AŽ TROJNÁSOBEK MÍSTA: a) pro stažení souboru .deb b) pro extrakci archivu c) pro extrakci souborů).

Jinými slovy:

  1. ar rozbalí pouze obsah balíčku .deb, což jsou tři součásti (debian-binary, control.tar.*, data.tar.*).
  2. Aby bylo možné získat konkrétní soubor (např. /usr/bin/somefile) z data.tar.*, je potřeba následně použít nástroj tar, který zpracuje tento archiv.

Proč tedy není ar stejné jako tar?

  • ar je velmi jednoduchý formát používaný jako obal. Není optimalizovaný pro extrakci jednotlivých souborů uvnitř vnořených archivů.
  • tar pracuje přímo se soubory uvnitř archivu a umožňuje extrakci jednotlivých souborů bez potřeby rozbalit vše.

Proces při extrakci konkrétního souboru

Pokud chcete extrahovat jeden konkrétní soubor z .deb balíčku:

  1. Použijete ar k rozbalení obsahu balíčku na první úrovni:

    ar x balicek.deb
    

    To vytvoří:

    • debian-binary
    • control.tar.*
    • data.tar.*
  2. Použijete tar k extrakci konkrétního souboru z data.tar.*:

    tar -xf data.tar.* cesta/k/souboru -C cilovy_adresar
    

Odpověď na vaši otázku

Ne, ar sám o sobě nerozbalí všechny soubory obsažené ve control.tar.* a data.tar.*. Jen "odstraní obal" a zpřístupní tyto archivy. Pokud následně chcete extrahovat konkrétní soubor, musí být použit tar k selektivní extrakci z těchto archivů. 

Příkaz ar x pouze extrahuje obsah balíčku .deb na úrovni archivu ar (extrahuje všechny data, která jsou nutné pro rozbalení archivu). To znamená, že oddělí jednotlivé části balíčku (debian-binary, control.tar.*, data.tar.*) a uloží je jako samostatné soubory na disk.

Tento přístup je efektivnější, protože se nemusí rozbalovat celý obsah balíčku do pracovního adresáře, pokud se zajímáte jen o konkrétní soubor.

* * *

Velikost souboru data.tar (nebo jeho komprimované varianty, např. data.tar.gz, data.tar.xz) závisí na tom, kolik prostoru zabírají nainstalované soubory balíčku a jaká komprese je použita. Odhad velikosti lze určit následovně:

  1. data.tar obsahuje nainstalovatelné soubory balíčku, což bývá hlavní složka .deb. Typicky zabírá většinu místa, často přes 80–95 % velikosti .deb. Např.:

    • .deb má 10 MB → data.tar.* bude obvykle kolem 8–9,5 MB.
  2. control.tar.* a debian-binary jsou velmi malé:

    • control.tar.* obsahuje metadata balíčku (např. seznam závislostí, popis). Bývá to malý soubor, často pod 100 KB.
    • debian-binary má vždy pevnou velikost 4 bajty.
  3. Komprese ovlivňuje velikost:

    • Pokud je .deb zkomprimováno efektivním algoritmem (např. xz), velikost data.tar může být po rozbalení větší než .deb.
    • Např.:
      • .deb komprimované na 10 MB (pomocí xz) → rozbalený data.tar může mít 12 MB nebo více.

 

 

Žádné komentáře:

Okomentovat

GPT: Ramdisk a extrakce .deb

  Následující skript provádí popsané kroky, využívá RAMdisky různých velikostí podle potřeby a provádí extrakci. Tento skript je psán v Bas...

Štítky

.profile adm administrace Adobe AI akcelerace alfa transparence AND any aplikace apt ar archiv asociativní pole atomicity audio autentifikace awk balíčkovací systém bash beacon beacon_hint benchmark Bézierovy křivky bezpečnost biblehub BJT boolean buffer buffering Cache-Conrol Cloudflare code Collector Cut-off ColorManager colorpicker common compare config cookies CPU CPU pipe css CSS3 curl cut čas data loss data lost data transfer reliability datasheet datetime.strptime deb deb-systemd-helper debian debián development dioda diody dpkg dpkg -S dpkg-deb drivers EBO Emitter Cut-off Current eps ETag exclude exec Expires extrakce jediného extrakce názvu balíčku souboru extrakce souboru .deb fflock fflush ffmpeg FIFO file read file write file_get_contents file_get_contents/file_put_contents file_put_contents filter find first_install.sh flock Fly-back dioda font-face fóra fotorezistor fread functions funkce fwrite gate gate drive GDVfs gedit gedit-common geolokace Ghostscript GIO glib gnome gnome settings GNU Privacy Guard gnupg gpg gradient-background grafika grep grep -v groupadd grub grub update gs gsettings gtk gtk.css gtk+ hebrejština history hlavičky HS html html 5 https hudba charakterizace chroot chyba ICES IGBT img sizes img srcset impedance implementace imshow inference inkscape inrush current install jalový výkon javascript javescript jednocení seznamů js kapacita součástek koeficient zesílení komponenty xFce komunikace se serverem konfigurace Krita KSF Last-Modified lazy caching led LEFT JOIN librosa ligatury light-locker lightdm linux list log maják manuál maskování maskování služby masky matplotlib Max-Age measure memory měření MFCC MFCC koeficienty mint Mint 21.3 Mint xFce míry modules moralizace morphologie MOSFET mount moviepy mysql náběhový proud napěťová ochrana návod nel Network Error Logging NLP not Notifications NTFS nth-child oblékání ochrana okruhy přátel OpenVINO IR formát oprava oprava balíčku optočlen org.gnome.desktop.screensaver org.gnome.nm-applet ořezové masky OSHB otázky otázky_jazyky otázky_moralismu_řešení ovladače panely parsování path personifikace photorec php php 4 php 5 php 6 php 7 php 8 phpbb phpBB3 PipeWire pitch PN přechody pnp pole Policykit postscript práva profilování program prune průraz přeinstalování přepěťová ochrana přepolování příkazy připojení k síti připojení k wifi pseudokódd pstoedit PulseAudio PWM regulátory pydub python python3 pytorch ramdisk RBE RDSon read reaktance rectifier regulace vstupního napětí reinstall relyability remount replace restore reverzní geolokace RIGHT JOIN rm role rozvržení disků pro OS linux a data databází řešení samba sdílení sdílení souborů Sec-Fetch-Dest Sec-Fetch-Mode Sec-Fetch-Site Sec-Fetch-User Secure Shell sed Set Cookie show-manual-login show-remote-login shunt schemas schémata schottka skript skupiny sloupce služby song sort soubory soundfile spínané zdroje spínání splines split správa diskových zařízení SQL ssh stabilizace napětí stahování stream string strojové učení stropové učení supplicant svg syntax systemctl systemd-logind T5 tabulky Tangentové úsečky tar témata tepelná ztráta test text-shadow themes thermal runaway time timestamp tkinter tr transistor transition tranzistor tranzistory tuple tvorba otázek TVS ubuntu účiník udiskd udisks unconfined underrun unity-greeter update usermod uživatelé va charakteristika vala vektorová grafika Vgs video Vth vynechání adresářů vývoj while wpa wpa_supplicant wrapovací funkce x xandr xapp-watt xargs -I xed xed-common xfdesktop xml XOR Xorg Xorg Thumbnails xrandr závislosti zdánlivý výkon zdroj zenerka zenerovo napětí zip zip archiv zkratky zpomalení zpracování textu Žalmy