úterý 24. prosince 2024

LLama: Jak získat jména balíčků k souborům, které v systému schází?

PRETEXT

Důvod proč chci z md5sums extrahovat jen informace o .xml je, že další soubory jako dokumentace .gz a obrázky .png apod. by bylo hodně souborů a celá akce obnovení souborů by trvala velmi dlouho. Příkaz dpkg -S je pomalý i na ssd.

První pokus je opravdu velmi pomalý, takže posledním dotazem žádám LLamu o skript, kde se zpracuje více souborů najednou.

POPIS PROBLÉMU

Dobře mám soubory, nyní ale nevím k jakým balíčkům ty scházející .xml soubory patří

Co jsem provedl - popis: 

md5sums: debsums -c -g 2>&1 > missing-configs.log 

vytvoří md5sums 

 Parametr -g způsobí, že debsums vytvoří soubor s kontrolními součty, ale neukládá jej do standardního výstupu. Místo toho se soubor s kontrolními součty uloží do adresáře /var/lib/dpkg/info/ s názvem md5sums 

Poté co jsou md5sums k balíčkům hotovy provedeme extrakci řádků kde schází "OK" (grep -v čili "negativ") a extrakci souborů .xml -> výpis scházejících souborů .xml: 

grep -v "OK" /var/lib/dpkg/info/*.md5sums | grep "\.xml$" | awk '{print $2}'

* * ** * *

Llama 3.1 70B

Nyní máte seznam scházejících souborů XML, ale nevíte, k jakým balíčkům patří. To je problém, protože soubory md5sums jsou uloženy v adresáři /var/lib/dpkg/info/ s názvem md5sums, ale neobsahují informace o balíčku, ke kterému patří.

Jedním ze způsobů, jak získat informace o balíčku, ke kterému patří soubor, je použít příkaz dpkg -S. Tento příkaz hledá soubor v databázi balíčků a vrátí název balíčku, ke kterému patří.

Můžete použít následující příkaz k získání informací o balíčku, ke kterému patří každý soubor:

grep -v "OK" /var/lib/dpkg/info/*.md5sums | grep "\.xml$" | awk '{print $2}' | xargs -I {} dpkg -S {}

Tento příkaz provede následující kroky:

  1. Extrahuje řádky, které neobsahují "OK" a obsahují řetězec ".xml$".
  2. Extrahuje název souboru z každého řádku.
  3. Použije příkaz dpkg -S k získání informací o balíčku, ke kterému patří každý soubor.

Poznámka: xargs je příkaz, který umožňuje provést akci na každém řádku výstupu. -I {} je parametr, který umožňuje nahradit {} názvem souboru v příkazu dpkg -S.

* * *

Dobře dobře ale chtěl bych ty výsledky rovnou uložit do souboru. Takže potřebuju název souboru .xml a název balíčku. Může to klidně být oddělené mezerou ty dva sloupce.

Llama 3.1 70B

Můžete použít následující příkaz k uložení výsledků do souboru:

grep -v "OK" /var/lib/dpkg/info/*.md5sums | grep "\.xml$" | awk '{print $2}' | xargs -I {} dpkg -S {} | awk '{print $2, $1}' > missing_xml_packages.txt

Tento příkaz provede následující kroky:

  1. Extrahuje řádky, které neobsahují "OK" a obsahují řetězec ".xml$".
  2. Extrahuje název souboru z každého řádku.
  3. Použije příkaz dpkg -S k získání informací o balíčku, ke kterému patří každý soubor.
  4. Použije příkaz awk k extrahování názvu balíčku a názvu souboru a uložení výsledků do souboru missing_xml_packages.txt.

Výsledný soubor bude mít následující formát:

název_souboru.xml název_balíčku

Příklad:

yelp.appdata.xml yelp yelp-xsl.xml yelp-xsl zim.xml zim

Poznámka: > missing_xml_packages.txt je parametr, který umožňuje uložit výstup do souboru missing_xml_packages.txt.

* * *

Je možné upravit skript tak, aby se data z každého .md5sums souboru zpracovaly najednou a dpkg -S se zavolal jen jednou pro daný soubor.

Můžete použít následující skript:

(ZATÍM NEOTESTOVÁNO)

for file in /var/lib/dpkg/info/*.md5sums; do
  soubory=$(grep -v "OK" "$file" | grep "\.xml$" | awk '{print $2}')
  dpkg -S $soubory | awk '{print $2, $1}' >> missing_xml_packages_2.txt
done

 

Žádné komentáře:

Okomentovat

GPT: Ramdisk a extrakce .deb

  Následující skript provádí popsané kroky, využívá RAMdisky různých velikostí podle potřeby a provádí extrakci. Tento skript je psán v Bas...

Štítky

.profile adm administrace Adobe AI akcelerace alfa transparence AND any aplikace apt ar archiv asociativní pole atomicity audio autentifikace awk balíčkovací systém bash beacon beacon_hint benchmark Bézierovy křivky bezpečnost biblehub BJT boolean buffer buffering Cache-Conrol Cloudflare code Collector Cut-off ColorManager colorpicker common compare config cookies CPU CPU pipe css CSS3 curl cut čas data loss data lost data transfer reliability datasheet datetime.strptime deb deb-systemd-helper debian debián development dioda diody dpkg dpkg -S dpkg-deb drivers EBO Emitter Cut-off Current eps ETag exclude exec Expires extrakce jediného extrakce názvu balíčku souboru extrakce souboru .deb fflock fflush ffmpeg FIFO file read file write file_get_contents file_get_contents/file_put_contents file_put_contents filter find first_install.sh flock Fly-back dioda font-face fóra fotorezistor fread functions funkce fwrite gate gate drive GDVfs gedit gedit-common geolokace Ghostscript GIO glib gnome gnome settings GNU Privacy Guard gnupg gpg gradient-background grafika grep grep -v groupadd grub grub update gs gsettings gtk gtk.css gtk+ hebrejština history hlavičky HS html html 5 https hudba charakterizace chroot chyba ICES IGBT img sizes img srcset impedance implementace imshow inference inkscape inrush current install jalový výkon javascript javescript jednocení seznamů js kapacita součástek koeficient zesílení komponenty xFce komunikace se serverem konfigurace Krita KSF Last-Modified lazy caching led LEFT JOIN librosa ligatury light-locker lightdm linux list log maják manuál maskování maskování služby masky matplotlib Max-Age measure memory měření MFCC MFCC koeficienty mint Mint 21.3 Mint xFce míry modules moralizace morphologie MOSFET mount moviepy mysql náběhový proud napěťová ochrana návod nel Network Error Logging NLP not Notifications NTFS nth-child oblékání ochrana okruhy přátel OpenVINO IR formát oprava oprava balíčku optočlen org.gnome.desktop.screensaver org.gnome.nm-applet ořezové masky OSHB otázky otázky_jazyky otázky_moralismu_řešení ovladače panely parsování path personifikace photorec php php 4 php 5 php 6 php 7 php 8 phpbb phpBB3 PipeWire pitch PN přechody pnp pole Policykit postscript práva profilování program prune průraz přeinstalování přepěťová ochrana přepolování příkazy připojení k síti připojení k wifi pseudokódd pstoedit PulseAudio PWM regulátory pydub python python3 pytorch ramdisk RBE RDSon read reaktance rectifier regulace vstupního napětí reinstall relyability remount replace restore reverzní geolokace RIGHT JOIN rm role rozvržení disků pro OS linux a data databází řešení samba sdílení sdílení souborů Sec-Fetch-Dest Sec-Fetch-Mode Sec-Fetch-Site Sec-Fetch-User Secure Shell sed Set Cookie show-manual-login show-remote-login shunt schemas schémata schottka skript skupiny sloupce služby song sort soubory soundfile spínané zdroje spínání splines split správa diskových zařízení SQL ssh stabilizace napětí stahování stream string strojové učení stropové učení supplicant svg syntax systemctl systemd-logind T5 tabulky Tangentové úsečky tar témata tepelná ztráta test text-shadow themes thermal runaway time timestamp tkinter tr transistor transition tranzistor tranzistory tuple tvorba otázek TVS ubuntu účiník udiskd udisks unconfined underrun unity-greeter update usermod uživatelé va charakteristika vala vektorová grafika Vgs video Vth vynechání adresářů vývoj while wpa wpa_supplicant wrapovací funkce x xandr xapp-watt xargs -I xed xed-common xfdesktop xml XOR Xorg Xorg Thumbnails xrandr závislosti zdánlivý výkon zdroj zenerka zenerovo napětí zip zip archiv zkratky zpomalení zpracování textu Žalmy