da.phhsnews.com


da.phhsnews.com / Hvorfor er Zip Able i stand til at komprimere enkelte filer bedre end flere filer med samme indhold?

Hvorfor er Zip Able i stand til at komprimere enkelte filer bedre end flere filer med samme indhold?


At kunne komprimere vores filer, så det er lettere at dele og / eller transportere dem, kan gøre vores elektroniske liv meget lettere, men nogle gange kan vi se ulige eller uventede størrelsesresultater efter at vi har komprimeret dem. Hvorfor det? Dagens SuperUser Q & A-indlæg har svarene på en forvirret læsers spørgsmål.

Dagens Spørgsmål og Svar-sessions kommer til vores side med SuperUser-en underafdeling af Stack Exchange, en community-driven gruppe af Q & A-websteder.

Foto med tilladelse til Jean-Etienne Minh-Duy Poirrier (Flickr).

Spørgsmålet

SuperUser læser sixtyfootersdude ønsker at vide, hvorfor zip er i stand til at komprimere enkeltfiler bedre end flere filer med samme type indhold:

Antag at jeg har 10.000 XML-filer og vil sende dem til en ven. Før jeg sender dem, vil jeg gerne komprimere dem.

Metode 1: Komprimer dem ikke

Resultater:

Metode 2: Zip hver fil separat og send ham 10.000 zip-XML-filer

Kommando:

Resultater:

Metode 3: Opret en enkelt zip-fil med alle 10.000 XML-filer

Kommando:

Resultater:

Metode 4: Sammenkoble filerne til en enkelt fil og zip den

Kommando:

Resultater:

Spørgsmål

  • Hvorfor får jeg så dramatisk bedre resultater, når jeg bare glider en enkelt fil?
  • Jeg forventede at få drastisk bedre resultater ved hjælp af metode 3 end metode 2, men jeg lade være med. Hvorfor er dette?
  • Er denne adfærd specifik for zip? Hvis jeg forsøgte at bruge Gzip, vil jeg få forskellige resultater?

Yderligere info

Meta Data

En af de givne svar antyder, at forskellen er systemmetadataene, der er gemt i zip-filen. Jeg tror ikke, at dette kan være tilfældet. For at teste det gjorde jeg følgende:

Den resulterende zip-fil er 1,4 MB. Dette betyder at der stadig er ca. 10 MB uforklarligt plads. Hvorfor er zip i stand til at komprimere enkeltfiler bedre end flere filer med samme type indhold?

Svaret

SuperUser-bidragsydere Alan Shutko og Aganju har svaret for os. Først op, Alan Shutko:

Zip-komprimering er baseret på gentagne mønstre i de data, der skal komprimeres, og komprimeringen bliver bedre jo længere filen er, da flere og længere mønstre kan findes og bruges.

Forenklet, Hvis du komprimerer en fil, er ordbogen, der kortlægger (korte) koder til (længere) mønstre, nødvendigvis indeholdt i hver resulterende zip-fil; Hvis du zip en lang fil, bliver ordbogen 'genbrugt' og vokser endnu mere effektivt på tværs af alt indhold.

Hvis dine filer er lige lidt ens (som tekst altid er) bliver genbrug af 'ordbogen' meget effektiv og Resultatet er en meget mindre total zip-fil.

Efterfulgt af svaret fra Aganju:

I zip er hver fil komprimeret separat. Det modsatte er

solid kompression , dvs. filer komprimeres sammen. 7-zip og Rar bruger som standard komprimering som standard. Gzip og Bzip2 kan ikke komprimere flere filer, så Tar bruges først og har samme virkning som solid kompression. Da xml-filer har en lignende struktur (og sandsynligvis lignende indhold), hvis filerne komprimeres sammen, vil komprimeringen være højere .

Hvis en fil indeholder strengen "

", og kompressoren allerede har fundet den pågældende streng i en anden fil, erstatter den den med en lille peger til den foregående kamp. Hvis kompressoren ikke bruger solid kompression, registreres den første forekomst af strengen i filen som en bogstavlig , som er større. Har du noget at tilføje til forklaringen? Lyde af i kommentarerne. Vil du læse flere svar fra andre tech-savvy Stack Exchange brugere? Se hele diskussionsgruppen her.



Sådan tilføjes din Outlook.com-e-mail-adresse til Microsoft Outlook

Sådan tilføjes din Outlook.com-e-mail-adresse til Microsoft Outlook

Microsoft Outlook-desktopprogrammet understøtter Outlook.com-adresser, der slutter i @ outlook.com, @ hotmail.com, @ live.com , og @ msn.com. Det er dog ikke nødvendigvis indlysende, hvordan du tilføjer dem, især hvis du bruger to-trins verifikation. Vi brugte Outlook 2016 til denne vejledning, selv om denne samme proces også virker på Outlook 2013 og opdaterede versioner af Outlook 2010.

(how-to)

5 opgaver, der burde have været enklere i Windows 8

5 opgaver, der burde have været enklere i Windows 8

Jeg har brugt Windows 8 i et stykke tid nu, og selvom jeg kan lide at bruge det, er der stadig nogle meget irriterende aspekter af det operativsystem, jeg bare ikke får. Hvorfor er det så svært at gøre ting, der plejede at være så nemt? Genstart din computer? Udskriv fra en Windows-app? OS'et er blevet "re-imagined", men jeg finder nogle af de nye måder at få enkle ting gjort frustrerende. Her er

(How-to)