At kunne komprimere vores filer, så det er lettere at dele og / eller transportere dem, kan gøre vores elektroniske liv meget lettere, men nogle gange kan vi se ulige eller uventede størrelsesresultater efter at vi har komprimeret dem. Hvorfor det? Dagens SuperUser Q & A-indlæg har svarene på en forvirret læsers spørgsmål.
Dagens Spørgsmål og Svar-sessions kommer til vores side med SuperUser-en underafdeling af Stack Exchange, en community-driven gruppe af Q & A-websteder.
Foto med tilladelse til Jean-Etienne Minh-Duy Poirrier (Flickr).
SuperUser læser sixtyfootersdude ønsker at vide, hvorfor zip er i stand til at komprimere enkeltfiler bedre end flere filer med samme type indhold:
Antag at jeg har 10.000 XML-filer og vil sende dem til en ven. Før jeg sender dem, vil jeg gerne komprimere dem.
Metode 1: Komprimer dem ikke
Resultater:
Metode 2: Zip hver fil separat og send ham 10.000 zip-XML-filer
Kommando:
Resultater:
Metode 3: Opret en enkelt zip-fil med alle 10.000 XML-filer
Kommando:
Resultater:
Metode 4: Sammenkoble filerne til en enkelt fil og zip den
Kommando:
Resultater:
Spørgsmål
- Hvorfor får jeg så dramatisk bedre resultater, når jeg bare glider en enkelt fil?
- Jeg forventede at få drastisk bedre resultater ved hjælp af metode 3 end metode 2, men jeg lade være med. Hvorfor er dette?
- Er denne adfærd specifik for zip? Hvis jeg forsøgte at bruge Gzip, vil jeg få forskellige resultater?
Yderligere info
Meta Data
En af de givne svar antyder, at forskellen er systemmetadataene, der er gemt i zip-filen. Jeg tror ikke, at dette kan være tilfældet. For at teste det gjorde jeg følgende:
Den resulterende zip-fil er 1,4 MB. Dette betyder at der stadig er ca. 10 MB uforklarligt plads. Hvorfor er zip i stand til at komprimere enkeltfiler bedre end flere filer med samme type indhold?
Svaret
Zip-komprimering er baseret på gentagne mønstre i de data, der skal komprimeres, og komprimeringen bliver bedre jo længere filen er, da flere og længere mønstre kan findes og bruges.
Forenklet, Hvis du komprimerer en fil, er ordbogen, der kortlægger (korte) koder til (længere) mønstre, nødvendigvis indeholdt i hver resulterende zip-fil; Hvis du zip en lang fil, bliver ordbogen 'genbrugt' og vokser endnu mere effektivt på tværs af alt indhold.
Hvis dine filer er lige lidt ens (som tekst altid er) bliver genbrug af 'ordbogen' meget effektiv og Resultatet er en meget mindre total zip-fil.
Efterfulgt af svaret fra Aganju:
I zip er hver fil komprimeret separat. Det modsatte er
solid kompression , dvs. filer komprimeres sammen. 7-zip og Rar bruger som standard komprimering som standard. Gzip og Bzip2 kan ikke komprimere flere filer, så Tar bruges først og har samme virkning som solid kompression. Da xml-filer har en lignende struktur (og sandsynligvis lignende indhold), hvis filerne komprimeres sammen, vil komprimeringen være højere .
Hvis en fil indeholder strengen "
", og kompressoren allerede har fundet den pågældende streng i en anden fil, erstatter den den med en lille peger til den foregående kamp. Hvis kompressoren ikke bruger solid kompression, registreres den første forekomst af strengen i filen som en bogstavlig , som er større. Har du noget at tilføje til forklaringen? Lyde af i kommentarerne. Vil du læse flere svar fra andre tech-savvy Stack Exchange brugere? Se hele diskussionsgruppen her.
Sådan flytter du din musemarkør uden en mus
For nylig skrev jeg en artikel om, hvordan man højreklikker på tastaturet, og mange fandt det nyttigt. Men jeg blev ved med at få flere spørgsmål, der spurgte mig, hvordan de kunne styre musemarkøren ved hjælp af tastaturet. Hvis din touchpad dør på din bærbare computer eller din mus stopper med at arbejde på dit skrivebord, er det værd at vide, hvordan du bevæger musemarkøren rundt, indtil du kan få dit system tilbage til normal. Det første sk
Sådan bruger du Microsoft Office's indbyggede udklipsholder
Din computers "udklipsholder" er, hvor indhold, som du klipper eller kopierer, midlertidigt er gemt. Microsoft Office har sit eget udklipsholder, men det er mere kraftfuldt. Windows-udklipsholderen gemmer kun det sidste emne, du kopierede. Kontorets udklipsholder gemmer imidlertid op til 24 tekst- og grafikpunkter fra Office-dokumenter og andre programmer.