..


Sponsored Links

Komprimieren von Dateien. Algorithmen und Software für den Vergleich.

Artikel durch schriftliche Damiano Verda
Seite 1 von 2

Zu den häufigsten Operationen, die nützlich sein können, auch für unerfahrene Benutzer zu identifizieren definitiv Kompression. Durch diese Transaktion in der Tat kann eine beliebige Datei auf Ihrem Computer wiederhergestellt werden, so dass ein Teil des Speichers als Festplatte zu besetzen. Wir beobachten jedoch, dass derzeit gibt es Festplatten mit großer Kapazität zu Preisen relativ gering, so dass der Nutzen der Kompression Programme scheint zu schrumpfen. Aber das ist eine übereilte Schlussfolgerung.

In der Tat kann zum Beispiel interessant sein, eine oder mehrere Dateien vor dem Versand per E-Mail zu komprimieren, um die Zeit der Annahme und Weiterleitung reduzieren. Interessante und praktische Ergänzung auch die Möglichkeit, mehrere Dokumente in einer einzelnen komprimierten Datei zu speichern, praktischer zu übertragen und zu manipulieren.

Aber was sind die wichtigsten Optionen für Benutzer verfügbar, um eine Datei oder Dateien komprimieren? Was unterscheidet die verschiedenen Software verfügbar? Betrachten wir zunächst die theoretischen Grundlagen der Software-Komprimierung und verdeutlichen damit die wichtigsten Merkmale der Kompressions-Algorithmen.

Kompressionsalgorithmen

Eine erste Unterscheidung zwischen den Kompressions-Algorithmen können zwischen verlustfreien Algorithmen identifiziert werden, dh ohne Verlust von Qualität und verlustbehaftete Algorithmen, in denen die Reduzierung von Speicherplatz durch einen Verlust der Qualität begleitet wird. Es ist oft schwierig, eine Verschlechterung der Qualität zu sehen: zum Beispiel im Fall der mp3-Kodierung für Audio-Dateien.

Zu den am häufigsten verwendeten Algorithmen ohne Zweifel erkennen das "Huffman-Algorithmus, der" Shannon-Fano-Algorithmus und "Algorithmus Lempel, Ziv und Welch. Während nicht in theoretischen Erläuterungen, untersuchen wir die wichtigsten Merkmale des "Huffman-Algorithmus, der die Geschichte der Kompressionsverfahren geprägt hat.

Wir beziehen uns Leser in weitere Einzelheiten zu den Techniken der Shannon-Fano und Lempel-Ziv-Welch Links zu weiteren spezifischen zu diesem Thema interessiert:

Der Huffman-Algorithmus

'S-Algorithmus gehört zu der Kategorie Huffman verlustfrei, dh nicht vorstellen jeglichen Qualitätsverlust. Wir scomporne Betrieb in fünf elementare Schritte:

  • Wird analysiert, und zählte die Anzahl der Vorkommen der grundlegenden Elemente der Datei komprimiert werden: die einzelnen Zeichen in einer Textdatei, die Pixel in einem Bild-Datei.
  • Die beiden Elemente werden in einer weniger häufigen Kategorie, die sie beide stellt gebracht. So zum Beispiel, wenn X und Y auftritt, 8 mal 7 mal schafft es die Kategorie XY, mit 15 Wiederholungen. Inzwischen hat die Komponenten X und Y jeweils einen unterschiedlichen Marker, die sie identifiziert, als Elemente in einem Verband eingetragen.
  • Die nächsten beiden Elemente identifiziert werden weniger häufig in der Datei und setzt als neue Kategorie, mit dem gleichen Verfahren in Schritt 2 beschrieben. Die Gruppe XY kann wiederum treten in Form und neue Assoziationen, beispielsweise die XYZ Kategorie. Wenn dies geschieht, sind die X-und Y eine neue Kennung, die mit dem Verein endet erweitern Sie den Code zur eindeutigen Identifizierung jedes der beiden Briefe in die komprimierte Datei generiert wird gegeben.
  • Ist dann für die nächsten Schritte erstellt, besteht aus einem Baum aus einer Reihe von binären Filialen, in denen häufiger und in den folgenden Kombinationen seltener Elemente in der Datei angezeigt werden, während die Elemente selten sind häufiger. Nach den Mechanismus beschrieben, bedeutet dies, dass die seltenen Elemente in der unkomprimierten Dateien mit einer Kennung Länge, die wachsende jedes Element einer neuen Vereinigung ist assoziiert sind. Die Elemente sind immer häufiger anstelle der Original-Datei wiederholt werden nicht im "Baum der Vereine, so dass ihre Identifikations-Code wird so kurz wie möglich.
  • Komprimierte Datei erzeugt wird, ersetzt jedes Element der Original-Datei, erzeugt den Code am Ende der Kette von Assoziationen auf die Häufigkeit dieses Elements im Quelldokument basiert.
Der Gewinn von Leerzeichen am Ende der Kompression ist aufgrund der Tatsache, dass die Elemente, die wiederholt werden oft durch einen kurzen Code, die weniger Raum einnimmt, als sie ihre normale Kodierung zu besetzen identifiziert. Umgekehrt seltenen Elementen in der Original-Datei in die komprimierte Datei erhalten Sie einen langen Code, der dies erfordern, für jeden von ihnen, ein Gebiet erheblich größer als die besetzten in der unkomprimierten Datei.

Aus der algebraischen Summe der Raumgewinn durch Verschlüsselung kurzen zu den häufigsten und Raum mit der Codierung der seltensten lange Sie das Verdichtungsverhältnis von "Huffman-Algorithmus erzeugt verloren. Aus dem oben Gesagten folgt, dass diese Art der Kompression effektiver desto größer ist die Frequenz Unterschiede der Komponenten der Original-Datei ist, während schlechte Ergebnisse erzielt werden, wenn die Verteilung der Elemente gleichmäßig ist.

In der selben Kategorie ...
E-Learning
HTML (Kurs) HTML (Kurs)
Die Markup-Sprache für das Web ab 29 €.
Webmaster Advanced (Course) Webmaster Advanced (Course)
Werden Sie ein professioneller Webmaster. Von 39 €.
Webmaster Base (First) Webmaster Base (First)
Erstellen Sie eine Website von Grund auf. Ab 29 €.
Sponsored Links