• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Bzip2

    Przeczytaj także...
    Kodowanie Huffmana (ang. Huffman coding) – jedna z najprostszych i łatwych w implementacji metod kompresji bezstratnej. Została opracowana w 1952 roku przez Amerykanina Davida Huffmana.RPM Package Manager (dawniej też Red Hat Package Manager, skrót RPM) – program służący do zarządzania (instalacji, aktualizacji, usuwania) pakietami zawierającymi oprogramowanie lub dane, oraz nazwa tych pakietów (ponieważ mają one rozszerzenie .rpm). Pakiety RPM zawierają skompresowane (we wczesnych wersjach gzipem, w nowszych bzipem2 albo LZMA) archiwum cpio zawierające dane. Posiadają także dodatkowe informacje na temat zawartości, m.in. zależności (ang. dependencies) - czyli spis programów (bibliotek) lub pakietów, które są wymagane do zainstalowania i poprawnej pracy pakietu (działa to także w druga stronę - pakiety później zainstalowane wymagające danego pakietu, uniemożliwiają jego odinstalowanie), a także sugestie dotyczące współpracy z innymi pakietami.
    Kompresja bezstratna (ang. lossless compression) – ogólna nazwa metod kompresji informacji do postaci zawierającej zmniejszoną liczbę bitów, pod warunkiem, że metoda ta gwarantuje możliwość odtworzenia informacji z postaci skompresowanej do identycznej postaci pierwotnej.

    bzip2algorytm i program komputerowy będącego jedną z jego implementacji, do bezstratnej kompresji danych. Jest on dostępny na licencji analogicznej do licencji BSD.

    Bzip2 jest popularny w systemach Unix i Linux. Zwykle jest używany do kompresji archiwów tar, często używanych do rozpowszechniania oprogramowania. Nowe wersje RPM korzystają z bzip2 (poprzednio gzip) do kompresji archiwum cpio. Obecnie bzip2 zastępuje się przez wydajniejsze i szybsze w dekompresji algorytmy takie jak LZMA pochodzące z programu 7-Zip.

    Pamięć operacyjna (ang. internal memory, primary storage) – pamięć adresowana i dostępna bezpośrednio przez procesor, a nie przez urządzenia wejścia-wyjścia procesora. W pamięci tej mogą być umieszczane rozkazy (kody operacji) procesora (program) dostępne bezpośrednio przez procesor i stąd nazwa pamięć operacyjna. W Polsce często pamięć ta jest utożsamiana z pamięcią RAM, choć jest to zawężenie pojęcia, pamięcią operacyjną jest też pamięć nieulotna (ROM, EPROM i inne jej odmiany) dostępna bezpośrednio przez procesor, a dawniej używano pamięci o dostępie cyklicznym.tar (nazwa pochodzi od angielskiego Tape ARchiver – ARchiwizator Taśmowy) - uniksowy program do umieszczania grupy plików w jednym zbiorczym pliku (tzw. archiwum), który następnie może zostać skompresowany programami gzip, bzip2, compress lub lzma, co daje odpowiednio pliki .tar.gz (w skrócie .tgz), .tar.bz2, .tar.Z, i .tar.lzma. Istnieją również inne algorytmy kompresji które można zastosować po spakowaniu przy pomocy programu tar (narzędzia takie wtedy są prostsze, ponieważ nie muszą zajmować się nazwami plików, dowiązaniami, katalogami, prawami dostępu, co wykonuje sam program tar, i pozostawiając sobie kompresje tylko jednego pliku/strumienia). Dodawany do archiwum tar plik jest zawsze umieszczany na jego końcu.

    Algorytm[ | edytuj kod]

    Program kompresuje bloki danych o rozmiarach od 100 do 900 kilobajtów, w skokach co 100 kilobajtów. Każdy blok jest transformowany za pomocą transformaty Burrowsa-Wheelera, następnie przekształcany przez algorytm Move To Front, a w końcu kompresowany za pomocą algorytmu Huffmana.

    cpio jest archiwizatorem plików i formatem plików. Oprogramowanie cpio zostało stworzone by archiwizować dane na taśmach magnetycznych i jako taki, był częścią PWB/UNIX, jak również częścią UNIX System III i UNIX Systemu V. Jednak użycie formatu tar, jego szeroko dostępnego odpowiednika, zostało uznane za lepszy wybór. Dzięki wykorzystaniu formatu cpio przez pakiet RPM Package Manager (jest jego częścią), cpio nadal jest ważnym formatem pliku.Unix Time-Sharing System (pisane również jako UNIX, choć nie jest to skrót – nazwa „UNIX” jest kalamburem określenia Multics, który był wzorem dla Uniksa) – system operacyjny rozwijany od 1969 r. w Bell Labs (UNIX System Laboratories, USL) przez Dennisa Ritchie i Kena Thompsona. W latach 70. i 80. zdobył bardzo dużą popularność, co zaowocowało powstaniem wielu odmian i implementacji. Część z nich, w szczególności Linux oraz OS X, jest w użyciu do dziś. UNIX jest zarejestrowanym znakiem towarowym The Open Group.

    Bzip2 osiąga znacznie lepsze (zwykle o 10%–20%) wyniki niż algorytmy strumieniowe typu deflate.

    Program potrzebuje do 8 megabajtów pamięci do kompresji i do 4 do dekompresji. Jest dostępny także wolniejszy, lecz zużywający mniej pamięci tryb dekompresji, który potrzebuje 2,5 megabajta. Dane te dotyczą bloków 900 kilobajtowych, dla mniejszych rozmiarów bloków zużycie pamięci jest proporcjonalnie mniejsze.

    7-Zip – archiwizer o otwartym kodzie źródłowym przeznaczony dla systemu operacyjnego Windows. Rozpowszechniany jest na licencji LGPL. Transformata Burrowsa-Wheelera to algorytm użyteczny przy bezstratnej kompresji danych. Dane po przetworzeniu tą transformacją dają się znacznie lepiej skompresować za pomocą klasycznych algorytmów kompresji. Operuje ona na blokach, przy czym jest tym efektywniejsza im bloki te są większe. Zazwyczaj używa się bloków o rozmiarach kilkuset kilobajtów.

    Bzip2 używa własnych algorytmów sortowania bloków do transformaty Burrowsa-Wheelera, które są zazwyczaj bardziej efektywne od standardowych.

    Linki zewnętrzne[ | edytuj kod]

  • Witryna bzip2
  • Parallel BZIP2 (implementacja na architektury SMP)




  • Warto wiedzieć że... beta

    Kilobajt (KB, rzadziej kB, ang. Kbyte, kbyte, kilobyte) – jednostka używana w informatyce do określenia ilości informacji lub wielkości pamięci.
    Algorytm – w matematyce skończony ciąg jasno zdefiniowanych czynności, koniecznych do wykonania pewnego rodzaju zadań. Słowo "algorytm" pochodzi od starego angielskiego słowa algorism, oznaczającego wykonywanie działań przy pomocy liczb arabskich (w odróżnieniu od abacism – przy pomocy abakusa), które z kolei wzięło się od nazwiska, które nosił Muhammad ibn Musa al-Chuwarizmi (أبو عبد الله محمد بن موسى الخوارزمي), matematyk perski z IX wieku.
    Move To Front (MTF) – prosta transformacja strumienia danych, używana jako część niektórych procesów kompresji, której zastosowanie może spowodować zmniejszenie entropii. Co za tym idzie, algorytmy kompresji zależne od tej własności (kodowanie Shannona, Shannona-Fano, Huffmana, arytmetyczne) dadzą lepsze wyniki; może także wyprodukować sekwencje lepiej kompresowane metodą RLE.
    Oprogramowanie (ang. software) – całość informacji w postaci zestawu instrukcji, zaimplementowanych interfejsów i zintegrowanych danych przeznaczonych dla komputera do realizacji wyznaczonych celów. Celem oprogramowania jest przetwarzanie danych w określonym przez twórcę zakresie. Oprogramowanie to dział informatyki. Oprogramowanie jest synonimem terminów program komputerowy oraz aplikacja, przy czym stosuje się go zazwyczaj do określania większych programów oraz ich zbiorów.
    LZMA (ang. Lempel-Ziv-Markov chain-Algorithm) – algorytm kompresji bezstratnej opracowany przez Igora Pawłowa w latach 1999-2001.
    Licencja BSD (Berkeley Software Distribution License, BSDL) – jedna z licencji zgodnych z zasadami Wolnego Oprogramowania. Powstała na Uniwersytecie Kalifornijskim w Berkeley.
    SMP (ang. Symmetric Multiprocessing, przetwarzanie symetryczne) - architektura komputerowa, która pozwala na znaczne zwiększenie mocy obliczeniowej systemu komputerowego poprzez wykorzystanie 2 lub więcej procesorów do jednoczesnego wykonywania zadań.

    Reklama

    Czas generowania strony: 0.596 sek.