ASCII

Z Wikipedii, wolnej encyklopedii
Przejdź do nawigacji Przejdź do wyszukiwania
94 znaki drukowalne możliwe do zapisania w kodzie ASCII
Tabela kodu ASCII z instrukcji obsługi drukarki pochodzącej sprzed 1972 roku (b1 oznacza najmniej znaczący bit)

ASCII (czyt. aski, skrót od ang. American Standard Code for Information Interchange) – siedmiobitowy system kodowania znaków, używany we współczesnych komputerach oraz sieciach komputerowych, a także innych urządzeniach wyposażonych w mikroprocesor. Przyporządkowuje liczbom z zakresu 0−127: litery alfabetu łacińskiego języka angielskiego, cyfry, znaki przestankowe i inne symbole oraz polecenia sterujące. Na przykład litera „a” jest kodowana jako liczba 97, a znak spacji jest kodowany jako 32. Większość współczesnych systemów kodowania znaków jest rozszerzeniem standardu ASCII.

Unicode – komputerowy zestaw znaków mający w zamierzeniu obejmować wszystkie pisma używane na świecie. Definiują go dwa standardy – Unicode oraz ISO 10646. Znaki obu standardów są identyczne. Standardy te różnią się w drobnych kwestiach, m.in. Unicode określa sposób składu.ISO/IEC 8859 – zestaw standardów służących do kodowania znaków za pomocą 8 bitów. Standardy te zostały utworzone przez European Computer Manufacturers Association w połowie lat osiemdziesiątych, po czym zostały uznane przez Międzynarodową Organizacją Normalizacyjną.

ASCII jest tradycyjną nazwą tego zestawu znaków, jednak IANA zaleca używanie określenia US-ASCII, które podkreśla pochodzenie standardu, oraz to, pod kątem jakich znaków był projektowany (ASCII nie zawiera na przykład liter diakrytyzowanych, powszechnych w alfabetach europejskich).

ASCII znajduje się na liście kamieni milowych IEEE.

Base85 (inne nazwy Ascii85, Z85) – rodzaj kodowania transportowego umożliwiającego przekazywanie binarnych danych w środowisku, w którym dopuszczalne jest używanie jedynie znaków ASCII. Internet Engineering Task Force to nieformalne, międzynarodowe stowarzyszenie osób zainteresowanych ustanawianiem standardów technicznych i organizacyjnych w Internecie.

Przegląd[ | edytuj kod]

Standard ASCII został stworzony na podstawie kodu telegraficznego. Prace nad nim rozpoczęły się 6 października 1960 roku, podczas pierwszego spotkania grupy X3.2 American National Standards Institute (ANSI). Trzy lata później, w 1963 roku, została udostępniona pierwsza wersja standardu ASCII. W porównaniu do wcześniejszych systemów kodowania znaków, ten zestaw znaków był wygodny w użyciu do sortowania alfabetycznego tekstów, zmiany wielkości znaków, a także wspierał urządzenia inne niż dalekopisy. Od czasu wprowadzenia na rynek, ASCII został czterokrotnie zaktualizowany – w 1967, 1968, 1977 i 1986 roku.

Komputer (z ang. computer od łac. computare – liczyć, sumować; dawne nazwy używane w Polsce: mózg elektronowy, elektroniczna maszyna cyfrowa, maszyna matematyczna) – maszyna elektroniczna przeznaczona do przetwarzania informacji, które da się zapisać w formie ciągu cyfr albo sygnału ciągłego.Mikroprocesor – układ cyfrowy wykonany jako pojedynczy układ scalony o wielkim stopniu integracji (LSI) zdolny do wykonywania operacji cyfrowych według dostarczonego ciągu instrukcji.

Każdy znak w kodzie ASCII jest przedstawiany jako 7-bitowa liczba całkowita. 95 spośród nich stanowią znaki drukowalne: małe i wielkie litery alfabetu łacińskiego, cyfry, znaki przestankowe oraz inne symbole. Standard ten został stworzony do obsługi języka angielskiego, dlatego pośród liter, które znajdują się w tabeli, nie ma żadnych diakrytyzowanych. Większość znaków sterujących jest dzisiaj przestarzała – zostały one pomyślane głównie dla dalekopisów.

Kareta (ang. caret) – nazwa symbolu ^ (czasami nazywanego daszkiem lub dzióbkiem). W Standardzie Unicode ma kod U+005E, a w ASCII ma szesnastkowy kod 5E.RFC (ang. Request for Comments – dosłownie: prośba o komentarze) – zbiór technicznych oraz organizacyjnych dokumentów mających formę memorandum związanych z Internetem oraz sieciami komputerowymi. Każdy z nich ma przypisany unikatowy numer identyfikacyjny, zwykle używany przy wszelkich odniesieniach. Publikacją RFC zajmuje się Internet Engineering Task Force.

Standard ASCII był najpopularniejszym zestawem znaków używanym w internecie do grudnia 2007, kiedy to został zastąpiony przez UTF-8. Kodowanie UTF-8 jest wstecznie kompatybilne z ASCII.

Historia[ | edytuj kod]

Kod ASCII został opublikowany jako standard ASA X3.4-1963. Zestaw znaków w niewielkim stopniu różnił się od obecnego. Nieprzypisana była 1 sekwencja sterująca oraz 28 pozycji zarezerwowanych do późniejszego wykorzystania. W grupie roboczej toczyła się dyskusja, czy należy do kodu wprowadzić małe litery, czy też więcej znaków sterujących. W maju 1963 zadecydowano, by tzw. patyki szósty i siódmy wypełnić małymi literami alfabetu łacińskiego. Spowodowało to, że między wielką a małą literą jest tylko jeden bit różnicy (np. literze „A” jest przyporządkowany kod 65 (1000001), a „a” – 97 (1100001)), co ułatwiało konstruowanie klawiatur oraz porównywanie tekstów nieuwzględniające wielkości liter. Ta zmiana weszła do standardu ASCII dopiero w 1967 roku.

CP852 (Code page 852, CP 852, IBM 852, OEM 852, MS-DOS Latin 2, PC Latin 2, Slavic (Latin II)) – 8-bitowe kodowanie znaków stosowane w systemach operacyjnych MS-DOS, PC-DOS, DR-DOS i FreeDOS, w zamyśle mające zawierać znaki języków krajów Europy Wschodniej opartych na alfabecie łacińskim. Analogicznie jak w przypadku kodowania CP850, niektóre litery ze znakami diakrytycznymi zastąpiły niektóre istniejące w CP437 znaki semigrafiki i symbole matematyczne. Od czasu rozpowszechnienia się systemów operacyjnych Windows 3.x, a zwłaszcza Windows 95 i Windows NT 4.0, wykorzystujących kodowanie Windows-1250 i (w różnym stopniu) unikod, znaczenie kodowania CP852 zaczęło bardzo szybko maleć, choć nadal jest ono wykorzystywane w aplikacjach pisanych dla systemu operacyjnego DOS lub nie posiadających interfejsu graficznego (przeznaczonych do uruchamiania w oknie DOS względnie oknie konsoli), w tym programach księgowych, magazynowych itp.Litera – znak graficzny charakterystyczny dla pism fonetycznych. Może wyrażać pojedynczą głoskę, sylabę lub wchodzić w skład innych połączeń - np. dwuznaków. W języku francuskim zestaw nawet pięciu liter może oznaczać jedną głoskę.

Do standardu ASCII z 1963 roku zostały wprowadzone jeszcze następujące zmiany:

  • wprowadzenie znaków takich jak nawiasy klamrowe oraz kreska pionowa,
  • zmiana nazwy niektórych kodów kontrolnych (np. SOM zmieniono na SOH),
  • przeniesienie lub usunięcie niektórych znaków kontrolnych (np. usunięto RU).
  • Standard ASCII był uaktualniany czterokrotnie – w latach 1967, 1968, 1977 i 1986. Przygotowany został także piąty standard – z 1965 roku, ale nie został opublikowany (mimo wszystko był używany przez niektóre maszyny IBM).

    Norma ISO/IEC 10646 opisuje uniwersalny zestaw znaków (UCS – Universal Character Set) służący do opisu znaków (liter, cyfr, symboli, ideogramów itd.) z wielu języków, pism i tradycji na świecie. Zestaw zawiera około 100 000 abstrakcyjnych znaków, z których każdy posiada unikalną nazwę i kod znaku.Biblioteka Narodowa Izraela (hebr. הספרייה הלאומית; dawniej: Żydowska Biblioteka Narodowa i Uniwersytecka, hebr. בית הספרים הלאומי והאוניברסיטאי) – izraelska biblioteka narodowa w Jerozolimie.


    Podstrony: 1 [2] [3] [4] [5]




    Warto wiedzieć że... beta

    Karta dziurkowana, karta perforowana - nośnik danych stosowany do zapisu informacji w maszynach z automatycznym przetwarzaniem danych. Używana do programowania komputera począwszy od ich konstrukcji aż do lat 80. XX wieku, stosowana współcześnie z papierową taśmą dziurkowaną.
    ITU-T – Sektor Normalizacji Telekomunikacji ITU (ang.: International Telecommunication Union - Telecommunication Standardization Sector)
    Biblioteka Kongresu Stanów Zjednoczonych (ang.: Library of Congress) – największa biblioteka świata. Gromadzi ponad 142 mln różnego rodzaju dokumentów, ponad 29 mln książek, 58 mln rękopisów, 4,8 mln map i atlasów, 12 mln fotografii, 6 mln mikrofilmów, 3,5 mln dokumentów muzycznych, 500.000 filmów; wszystko w ponad 460 językach. 7% zbiorów to dokumenty w językach słowiańskich, w tym największy w USA zbiór polskich książek. Całość zajmuje 856 km półek. Biblioteka dysponuje (w 3 budynkach) 22 czytelniami ogólnymi, 3 wydzielonymi czytelniami dla kongresmenów oraz biblioteką sztuki (John F. Kennedy Center). Zatrudnia 5 tysięcy pracowników. Wyposażona jest w system komputerowy o pojemności 13 mln rekordów oraz w 3000 terminali. Pełni funkcję biblioteki narodowej.
    Library of Congress Control Number (LCCN) – numer nadawany elementom skatalogowanym przez Bibliotekę Kongresu wykorzystywany przez amerykańskie biblioteki do wyszukiwania rekordów bibliograficznych w bazach danych i zamawiania kart katalogowych w Bibliotece Kongresu lub u innych komercyjnych dostawców.
    ASCII-Art to sposób tworzenia bardzo prostych rysunków w programach komputerowych, w których pracuje się z tekstem (np. edytory, programy pocztowe, itp.). Rysunki te są układane za pomocą zwykłych znaków ASCII, stawianych na obszarze o stałej szerokości kolumn (stałej ilości znaków w każdym wierszu) oraz o stałej wysokości znaków (tym samym stopniu pisma). Tego typu sposób tworzenia grafiki, a raczej jej symbolizowania, nosi nazwę semigrafiki. Pierwotnie rysunki ASCII-Art tworzono w programach pracujących w trybie tekstowym, z czasem zaczęto tworzyć je również w programach pracujących w trybie graficznym, wykorzystując fonty o stałym kroju pisma.
    ISO 8859-2 lub bardziej formalnie ISO/IEC 8859-2, również znane jako Latin-2, bądź "środkowo–" i "wschodnioeuropejskie", jest drugą częścią standardu kodowania znaków zdefiniowanego przez organizację ISO. Składa się ze 191 znaków łacińskiego pisma, z czego każdy jest zapisywany przy pomocy ośmiu bitów. Na jego podstawie została utworzona Polska Norma (PN-93/T-42118) opisująca kodowanie polskich znaków diakrytycznych w kodach 8 bitowych.
    Szesnastkowy system liczbowy, system heksadecymalny, hex – pozycyjny system liczbowy, w którym podstawą jest liczba 16. Skrót hex pochodzi od angielskiej nazwy hexadecimal. Do zapisu liczb w tym systemie potrzebne jest szesnaście znaków (cyfr szesnastkowych).

    Reklama