ASCII

Z Wikipedii, wolnej encyklopedii
Przejdź do nawigacji Przejdź do wyszukiwania
94 znaki drukowalne możliwe do zapisania w kodzie ASCII
Tabela kodu ASCII z instrukcji obsługi drukarki pochodzącej sprzed 1972 roku (b1 oznacza najmniej znaczący bit)

ASCII (czyt. aski, skrót od ang. American Standard Code for Information Interchange) – siedmiobitowy system kodowania znaków, używany we współczesnych komputerach oraz sieciach komputerowych, a także innych urządzeniach wyposażonych w mikroprocesor. Przyporządkowuje liczbom z zakresu 0−127: litery alfabetu łacińskiego języka angielskiego, cyfry, znaki przestankowe i inne symbole oraz polecenia sterujące. Na przykład litera „a” jest kodowana jako liczba 97, a znak spacji jest kodowany jako 32. Większość współczesnych systemów kodowania znaków jest rozszerzeniem standardu ASCII.

Unicode – komputerowy zestaw znaków mający w zamierzeniu obejmować wszystkie pisma używane na świecie. Definiują go dwa standardy – Unicode oraz ISO 10646. Znaki obu standardów są identyczne. Standardy te różnią się w drobnych kwestiach, m.in. Unicode określa sposób składu.ISO/IEC 8859 – zestaw standardów służących do kodowania znaków za pomocą 8 bitów. Standardy te zostały utworzone przez European Computer Manufacturers Association w połowie lat osiemdziesiątych, po czym zostały uznane przez Międzynarodową Organizacją Normalizacyjną.

ASCII jest tradycyjną nazwą tego zestawu znaków, jednak IANA zaleca używanie określenia US-ASCII, które podkreśla pochodzenie standardu, oraz to, pod kątem jakich znaków był projektowany (ASCII nie zawiera na przykład liter diakrytyzowanych, powszechnych w alfabetach europejskich).

ASCII znajduje się na liście kamieni milowych IEEE.

Base85 (inne nazwy Ascii85, Z85) – rodzaj kodowania transportowego umożliwiającego przekazywanie binarnych danych w środowisku, w którym dopuszczalne jest używanie jedynie znaków ASCII. Internet Engineering Task Force to nieformalne, międzynarodowe stowarzyszenie osób zainteresowanych ustanawianiem standardów technicznych i organizacyjnych w Internecie.

Przegląd[ | edytuj kod]

Standard ASCII został stworzony na podstawie kodu telegraficznego. Prace nad nim rozpoczęły się 6 października 1960 roku, podczas pierwszego spotkania grupy X3.2 American National Standards Institute (ANSI). Trzy lata później, w 1963 roku, została udostępniona pierwsza wersja standardu ASCII. W porównaniu do wcześniejszych systemów kodowania znaków, ten zestaw znaków był wygodny w użyciu do sortowania alfabetycznego tekstów, zmiany wielkości znaków, a także wspierał urządzenia inne niż dalekopisy. Od czasu wprowadzenia na rynek, ASCII został czterokrotnie zaktualizowany – w 1967, 1968, 1977 i 1986 roku.

Komputer (z ang. computer od łac. computare – liczyć, sumować; dawne nazwy używane w Polsce: mózg elektronowy, elektroniczna maszyna cyfrowa, maszyna matematyczna) – maszyna elektroniczna przeznaczona do przetwarzania informacji, które da się zapisać w formie ciągu cyfr albo sygnału ciągłego.Mikroprocesor – układ cyfrowy wykonany jako pojedynczy układ scalony o wielkim stopniu integracji (LSI) zdolny do wykonywania operacji cyfrowych według dostarczonego ciągu instrukcji.

Każdy znak w kodzie ASCII jest przedstawiany jako 7-bitowa liczba całkowita. 95 spośród nich stanowią znaki drukowalne: małe i wielkie litery alfabetu łacińskiego, cyfry, znaki przestankowe oraz inne symbole. Standard ten został stworzony do obsługi języka angielskiego, dlatego pośród liter, które znajdują się w tabeli, nie ma żadnych diakrytyzowanych. Większość znaków sterujących jest dzisiaj przestarzała – zostały one pomyślane głównie dla dalekopisów.

Kareta (ang. caret) – nazwa symbolu ^ (czasami nazywanego daszkiem lub dzióbkiem). W Standardzie Unicode ma kod U+005E, a w ASCII ma szesnastkowy kod 5E.RFC (ang. Request for Comments – dosłownie: prośba o komentarze) – zbiór technicznych oraz organizacyjnych dokumentów mających formę memorandum związanych z Internetem oraz sieciami komputerowymi. Każdy z nich ma przypisany unikatowy numer identyfikacyjny, zwykle używany przy wszelkich odniesieniach. Publikacją RFC zajmuje się Internet Engineering Task Force.

Standard ASCII był najpopularniejszym zestawem znaków używanym w internecie do grudnia 2007, kiedy to został zastąpiony przez UTF-8. Kodowanie UTF-8 jest wstecznie kompatybilne z ASCII.

Historia[ | edytuj kod]

Kod ASCII został opublikowany jako standard ASA X3.4-1963. Zestaw znaków w niewielkim stopniu różnił się od obecnego. Nieprzypisana była 1 sekwencja sterująca oraz 28 pozycji zarezerwowanych do późniejszego wykorzystania. W grupie roboczej toczyła się dyskusja, czy należy do kodu wprowadzić małe litery, czy też więcej znaków sterujących. W maju 1963 zadecydowano, by tzw. patyki szósty i siódmy wypełnić małymi literami alfabetu łacińskiego. Spowodowało to, że między wielką a małą literą jest tylko jeden bit różnicy (np. literze „A” jest przyporządkowany kod 65 (1000001), a „a” – 97 (1100001)), co ułatwiało konstruowanie klawiatur oraz porównywanie tekstów nieuwzględniające wielkości liter. Ta zmiana weszła do standardu ASCII dopiero w 1967 roku.

CP852 (Code page 852, CP 852, IBM 852, OEM 852, MS-DOS Latin 2, PC Latin 2, Slavic (Latin II)) – 8-bitowe kodowanie znaków stosowane w systemach operacyjnych MS-DOS, PC-DOS, DR-DOS i FreeDOS, w zamyśle mające zawierać znaki języków krajów Europy Wschodniej opartych na alfabecie łacińskim. Analogicznie jak w przypadku kodowania CP850, niektóre litery ze znakami diakrytycznymi zastąpiły niektóre istniejące w CP437 znaki semigrafiki i symbole matematyczne. Od czasu rozpowszechnienia się systemów operacyjnych Windows 3.x, a zwłaszcza Windows 95 i Windows NT 4.0, wykorzystujących kodowanie Windows-1250 i (w różnym stopniu) unikod, znaczenie kodowania CP852 zaczęło bardzo szybko maleć, choć nadal jest ono wykorzystywane w aplikacjach pisanych dla systemu operacyjnego DOS lub nie posiadających interfejsu graficznego (przeznaczonych do uruchamiania w oknie DOS względnie oknie konsoli), w tym programach księgowych, magazynowych itp.Litera – znak graficzny charakterystyczny dla pism fonetycznych. Może wyrażać pojedynczą głoskę, sylabę lub wchodzić w skład innych połączeń - np. dwuznaków. W języku francuskim zestaw nawet pięciu liter może oznaczać jedną głoskę.

Do standardu ASCII z 1963 roku zostały wprowadzone jeszcze następujące zmiany:

 • wprowadzenie znaków takich jak nawiasy klamrowe oraz kreska pionowa,
 • zmiana nazwy niektórych kodów kontrolnych (np. SOM zmieniono na SOH),
 • przeniesienie lub usunięcie niektórych znaków kontrolnych (np. usunięto RU).
 • Standard ASCII był uaktualniany czterokrotnie – w latach 1967, 1968, 1977 i 1986. Przygotowany został także piąty standard – z 1965 roku, ale nie został opublikowany (mimo wszystko był używany przez niektóre maszyny IBM).

  Norma ISO/IEC 10646 opisuje uniwersalny zestaw znaków (UCS – Universal Character Set) służący do opisu znaków (liter, cyfr, symboli, ideogramów itd.) z wielu języków, pism i tradycji na świecie. Zestaw zawiera około 100 000 abstrakcyjnych znaków, z których każdy posiada unikalną nazwę i kod znaku.Karta dziurkowana, karta perforowana - nośnik danych stosowany do zapisu informacji w maszynach z automatycznym przetwarzaniem danych. Używana do programowania komputera począwszy od ich konstrukcji aż do lat 80. XX wieku, stosowana współcześnie z papierową taśmą dziurkowaną.


  Podstrony: 1 [2] [3] [4] [5]
  Warto wiedzieć że... beta

  ITU-T – Sektor Normalizacji Telekomunikacji ITU (ang.: International Telecommunication Union - Telecommunication Standardization Sector)
  Biblioteka Kongresu Stanów Zjednoczonych (ang.: Library of Congress) – największa biblioteka świata. Gromadzi ponad 142 mln różnego rodzaju dokumentów, ponad 29 mln książek, 58 mln rękopisów, 4,8 mln map i atlasów, 12 mln fotografii, 6 mln mikrofilmów, 3,5 mln dokumentów muzycznych, 500.000 filmów; wszystko w ponad 460 językach. 7% zbiorów to dokumenty w językach słowiańskich, w tym największy w USA zbiór polskich książek. Całość zajmuje 856 km półek. Biblioteka dysponuje (w 3 budynkach) 22 czytelniami ogólnymi, 3 wydzielonymi czytelniami dla kongresmenów oraz biblioteką sztuki (John F. Kennedy Center). Zatrudnia 5 tysięcy pracowników. Wyposażona jest w system komputerowy o pojemności 13 mln rekordów oraz w 3000 terminali. Pełni funkcję biblioteki narodowej.
  Library of Congress Control Number (LCCN) – numer nadawany elementom skatalogowanym przez Bibliotekę Kongresu wykorzystywany przez amerykańskie biblioteki do wyszukiwania rekordów bibliograficznych w bazach danych i zamawiania kart katalogowych w Bibliotece Kongresu lub u innych komercyjnych dostawców.
  ASCII-Art to sposób tworzenia bardzo prostych rysunków w programach komputerowych, w których pracuje się z tekstem (np. edytory, programy pocztowe, itp.). Rysunki te są układane za pomocą zwykłych znaków ASCII, stawianych na obszarze o stałej szerokości kolumn (stałej ilości znaków w każdym wierszu) oraz o stałej wysokości znaków (tym samym stopniu pisma). Tego typu sposób tworzenia grafiki, a raczej jej symbolizowania, nosi nazwę semigrafiki. Pierwotnie rysunki ASCII-Art tworzono w programach pracujących w trybie tekstowym, z czasem zaczęto tworzyć je również w programach pracujących w trybie graficznym, wykorzystując fonty o stałym kroju pisma.
  ISO 8859-2 lub bardziej formalnie ISO/IEC 8859-2, również znane jako Latin-2, bądź "środkowo–" i "wschodnioeuropejskie", jest drugą częścią standardu kodowania znaków zdefiniowanego przez organizację ISO. Składa się ze 191 znaków łacińskiego pisma, z czego każdy jest zapisywany przy pomocy ośmiu bitów. Na jego podstawie została utworzona Polska Norma (PN-93/T-42118) opisująca kodowanie polskich znaków diakrytycznych w kodach 8 bitowych.
  Szesnastkowy system liczbowy, system heksadecymalny, hex – pozycyjny system liczbowy, w którym podstawą jest liczba 16. Skrót hex pochodzi od angielskiej nazwy hexadecimal. Do zapisu liczb w tym systemie potrzebne jest szesnaście znaków (cyfr szesnastkowych).
  Interpunkcja – graficzny odpowiednik intonacji, rytmu i tempa mowy, akcentu wyrazowego i zdaniowego. Stanowi ją zbiór znaków (we współczesnej polszczyźnie jest ich 10), inaczej zwanych znakami przestankowymi, uzupełniających zapis literowy tekstu. Nie odpowiadają one ani fonemom języka mówionego, ani leksemom. Znaki te pozwalają na odzwierciedlenie w tekście pisanym zależności składniowych między członami wypowiedzenia lub między wypowiedzeniami, na wyodrębnienie, podkreślenie – ze względów znaczeniowych lub emocjonalnych – pewnych wyrazów lub fragmentów tekstu, a także na ujednoznacznienie tekstu pisanego.

  Reklama