Unikod

Z Wikipedii, wolnej encyklopedii
(Przekierowano z Unicode)
Przejdź do nawigacji Przejdź do wyszukiwania
Logo Unikodu

Unikod (ang. Unicode) – komputerowy zestaw znaków mający w zamierzeniu obejmować wszystkie pisma używane na świecie. Definiują go dwa standardy – Unicode oraz ISO 10646. Znaki obu standardów są identyczne. Standardy te różnią się w drobnych kwestiach, m.in. Unicode określa sposób składu.

Międzynarodowa Organizacja Normalizacyjna, ISO (ang. International Organization for Standardization, fr. Organisation internationale de normalisation) – organizacja pozarządowa zrzeszająca krajowe organizacje normalizacyjne.Windows XP (nazwa kodowa Whistler) – wersja systemu operacyjnego Microsoft Windows z rodziny Windows NT (oparty na jądrze NT) firmy Microsoft, wydana oficjalnie 25 października 2001 roku. Koniec wsparcia technicznego dla tego systemu operacyjnego planowany jest na 8 kwietnia 2014.

Rozwijany jest przez konsorcjum, w którego skład wchodzą firmy wytwarzające sprzęt komputerowy, producenci oprogramowania, instytuty naukowe, agencje międzynarodowe oraz grupy użytkowników. Konsorcjum współpracuje z organizacją ISO.

Unikod pierwszych 128 znaków w zestawie pokrywa się z ASCII oraz unikod pierwszych 256 znaków pokrywa się z ISO 8859-1. Należy jednak pamiętać, że jest to zbieżność wyłącznie numerów przyporządkowanych konkretnym znakom, natomiast wartości bajtów użytych do ich zapisania w większości kodowań różni się od tych, które uzyska się stosując ASCII lub ISO 8859-1.

Pismo – system umownych znaków, za pomocą których przedstawiany jest język mówiony. Jako jeden z ludzkich wynalazków intelektualnych jest środkiem porozumiewania się oraz odzwierciedleniem mowy i myśli. Zanim powstało pismo, do przekazywania mowy służyły obrazki, różne środki mnemotechniczne oraz zrozumiałe dla danej społeczności, przedtem uzgodnione i odpowiednio spreparowane, symbole. Pismo ewoluowało od najstarszego stadium – piktografii, poprzez ideografię, pismo analityczne, aż do najmłodszego – pisma fonetycznego.Komputer (z ang. computer od łac. computare – liczyć, sumować; dawne nazwy używane w Polsce: mózg elektronowy, elektroniczna maszyna cyfrowa, maszyna matematyczna) – maszyna elektroniczna przeznaczona do przetwarzania informacji, które da się zapisać w formie ciągu cyfr albo sygnału ciągłego.

Nazewnictwo[ | edytuj kod]

Rada Języka Polskiego zaleca stosować „unikod” jako określenie na każdy system unifikacji kodowania liter.

Kodowanie Unicode[ | edytuj kod]

Standard Unicode obejmuje przydział przestrzeni numeracyjnej poszczególnym grupom znaków oraz sposoby bajtowego kodowania znaków. Jest kilka metod kodowania, oznaczanych skrótowcami UCS (Universal Character Set) i UTF (Unicode Transformation Format). Do najważniejszych należą:

Alt-kody (ang. Alt codes) – wszystkie znaki ze strony kodowej właściwej dla ustawionego języka klawiatury, w tym specjalne, standardowo niedostępne z klawiatury, takie jak symbole matematyczne, znaki z innych języków, symbole walut, proste znaki graficzne itp. oraz znaki sterujące. Alt-kody różnią się między sobą w zależności od systemu operacyjnego – występują różnice między takimi systemami jak MS-DOS, Windows, OS X, czy też Linux. Znaki te są dostępne poprzez przytrzymanie lewego klawisza alt oraz wpisanie cyfrowego kodu wybranego znaku w danym standardzie kodowania, przy pomocy klawiatury numerycznej. Przykładowo przytrzymanie klawisza alt w Windowsie i wprowadzenie kodu 0169 zwraca znak ©. Użycie w kodzie zera wiodącego ma znaczenie, gdyż w systemie ustawiana jest inna strona kodowa, np. „alt + 0135” daje „‡”, a „alt + 135” daje „ç”. Przytrzymanie wciśniętego klawisza alt i wpisanie liczby z zakresu 0–255 powoduje wstawienie znaku o tym numerze ze strony kodowej DOS właściwej dla ustawionego języka klawiatury (w przypadku polskiej klawiatury będzie to znak ze strony kodowej CP852), zaś wpisanie numeru poprzedzonego zerem – znaku ze strony kodowej Windows (w przypadku polskiej klawiatury będzie to znak ze strony kodowej Windows-1250).Klawiatura komputerowa – uporządkowany zestaw klawiszy służący do ręcznego sterowania urządzeniem lub ręcznego wprowadzania danych. W zależności od spełnianej funkcji klawiatura zawiera różnego rodzaju klawisze – alfabetyczne, cyfrowe, znaków specjalnych, funkcji specjalnych, o znaczeniu definiowanym przez użytkownika.
  • UTF-32/UCS-4
  • UTF-16
  • UTF-8.
  • Mniej popularnymi kodowaniami Unicode są:

  • UTF-7
  • UCS-2.
  • Istnieją również inne kodowania, stanowiące margines lub pozostające na etapie propozycji, na przykład:

  • UTF-9 i UTF-18
  • UTF-EBCDIC
  • UTF-6
  • UTF-5.


  • Podstrony: 1 [2] [3] [4]




    Warto wiedzieć że... beta

    CP852 (Code page 852, CP 852, IBM 852, OEM 852, MS-DOS Latin 2, PC Latin 2, Slavic (Latin II)) – 8-bitowe kodowanie znaków stosowane w systemach operacyjnych MS-DOS, PC-DOS, DR-DOS i FreeDOS, w zamyśle mające zawierać znaki języków krajów Europy Wschodniej opartych na alfabecie łacińskim. Analogicznie jak w przypadku kodowania CP850, niektóre litery ze znakami diakrytycznymi zastąpiły niektóre istniejące w CP437 znaki semigrafiki i symbole matematyczne. Od czasu rozpowszechnienia się systemów operacyjnych Windows 3.x, a zwłaszcza Windows 95 i Windows NT 4.0, wykorzystujących kodowanie Windows-1250 i (w różnym stopniu) unikod, znaczenie kodowania CP852 zaczęło bardzo szybko maleć, choć nadal jest ono wykorzystywane w aplikacjach pisanych dla systemu operacyjnego DOS lub nie posiadających interfejsu graficznego (przeznaczonych do uruchamiania w oknie DOS względnie oknie konsoli), w tym programach księgowych, magazynowych itp.
    Nationalencyklopedin – największa, szwedzka encyklopedia współczesna. Jej stworzenie było możliwe dzięki kredytowi w wysokości 17 mln koron, którego udzielił rząd szwedzki w 1980 roku i który został spłacony w 1990. Drukowana wersja składa się z 20 tomów i zawiera 172 tys. haseł. Wersja internetowa zawiera 260 tys. haseł (stan z czerwca 2005). Inicjatorem projektu był rząd szwedzki, który rozpoczął negocjacje z różnymi wydawcami. Negocjacje zakończyły się w 1985, kiedy na wydawcę został wybrany Bra Böcker z Höganäs. Encyklopedia miała uwzględniać kwestie genderowe i związane z ochroną środowiska. Pierwszy tom ukazał się w 1989 roku, ostatni w 1996. Dodatkowo w roku 2000 ukazały się trzy dodatkowe tomy. Encyklopedię zamówiło 54 tys. osób. W 1997 roku ukazało się wydanie elektroniczne na CD, a w 2000 pojawiło się wydanie internetowe, które jest uzupełniane na bieżąco.
    Biblioteka Narodowa Izraela (hebr. הספרייה הלאומית; dawniej: Żydowska Biblioteka Narodowa i Uniwersytecka, hebr. בית הספרים הלאומי והאוניברסיטאי) – izraelska biblioteka narodowa w Jerozolimie.
    Klawisz AltGr to jeden z klawiszy Alt na klawiaturze komputerowej, umieszczony jest po prawej stronie klawisza spacji. Występuje tylko w niektórych układach klawiatury. Używany jest w kombinacji z innymi klawiszami (których naciśnięcie wstawia znak pisarski) i służy do modyfikacji znaczenia klawisza. Przykładowo w przypadku układów klawiatur dla języków używających alfabetu łacińskiego wzbogaconego o litery ze znakami diakrytycznymi naciśnięcie klawisza AltGr i klawisza z literą łacińską zwykle skutkuje wstawieniem litery ze znakiem diakrytycznym opartej na tej literze łacińskiej (AltGr+A daje znak ą itd.).
    Encyklopedia Britannica (ang. Encyclopædia Britannica) – najstarsza wydawana do chwili obecnej i najbardziej prestiżowa encyklopedia angielskojęzyczna. Artykuły w niej zamieszczane uważane są powszechnie przez czytelników za obiektywne i wiarygodne.
    Library of Congress Control Number (LCCN) – numer nadawany elementom skatalogowanym przez Bibliotekę Kongresu wykorzystywany przez amerykańskie biblioteki do wyszukiwania rekordów bibliograficznych w bazach danych i zamawiania kart katalogowych w Bibliotece Kongresu lub u innych komercyjnych dostawców.
    Producent – osoba lub przedsiębiorstwo produkujące towary w celu ich sprzedaży na rynku. Celem producenta jest zwykle maksymalizacja udziału jego produktów w rynku, a co za tym idzie maksymalizacja zysków.

    Reklama