• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Unicode



    Podstrony: 1 [2] [3] [4]
    Przeczytaj także...
    Zestaw znaków to zestawienie znaków pisma z odpowiadającymi im kodami liczbowymi. Tabelę taką można następnie wykorzystać do przekształcenia tekstu na postać cyfrową, w szczególności w komputerze.Klawisz Alt – na typowej klawiaturze komputerowej klawisz znajdujący się po obu stronach spacji. Wykorzystywany jest jako klawisz modyfikatora, do zmiany funkcji innych klawiszy. W większości klawiatur w układzie non-US zamiast drugiego klawisza Alt występuje prawie identyczny klawisz AltGr (po prawej stronie spacji).
    Logo Unikodu

    Unikod (ang. Unicode) – komputerowy zestaw znaków mający w zamierzeniu obejmować wszystkie pisma używane na świecie. Definiują go dwa standardy – Unicode oraz ISO 10646. Znaki obu standardów są identyczne. Standardy te różnią się w drobnych kwestiach, m.in. Unicode określa sposób składu.

    Rozwijany jest przez konsorcjum, w którego skład wchodzą ważne firmy komputerowe, producenci oprogramowania, instytuty naukowe, agencje międzynarodowe oraz grupy zainteresowanych użytkowników. Konsorcjum współpracuje z organizacją ISO.

    Międzynarodowa Organizacja Normalizacyjna, ISO (ang. International Organization for Standardization, fr. Organisation internationale de normalisation) – organizacja pozarządowa zrzeszająca krajowe organizacje normalizacyjne.Windows XP (nazwa kodowa Whistler) – wersja systemu operacyjnego Microsoft Windows z rodziny Windows NT (oparty na jądrze NT) firmy Microsoft, wydana oficjalnie 25 października 2001 roku. Koniec wsparcia technicznego dla tego systemu operacyjnego planowany jest na 8 kwietnia 2014.

    Spis treści

  • 1 Kodowanie Unicode
  • 2 Historia standardu
  • 3 Relacje do UCS
  • 4 Wprowadzanie znaków Unicode
  • 5 Nazewnictwo
  • 6 Przypisy
  • 7 Linki zewnętrzne
  • Kodowanie Unicode[edytuj kod]

    Standard Unicode obejmuje przydział przestrzeni numeracyjnej poszczególnym grupom znaków oraz sposoby bajtowego kodowania znaków. Jest kilka metod kodowania, oznaczanych skrótowcami UCS (Universal Character Set) i UTF (Unicode Transformation Format). Do najważniejszych należą:

  • UTF-32/UCS-4
  • UTF-16
  • UTF-8.
  • Mniej popularnymi kodowaniami Unicode są:

    Pismo – system umownych znaków, za pomocą których przedstawiany jest język mówiony. Jako jeden z ludzkich wynalazków intelektualnych jest środkiem porozumiewania się oraz odzwierciedleniem mowy i myśli. Zanim powstało pismo, do przekazywania mowy służyły obrazki, różne środki mnemotechniczne oraz zrozumiałe dla danej społeczności, przedtem uzgodnione i odpowiednio spreparowane, symbole. Pismo ewoluowało od najstarszego stadium – piktografii, poprzez ideografię, pismo analityczne, aż do najmłodszego – pisma fonetycznego.Komputer (z ang. computer od łac. computare – liczyć, sumować; dawne nazwy używane w Polsce: mózg elektronowy, elektroniczna maszyna cyfrowa, maszyna matematyczna) – maszyna elektroniczna przeznaczona do przetwarzania informacji, które da się zapisać w formie ciągu cyfr albo sygnału ciągłego.
  • UTF-7
  • UCS-2.
  • Istnieją również inne kodowania, stanowiące margines lub pozostające na etapie propozycji, na przykład:

  • UTF-9 i UTF-18
  • UTF-EBCDIC
  • UTF-6
  • UTF-5.
  • Kody pierwszych 256 znaków Unicode pokrywają się z kodami ISO Latin 1 (czyli ISO-8859-1), przez co kody pierwszych 128 znaków pokrywają się z ASCII. Należy jednak pamiętać, że jest to zbieżność wyłącznie numerów przyporządkowanych konkretnym znakom, natomiast wartości bajtów użytych do ich zapisania mogą (i w większości kodowań będą) różnić się od tych, które uzyska się stosując Latin 1 lub ASCII.

    Euro, ευρώ, евро (znak: €, kod ISO 4217: EUR) – nazwa przyjęta na posiedzeniu w Madrycie w grudniu 1995 roku – wspólna waluta europejska wprowadzona w miejsce walut krajowych. W formie gotówkowej została wprowadzona w obieg 1 stycznia 2002 r.Klawiatura komputerowa – uporządkowany zestaw klawiszy służący do ręcznego sterowania urządzeniem lub ręcznego wprowadzania danych. W zależności od spełnianej funkcji klawiatura zawiera różnego rodzaju klawisze – alfabetyczne, cyfrowe, znaków specjalnych, funkcji specjalnych, o znaczeniu definiowanym przez użytkownika.


    Podstrony: 1 [2] [3] [4]



    w oparciu o Wikipedię (licencja GFDL, CC-BY-SA 3.0, autorzy, historia, edycja)

    Warto wiedzieć że... beta

    CP852 (Code page 852, CP 852, IBM 852, OEM 852, MS-DOS Latin 2, PC Latin 2, Slavic (Latin II)) – 8-bitowe kodowanie znaków stosowane w systemach operacyjnych MS-DOS, PC-DOS, DR-DOS i FreeDOS, w zamyśle mające zawierać znaki języków krajów Europy Wschodniej opartych na alfabecie łacińskim. Analogicznie jak w przypadku kodowania CP850, niektóre litery ze znakami diakrytycznymi zastąpiły niektóre istniejące w CP437 znaki semigrafiki i symbole matematyczne. Od czasu rozpowszechnienia się systemów operacyjnych Windows 3.x, a zwłaszcza Windows 95 i Windows NT 4.0, wykorzystujących kodowanie Windows-1250 i (w różnym stopniu) unikod, znaczenie kodowania CP852 zaczęło bardzo szybko maleć, choć nadal jest ono wykorzystywane w aplikacjach pisanych dla systemu operacyjnego DOS lub nie posiadających interfejsu graficznego (przeznaczonych do uruchamiania w oknie DOS względnie oknie konsoli), w tym programach księgowych, magazynowych itp.
    Klawisz AltGr to jeden z klawiszy Alt na klawiaturze komputerowej, umieszczony jest po prawej stronie klawisza spacji. Występuje tylko w niektórych układach klawiatury. Używany jest w kombinacji z innymi klawiszami (których naciśnięcie wstawia znak pisarski) i służy do modyfikacji znaczenia klawisza. Przykładowo w przypadku układów klawiatur dla języków używających alfabetu łacińskiego wzbogaconego o litery ze znakami diakrytycznymi naciśnięcie klawisza AltGr i klawisza z literą łacińską zwykle skutkuje wstawieniem litery ze znakiem diakrytycznym opartej na tej literze łacińskiej (AltGr+A daje znak ą itd.).
    Producent – osoba lub przedsiębiorstwo produkujące towary w celu ich sprzedaży na rynku. Celem producenta jest zwykle maksymalizacja udziału jego produktów w rynku, a co za tym idzie maksymalizacja zysków.
    UTF-7 (ang. 7-bit Unicode Transformation Format) – sposób zapisu tekstu w formacie Unicode przy użyciu zmiennej liczby znaków ASCII, nadający się na przykład do użycia w wiadomościach MIME.
    UTF-16 (ang. 16-bit Unicode Transformation Format) – w informatyce jeden ze sposobów kodowania znaków standardu unicode. Sposób ten wymaga użycia szesnastobitowych słów (ang. word), przy czym dla znaków na pozycjach poniżej 65536 (przedział 0000-FFFF) używane jest jedno słowo, którego wartość odpowiada pozycji znaku w standardzie. Dla znaków z wyższych pozycji używa się dwóch słów. Pierwsze z nich należy do przedziału D800–DBFF, drugie: DC00-DFFF. Na przykład znak o kodzie szesnastkowym 10000 zostanie zamieniony na sekwencję D800 DC00 a znak o kodzie 10FFFD (górna granica unikodu) na DBFF DFFD. W standardzie Unicode pozycjom z przedziału D800–DFFF nie są przypisane żadne znaki, zatem każda sekwencja słów kodowych jest interpretowana jednoznacznie.
    ISO 8859-1, lub bardziej formalnie ISO/IEC 8859-1, czy też Latin-1, bądź "zachodnioeuropejskie", jest pierwszą częścią ISO/IEC 8859 – standardu kodowania znaków ustalonego przez Międzynarodową Organizację Normalizacyjną, a później wspólnie utrzymywanym przez ISO i IEC. Standard po rozszerzeniu o dodatkowe przypisania znaków, jest podstawą dla dwóch powszechnie używanych mapowań znaków, znanych jako ISO-8859-1 (proszę zauważyć dodatkowy łącznik) i Windows-1252.
    Konsorcjum to organizacja zrzeszająca kilka podmiotów gospodarczych na określony czas, w konkretnym celu. Konsorcja są tworzone najczęściej w przypadku bardzo dużych lub ryzykownych inwestycji.

    Reklama

    Czas generowania strony: 0.038 sek.