• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Unikod



    Podstrony: [1] 2 [3] [4]
    Przeczytaj także...
    Zestaw znaków to zestawienie znaków pisma z odpowiadającymi im kodami liczbowymi. Tabelę taką można następnie wykorzystać do przekształcenia tekstu na postać cyfrową, w szczególności w komputerze.Klawisz Alt – na typowej klawiaturze komputerowej klawisz znajdujący się po obu stronach spacji. Wykorzystywany jest jako klawisz modyfikatora, do zmiany funkcji innych klawiszy. W większości klawiatur w układzie non-US zamiast drugiego klawisza Alt występuje prawie identyczny klawisz AltGr (po prawej stronie spacji).
    Kodowanie Unicode[ | edytuj kod]

    Standard Unicode obejmuje przydział przestrzeni numeracyjnej poszczególnym grupom znaków oraz sposoby bajtowego kodowania znaków. Jest kilka metod kodowania, oznaczanych skrótowcami UCS (Universal Character Set) i UTF (Unicode Transformation Format). Do najważniejszych należą:

  • UTF-32/UCS-4
  • UTF-16
  • UTF-8.
  • Mniej popularnymi kodowaniami Unicode są:

    Międzynarodowa Organizacja Normalizacyjna, ISO (ang. International Organization for Standardization, fr. Organisation internationale de normalisation) – organizacja pozarządowa zrzeszająca krajowe organizacje normalizacyjne.Windows XP (nazwa kodowa Whistler) – wersja systemu operacyjnego Microsoft Windows z rodziny Windows NT (oparty na jądrze NT) firmy Microsoft, wydana oficjalnie 25 października 2001 roku. Koniec wsparcia technicznego dla tego systemu operacyjnego planowany jest na 8 kwietnia 2014.
  • UTF-7
  • UCS-2.
  • Istnieją również inne kodowania, stanowiące margines lub pozostające na etapie propozycji, na przykład:

  • UTF-9 i UTF-18
  • UTF-EBCDIC
  • UTF-6
  • UTF-5.
  • Kody pierwszych 256 znaków Unicode pokrywają się z kodami ISO Latin 1 (czyli ISO-8859-1), przez co kody pierwszych 128 znaków pokrywają się z ASCII. Należy jednak pamiętać, że jest to zbieżność wyłącznie numerów przyporządkowanych konkretnym znakom, natomiast wartości bajtów użytych do ich zapisania mogą (i w większości kodowań będą) różnić się od tych, które uzyska się stosując Latin 1 lub ASCII.

    Pismo – system umownych znaków, za pomocą których przedstawiany jest język mówiony. Jako jeden z ludzkich wynalazków intelektualnych jest środkiem porozumiewania się oraz odzwierciedleniem mowy i myśli. Zanim powstało pismo, do przekazywania mowy służyły obrazki, różne środki mnemotechniczne oraz zrozumiałe dla danej społeczności, przedtem uzgodnione i odpowiednio spreparowane, symbole. Pismo ewoluowało od najstarszego stadium – piktografii, poprzez ideografię, pismo analityczne, aż do najmłodszego – pisma fonetycznego.Komputer (z ang. computer od łac. computare – liczyć, sumować; dawne nazwy używane w Polsce: mózg elektronowy, elektroniczna maszyna cyfrowa, maszyna matematyczna) – maszyna elektroniczna przeznaczona do przetwarzania informacji, które da się zapisać w formie ciągu cyfr albo sygnału ciągłego.

    Historia standardu[ | edytuj kod]

  • 1991 Unicode 1.0.0 (październik)
  • 1993 Unicode 1.1.0 (czerwiec)
  • 1996 Unicode 2.0.0 (lipiec)
  • 1998 Unicode 2.1.2 (maj)
  • 1998 Unicode 2.1.5 (sierpień)
  • 1998 Unicode 2.1.8 (grudzień)
  • 1999 Unicode 2.1.9 (kwiecień)
  • 1999 Unicode 3.0.0 (wrzesień)
  • 2000 Unicode 3.0.1 (sierpień)
  • 2001 Unicode 3.1.0 (23 marca)
  • 2001 Unicode 3.1.1 (sierpień)
  • 2002 Unicode 3.2.0 (25 marca)
  • 2003 Unicode 4.0.0 (17 kwietnia)
  • 2004 Unicode 4.0.1 (marzec)
  • 2005 Unicode 4.1.0 (31 marca)
  • 2006 Unicode 5.0.0 (4 lipca) (ogłoszenie prasowe: 18 lipca)
  • 2008 Unicode 5.1.0 (15 marca) (ogłoszenie prasowe: 4 kwietnia)
  • 2009 Unicode 5.2.0 (1 października)
  • 2010 Unicode 6.0.0 (11 października), m. in. start standaryzacji emoji
  • 2012 Unicode 6.1.0 (31 stycznia)
  • 2012 Unicode 6.2.0 (26 września)
  • 2013 Unicode 6.3.0 (30 września)
  • 2014 Unicode 7.0 (16 czerwca)
  • 2015 Unicode 8.0 (17 czerwca)
  • 2016 Unicode 9.0 (czerwiec)
  • 2017 Unicode 10.0 (czerwiec)
  • 2018 Unicode 11.0 (czerwiec)
  • 2019 Unicode 12.0 (5 marca)
  • 2019 Unicode 12.1 (7 maja)
  • 2020 Unicode 13.0 (10 marca)
  • Alt-kody (ang. Alt codes) – wszystkie znaki ze strony kodowej właściwej dla ustawionego języka klawiatury, w tym specjalne, standardowo niedostępne z klawiatury, takie jak symbole matematyczne, znaki z innych języków, symbole walut, proste znaki graficzne itp. oraz znaki sterujące. Alt-kody różnią się między sobą w zależności od systemu operacyjnego – występują różnice między takimi systemami jak MS-DOS, Windows, OS X, czy też Linux. Znaki te są dostępne poprzez przytrzymanie lewego klawisza alt oraz wpisanie cyfrowego kodu wybranego znaku w danym standardzie kodowania, przy pomocy klawiatury numerycznej. Przykładowo przytrzymanie klawisza alt w Windowsie i wprowadzenie kodu 0169 zwraca znak ©. Użycie w kodzie zera wiodącego ma znaczenie, gdyż w systemie ustawiana jest inna strona kodowa, np. „alt + 0135” daje „‡”, a „alt + 135” daje „ç”. Przytrzymanie wciśniętego klawisza alt i wpisanie liczby z zakresu 0–255 powoduje wstawienie znaku o tym numerze ze strony kodowej DOS właściwej dla ustawionego języka klawiatury (w przypadku polskiej klawiatury będzie to znak ze strony kodowej CP852), zaś wpisanie numeru poprzedzonego zerem – znaku ze strony kodowej Windows (w przypadku polskiej klawiatury będzie to znak ze strony kodowej Windows-1250).Klawiatura komputerowa – uporządkowany zestaw klawiszy służący do ręcznego sterowania urządzeniem lub ręcznego wprowadzania danych. W zależności od spełnianej funkcji klawiatura zawiera różnego rodzaju klawisze – alfabetyczne, cyfrowe, znaków specjalnych, funkcji specjalnych, o znaczeniu definiowanym przez użytkownika.


    Podstrony: [1] 2 [3] [4]



    w oparciu o Wikipedię (licencja GFDL, CC-BY-SA 3.0, autorzy, historia, edycja)

    Warto wiedzieć że... beta

    CP852 (Code page 852, CP 852, IBM 852, OEM 852, MS-DOS Latin 2, PC Latin 2, Slavic (Latin II)) – 8-bitowe kodowanie znaków stosowane w systemach operacyjnych MS-DOS, PC-DOS, DR-DOS i FreeDOS, w zamyśle mające zawierać znaki języków krajów Europy Wschodniej opartych na alfabecie łacińskim. Analogicznie jak w przypadku kodowania CP850, niektóre litery ze znakami diakrytycznymi zastąpiły niektóre istniejące w CP437 znaki semigrafiki i symbole matematyczne. Od czasu rozpowszechnienia się systemów operacyjnych Windows 3.x, a zwłaszcza Windows 95 i Windows NT 4.0, wykorzystujących kodowanie Windows-1250 i (w różnym stopniu) unikod, znaczenie kodowania CP852 zaczęło bardzo szybko maleć, choć nadal jest ono wykorzystywane w aplikacjach pisanych dla systemu operacyjnego DOS lub nie posiadających interfejsu graficznego (przeznaczonych do uruchamiania w oknie DOS względnie oknie konsoli), w tym programach księgowych, magazynowych itp.
    Klawisz AltGr to jeden z klawiszy Alt na klawiaturze komputerowej, umieszczony jest po prawej stronie klawisza spacji. Występuje tylko w niektórych układach klawiatury. Używany jest w kombinacji z innymi klawiszami (których naciśnięcie wstawia znak pisarski) i służy do modyfikacji znaczenia klawisza. Przykładowo w przypadku układów klawiatur dla języków używających alfabetu łacińskiego wzbogaconego o litery ze znakami diakrytycznymi naciśnięcie klawisza AltGr i klawisza z literą łacińską zwykle skutkuje wstawieniem litery ze znakiem diakrytycznym opartej na tej literze łacińskiej (AltGr+A daje znak ą itd.).
    Library of Congress Control Number (LCCN) – numer nadawany elementom skatalogowanym przez Bibliotekę Kongresu wykorzystywany przez amerykańskie biblioteki do wyszukiwania rekordów bibliograficznych w bazach danych i zamawiania kart katalogowych w Bibliotece Kongresu lub u innych komercyjnych dostawców.
    Producent – osoba lub przedsiębiorstwo produkujące towary w celu ich sprzedaży na rynku. Celem producenta jest zwykle maksymalizacja udziału jego produktów w rynku, a co za tym idzie maksymalizacja zysków.
    Emoji (jap. 絵文字, przybliżona wymowa japońska: emodźi) – ideogram lub „buźka” stosowana w wiadomościach elektronicznych lub na stronach internetowych. Podobnie jak emotikony, emoji stosowane do wyrażania emocji i dzielą się na wiele rodzajów, w tym m.in. przedstawiające wyrazy twarzy, przedmioty, miejsca, rodzaje pogody oraz zwierzęta.
    UTF-7 (ang. 7-bit Unicode Transformation Format) – sposób zapisu tekstu w formacie Unicode przy użyciu zmiennej liczby znaków ASCII, nadający się na przykład do użycia w wiadomościach MIME.
    UTF-16 (ang. 16-bit Unicode Transformation Format) – w informatyce jeden ze sposobów kodowania znaków standardu unicode. Sposób ten wymaga użycia szesnastobitowych słów (ang. word), przy czym dla znaków na pozycjach poniżej 65536 (przedział 0000-FFFF) używane jest jedno słowo, którego wartość odpowiada pozycji znaku w standardzie. Dla znaków z wyższych pozycji używa się dwóch słów. Pierwsze z nich należy do przedziału D800–DBFF, drugie: DC00-DFFF. Na przykład znak o kodzie szesnastkowym 10000 zostanie zamieniony na sekwencję D800 DC00 a znak o kodzie 10FFFD (górna granica unikodu) na DBFF DFFD. W standardzie Unicode pozycjom z przedziału D800–DFFF nie są przypisane żadne znaki, zatem każda sekwencja słów kodowych jest interpretowana jednoznacznie.

    Reklama

    Czas generowania strony: 0.011 sek.