ASCII (americký standardní kód pro výměnu informací) - základní kódování textu pro latinskou abecedu
Podle Mezinárodní telekomunikační unie v roce 2016 tři a půl miliardy lidí využívalo internet s touto nebo takovou pravidelností. Většina z nich ani přemýšlet o tom, že veškeré zprávy odeslané na ně přes PC nebo mobilní gadgets, stejně jako texty, které jsou zobrazeny na monitorech všeho druhu, ve skutečnosti je kombinace 0 a 1. Tato funkce se nazývá kódovaná reprezentace informací. Poskytuje a velmi usnadňuje provádění jeho ukládání, zpracování a přenosu. V roce 1963 bylo vyvinuto americké kódování ASCII, které je předmětem tohoto článku.
Obsah
Prezentace informací v počítači
Z pohledu libovolného elektronického počítače je text sbírkou jednotlivých symbolů. Patří sem nejen písmena, včetně velkých písmen, ale také interpunkční znaménka, čísla. Kromě toho se používají speciální znaky "=", "", "(a").
Sada symbolů, které tvoří text, se nazývá abeceda a jejich počet je moc (označeno jako N). Pro jeho určení použijte výraz N = 2 ^ b, kde b je počet bitů nebo informační váha určitého symbolu.
Ukazuje se, že abeceda s kapacitou 256 znaků vám umožňuje představit všechny potřebné symboly.
Vzhledem k tomu, že 256 je osmá síla dvou, hmotnost každého symbolu je 8 bitů.
Jednotka měření 8 bitů se nazývá 1 bajt, takže je obvyklé to říkat binární kód Jakýkoli znak v textu uloženém v počítači zaujímá jeden bajt paměti.
Jak se provádí kódování
Veškeré texty jsou zadávány do paměti osobního počítače klávesami klávesnice, na kterých jsou napsána čísla, písmena, interpunkční znaménka a další symboly. V paměti RAM se přenášejí v binárním kódu, tj. Každý znak je shodný s obvyklým lidským desítkovým kódem od 0 do 255, což odpovídá binárnímu kódu - od 00000000 po 11111111.
Kódování znakových bajtů umožňuje, aby procesor provádějící zpracování textu přístupoval každý znak zvlášť. Současně stačí 256 znaků pro zobrazení všech informací o znaku.
Kódování znaků ASCII
Tato zkratka v angličtině znamená americký standardní kód pro výměnu informací.
Již při úsvitu výpočetní techniky bylo zřejmé, že můžete přijít s nejrůznějšími způsoby kódování informací. Avšak pro přenos informací z jednoho počítače do druhého bylo nutné vytvořit jednotný standard. Takže v roce 1963 v USA existovala tabulka kódování ASCII. V něm je jakýkoli symbol počítačové abecedy přiřazen sériové číslo v binární reprezentaci. Zpočátku bylo kódování ASCII používáno pouze ve Spojených státech a poté se stalo mezinárodním standardem pro PC.
Obsah tabulky
Kódy ASCII jsou rozděleny do dvou částí. Mezinárodní standard je pouze první polovinou této tabulky. Obsahuje symboly s pořadovými čísly od 0 (zakódované jako 00000000) do 127 (kód 01111111).
Pořadové číslo N | Kódování ASCII textu | Symbol |
0 - 31 | 0000 0000 - 0001 1111 | Symboly s číslem N od 0 do 31 se nazývají správci. Jejich funkcí je "řídit" proces výstupu textu na monitor nebo tiskové zařízení, dává zvukový signál atd. |
32 - 127 | 0010 0000 - 0111 1111 | Znaky s číslem N od 32 do 127 (standardní část tabulky) jsou velká a malá písmena latinské abecedy, 10 číslic, interpunkční znaménka, stejně jako různé závorky, komerční a další symboly. Symbol 32 označuje mezeru. |
128 až 255 | 1000 0000 - 1111 1111 | Symboly s číslem N od 128 do 255 (alternativní část tabulky nebo kódové stránky) mohou mít různé varianty, z nichž každá má své vlastní číslo. Kódová stránka se používá k zadání národních abeced, které se liší od latiny. Zejména je pomocí ASCII kódován pro ruské znaky. |
V kódovací tabulce jsou velká a malá písmena malá písmena jdou za sebou v abecedním pořadí a čísla - ve zvyšujících se hodnotách. Tento princip je také zachován pro ruskou abecedu.
Ovládací prvky
Tabulka kódování ASCII byla původně vytvořena pro příjem a přenos informací o zařízení, které nebylo delší dobu používáno, jako je teletyp. V tomto ohledu byly do sady znaků zahrnuty i netiskové, používané jako příkazy pro ovládání tohoto zařízení. Podobné příkazy byly použity v takových předkomputerových zprávách jako Morseovský kód atd.
Nejběžnější symbol teletypu je NUL (00, "nula"). Je stále používán ve většině programovacích jazyků, což označuje znak konce řádku.
Kde se používá kódování ASCII
Americký standardní kód je potřebný nejen pro psaní textových informací z klávesnice. Používá se také v grafické podobě. Obzvláště v programu ASCII Art Maker představují obrázky různých rozšíření řadu znakových znaků ASCII.
Podobné produkty jsou dva typy: provádění funkcí grafických editorů konverzí obrázků na text a konverze "výkresů" do grafiky ASCII. Například dobře známý smajlík je živým příkladem kódovacího symbolu.
ASCII lze také použít při vytváření dokumentu HTML. V takovém případě můžete zadat určitou sadu znaků a při zobrazení stránky se na obrazovce zobrazí symbol, který odpovídá tomuto kódu.
ASCII je také požadována pro vytváření vícejazyčných stránek, protože znaky, které nejsou součástí konkrétní národní tabulky, jsou nahrazeny kódy ASCII.
Některé funkce
Pro kódování textových informací v kódování ASCII bylo zpočátku použito 7 bitů (jedna byla prázdná), dnes však funguje jako 8bitová.
Písmena umístěná ve sloupcích v horní a spodní části se vzájemně liší pouze o jeden bit. To značně snižuje složitost ověřování.
Použití ASCII v sadě Microsoft Office
Je-li to nezbytné, lze tento typ kódování textových informací použít v textových editorech společnosti Microsoft, jako je například Poznámkový blok a Office Word. Při psaní však v tomto případě nebude možné používat některé funkce. Například nebudete moci vybrat výběr tučně, protože kódování ASCII zachovává pouze význam informací a ignoruje jeho obecný vzhled a tvar.
Standardizace
ISO přijala normy ISO 8859. Tato skupina definuje osmbitové kódování pro různé jazykové skupiny. Zejména ISO 8859-1 je rozšířená ASCII, která je tabulkou pro Spojené státy a země západní Evropy. A ISO 8859-5 je tabulka používaná pro cyrilika, včetně ruštiny.
Z mnoha historických důvodů nebyla norma ISO 8859-5 používána příliš dlouho.
Pro ruský jazyk se v současné době používá kódování:
- CP866 (kód Strana 866) nebo DOS, který se často nazývá alternativní kódovací GOST. Aktivně se používal až do poloviny 90. let minulého století. V tuto chvíli se téměř nepoužívá.
- KOI-8. Kódování bylo vytvořeno v letech 1970-80 a v současné době je standardem pro e-mailové zprávy v RuNetu. To je široce používán v operačním systému Unix rodiny, včetně Linuxu. "Ruská" verze KOI-8 se nazývá KOI-8R. Kromě toho existují verze pro jiné cyrilské jazyky, například ukrajinské.
- Kód Strana 1251 (CP 1251, Windows - 1251). Vyvinutý společností Microsoft Corporation pro podporu ruského jazyka v prostředí Windows.
Hlavní výhodou prvního standardu CP866 bylo zachování pseudo-grafických symbolů ve stejných pozicích jako v Extended ASCII. To umožnilo provozovat nezměněné textové programy, zahraniční produkci, jako je například slavný Norton Commander. V současné době se CP866 používá pro programy vyvinuté v systému Windows, které pracují v režimu celé obrazovky nebo v textových oknech, včetně FAR Manager.
Počítačové texty napsané v kódování CP866 jsou v poslední době vzácné, ale používají se pro názvy ruských souborů v "Vindous".
"Unicode"
V současné době je toto kódování nejrozšířenější. Unicode kódy jsou rozděleny do oblastí. První (od U + 0000 do U + 007F) obsahuje znaky sady ASCII s kódy. Poté sledujte oblasti značek různých národních scénářů, stejně jako interpunkční znaménka a technické symboly. Část kódů Unicode je navíc vyhrazena v případě, že je třeba v budoucnu zahrnout nové symboly.
Nyní víte, že v kódování ASCII je každá písmena reprezentována jako kombinace 8 nul a jedné. Laik, tato informace se může zdát zbytečná a nezajímavé, ale nechcete vědět, co se děje „v mozku“ počítače?!
- ASCII, symboly: popis, kódová tabulka a pohledy
- Způsob kódování informací pomocí čísel. Binární kódování
- Jaká je forma prezentace stejného typu údajů? Typy informací.
- Kódování a dekódování je obtížné?
- Rozšíření textového souboru: typy a hlavní aspekty určování zařazení programů
- Co je kódování a dekódování? Příklady. Metody kódování a dekódování informací číselných, textových…
- Proč je binární kódování univerzální? Programovací metody
- UTF-8 - kódování znaků
- Jaká je síla abecedy? Jak najít sílu abecedy: vzorec
- Informační objekt: definice, typy a funkce
- Htaccess (kódování): nastavení, příklady použití
- Kódování textu
- Existují dva způsoby, jak změnit kódování v aplikaci Word
- Dva způsoby, jak změnit kódování v aplikaci Word
- Teorie informací
- Hammingův kód. Kódování číselných informací
- Metody, typy informací, počítač, skladování a zpracování
- Co je Bodo kód? Popis technologie
- Binární kódy: recenze, komentáře, otázky, odpovědi
- Kódování html. Jak jsou webové stránky vymalovány
- Kódování textových informací v počítači