Kódování textových informací v počítači

Počítač je složité zařízení, pomocí kterého můžete vytvářet, převádět a ukládání informací. Počítač však nefunguje zcela srozumitelně - grafické, textové a číselné údaje jsou uloženy jako pole binárních čísla. V tomto článku se podíváme na kódování textových informací.

Co je pro nás text, je posloupnost symbolů pro počítač. Každý symbol představuje specifický soubor nul a jeden. Symboly znamenají nejen malá písmena a velká písmena dopisy latinské abecedy, ale i interpunkční znaménka, aritmetické značky, symboly služeb, speciální symboly a dokonce i prostor.

Binární kódování textových informací

Když je stisknuto určité tlačítko, do interního řadiče se přenese elektrický signál, který je převeden na binární kód. Kód je přizpůsoben konkrétnímu znaku, který je zobrazen. Představovat latinské abecedy V digitálním formátu byl vytvořen mezinárodní kódovací systém ASCII. Vyžaduje jeden bajt pro psaní jednoho znaku, proto symbol se skládá z osmimístné posloupnosti nul a jednoho. Interval záznamu je od 00000000 do 11111111, to znamená, že kódování textových informací pomocí tohoto systému umožňuje prezentaci 256 symbolů. Ve většině případů to stačí. binární kódování textových informací

ASCII je rozdělen na dvě části. Prvních 127 znaků (od 00000000 do 01111111) jsou mezinárodní a představují specifické znaky a písmena anglické abecedy. Druhá část - rozšíření (od 10 000 000 do 11 11 11 11) - má představovat národní abecedu, jejíž psaní se liší od latiny.

Kódování textové informace v ASCII je postavena na principu rostoucí posloupnosti, tj, že čím větší je počet posloupnost písmen, tím vyšší je hodnota jeho ASCII-kódu. Údaje a ruská část tabulky jsou postaveny na stejném principu.

Na světě však existuje několik typů kódování pro cyrilická písmena. Nejběžnější - je KOI-8 (osm bitů kódování, který byl použit v 70. letech v první ruifitsirovannyh operačním systému Unix), ISO 8859-5 (vyvinutý Mezinárodní normalizační úřadu), CP 1251 (kódování textové informace použité v kódování a zpracování textových informací moderní operační systém Windows), stejně jako 2-byte kódování Unicode, které můžete odeslat 65 536 znaků. Taková různorodost kódování je způsobena skutečností, že byly vyvinuty v různých časech, pro různé operační systémy a z různých důvodů. Kvůli tomu dochází často k potížím s přenášením textu z jednoho média do jiného - pokud kódování neodpovídá, uživatel uvidí pouze sadu nepochopitelných ikon. Jak můžete tuto situaci napravit? V aplikaci Word například při otevření dokumentu obdržíte zprávu o problémech s zobrazováním textu a nabízí několik možností pro překódování.

Kódování a zpracování textových informací v hloubkách počítače je tedy spíše komplikovaný a časově náročný proces. Všechny symboly libovolné abecedy představují pouze určitou posloupnost čísel binární systém, jedna buňka je jeden byte informací.

Sdílet na sociálních sítích:

Podobné