Kódování textových informací v počítači
Počítač je složité zařízení, pomocí kterého můžete vytvářet, převádět a ukládání informací. Počítač však nefunguje zcela srozumitelně - grafické, textové a číselné údaje jsou uloženy jako pole binárních čísla. V tomto článku se podíváme na kódování textových informací.
Co je pro nás text, je posloupnost symbolů pro počítač. Každý symbol představuje specifický soubor nul a jeden. Symboly znamenají nejen malá písmena a velká písmena dopisy latinské abecedy, ale i interpunkční znaménka, aritmetické značky, symboly služeb, speciální symboly a dokonce i prostor.
Binární kódování textových informací
Když je stisknuto určité tlačítko, do interního řadiče se přenese elektrický signál, který je převeden na binární kód. Kód je přizpůsoben konkrétnímu znaku, který je zobrazen. Představovat latinské abecedy V digitálním formátu byl vytvořen mezinárodní kódovací systém ASCII. Vyžaduje jeden bajt pro psaní jednoho znaku, proto symbol se skládá z osmimístné posloupnosti nul a jednoho. Interval záznamu je od 00000000 do 11111111, to znamená, že kódování textových informací pomocí tohoto systému umožňuje prezentaci 256 symbolů. Ve většině případů to stačí.
ASCII je rozdělen na dvě části. Prvních 127 znaků (od 00000000 do 01111111) jsou mezinárodní a představují specifické znaky a písmena anglické abecedy. Druhá část - rozšíření (od 10 000 000 do 11 11 11 11) - má představovat národní abecedu, jejíž psaní se liší od latiny.
Kódování textové informace v ASCII je postavena na principu rostoucí posloupnosti, tj, že čím větší je počet posloupnost písmen, tím vyšší je hodnota jeho ASCII-kódu. Údaje a ruská část tabulky jsou postaveny na stejném principu.
Na světě však existuje několik typů kódování pro cyrilická písmena. Nejběžnější - je KOI-8 (osm bitů kódování, který byl použit v 70. letech v první ruifitsirovannyh operačním systému Unix), ISO 8859-5 (vyvinutý Mezinárodní normalizační úřadu), CP 1251 (kódování textové informace použité v moderní operační systém Windows), stejně jako 2-byte kódování Unicode, které můžete odeslat 65 536 znaků. Taková různorodost kódování je způsobena skutečností, že byly vyvinuty v různých časech, pro různé operační systémy a z různých důvodů. Kvůli tomu dochází často k potížím s přenášením textu z jednoho média do jiného - pokud kódování neodpovídá, uživatel uvidí pouze sadu nepochopitelných ikon. Jak můžete tuto situaci napravit? V aplikaci Word například při otevření dokumentu obdržíte zprávu o problémech s zobrazováním textu a nabízí několik možností pro překódování.
Kódování a zpracování textových informací v hloubkách počítače je tedy spíše komplikovaný a časově náročný proces. Všechny symboly libovolné abecedy představují pouze určitou posloupnost čísel binární systém, jedna buňka je jeden byte informací.
- Reprezentace dat v počítači: binární kódování informací
- ASCII (americký standardní kód pro výměnu informací) - základní kódování textu pro latinskou abecedu
- ASCII, symboly: popis, kódová tabulka a pohledy
- Způsob kódování informací pomocí čísel. Binární kódování
- Co je systém hexadecimálních čísel?
- Kolik bitů v bajtu? Co je to trochu a byte?
- Kódování je ... Podepsané systémy: kódování informací
- Smysluplný a abecední přístup k měření informací
- Kódování a dekódování je obtížné?
- Co je kódování a dekódování? Příklady. Metody kódování a dekódování informací číselných, textových…
- Co je kódování informací a jejich zpracování?
- Proč je binární kódování univerzální? Programovací metody
- UTF-8 - kódování znaků
- Jaká je síla abecedy? Jak najít sílu abecedy: vzorec
- Binární čísla: systém binárních čísel
- Existují dva způsoby, jak změnit kódování v aplikaci Word
- Nejpopulárnější systémy čísel
- Prezentace informací v počítači
- Binární kódy: recenze, komentáře, otázky, odpovědi
- Dekódování čárového kódu. Užitečné informace
- Kódování html. Jak jsou webové stránky vymalovány