Smysluplný a abecední přístup k měření informací

Vývoj počítačových technologií v novém informačním věku vyvolává mnoho dalších otázek, otevírá nové příležitosti a znalosti. Ale spolu s tím je mnoho dilemat, které je třeba vyřešit. Například studoval výpočetní techniky, je důležité pochopit, jak to zvládá, ukládá a přenáší soubor, který je formát kódování dat a v němž se provádí měření informace. Hlavním tématem diskuse je však otázka, jaké jsou hlavní přístupy k měření informací. Příklady a vysvětlení každého aspektu budou podrobně popsány v tomto článku.

Obsah

Informace v informatice
Kódování informací elektronickým počítačem
Výpočtové systémy v poli počítače
Abecední přístup k měření informací: esence, jednotky
Pravděpodobnost výskytu znaků v textovém souboru
Různá pravděpodobnost výskytu symbolů v textu
Měření informací: jemnost aspektu obsahu
Události, které se vyskytly se stejnou pravděpodobností
Příklad výpočtu události ekvivalentní
Měření informací s přihlédnutím k různým pravděpodobnostem výskytu události
Rozdíly mezi abecedními a informačními přístupy k informační dimenzi
Závěry

Informace v informatice

Abychom začali chápat informační přístupy ukládání dat, je nejprve nutné zjistit, jaké informace představují v počítačové sféře a co to ukazuje. Koneckonců, pokud budeme vědy o počítačových vědách, pak jejím hlavním předmětem studia jsou informace. Samotné slovo latinského původu a překlad do našeho jazyka znamená "známost", "vysvětlení", "míchání". Každá věda používá různé definice tohoto pojetí. V oblasti počítačů jsou všechny informace o různých objektů a jevů, které nás obklopují, je opatření, které snižuje míru nejistoty a naše nevědomost o nich. Aby však bylo možné uložit všechny soubory, data symbolů znaků v elektronickém počítači, musíte znát algoritmus převést je do binárního kódu a stávajících jednotek měření množství dat. Abecední přístup k měření informací ukazuje, jak přesně počítačový stroj převádí symboly na binární kód nuly a ty.

Kódování informací elektronickým počítačem

Počítačová technologie dokáže rozpoznávat, zpracovávat, ukládat a přenášet pouze informace v binárním kódu. Pokud se jedná o zvukovou nahrávku, text, video, grafický obrázek, jak je stroj schopen se lišit datových typů převést na binární typ? A jak jsou v této podobě uloženy v paměti? Tyto otázky lze zodpovědět, pokud znáte abecední přístup k určení množství informací, aspektu obsahu a technické podstaty kódování.

abecední přístup k měření informací v měrné jednotce

Kódování informací je zašifrovat znaky v binárním kódu sestávajícím z znaků "0" a "1". Je technicky jednoduché se organizovat. Signál je, pokud existuje, nula označuje opak. Někteří se ptají, proč počítač nemůže, stejně jako lidský mozek, udržovat složitá čísla, protože mají menší velikost. Ale elektronická výpočetní technika je jednodušší pracovat s obrovským binárním kódem, spíše než ukládat složitá čísla do vaší paměti.

Výpočtové systémy v poli počítače

Zvykli jsme se počítat od 1 do 10, přidávat, odečíst, množit a provádět různé operace na číslech. Počítač je schopen pracovat pouze dvěma čísly. Ale dělá to ve zlomcích milisekund. Jak počítač počítač zakóduje a dekóduje symboly? Jedná se o poměrně jednoduchý algoritmus, který lze považovat za příklad. Abecední přístup k měření informací, jednotky měření dat, budeme zvažovat trochu později, poté, co je podstatou kódování a dekódování dat jasné.

Existuje mnoho počítačových programů, které vizuálně překládají systémy číselného nebo textového řetězce binární kód a zpět.

abecední přístup k měření informatiky

Budeme provádět výpočty ručně. Kódování informací se provádí obyčejným dělením 2. Takže řekněme, že máme desetinné číslo 217. Potřebujeme jej převést na binární kód. Chcete-li to provést, rozdělte jej o číslo 2, dokud zbytek není nula nebo jedna.

217/2 = 108 se zbytkem 1. Samostatně píšeme pozůstatky a vytvoříme konečnou odpověď.
108/2 = 54. Zde je zbytek číslo 0, protože 108 je úplně rozděleno. Nezapomeňte označit se zbytky. Koneckonců, pokud ztratíte alespoň jedno číslo, původní číslo bude jiné.
54/2 = 27, zbytek je 0.
27/2 = 13, zapište 1 do zbytku. Naše čísla z ostatních tvoří binární kód, který musí být přečten v opačném pořadí.
13/2 = 6. Zde je jednotka ve zbytku, píšeme to.
6/2 = 3 se zbytkem 0. V konečné odpovědi by čísla měla být více než všechna provedená akce.
3/2 = 1 se zbytkem 1. Zapsáme zbytek a číslo 1, což je konečné dělení.

Pokud naformátujete odpověď, počínaje číslem v první akci, výsledek je 10011011, ale toto je nesprávné. Binární číslo musí být přepsáno v opačném pořadí. Zde je konečný výsledek překladu čísla: 11011001. Smysluplný a abecední přístup k měření informací používá data přesně tohoto formátu pro ukládání a přenos. Binární kód je zapsán do kódové tabulky a uložen tam, dokud jej nemusíte zobrazit na obrazovce monitoru. Pak jsou informace přeloženy do známé formy, nazvané dekódování.

přístupy k měření informací

Obrázek jasně ukazuje algoritmus pro překlad z binárního na desetinný. Jedná se o jednoduchý vzorec. První číslice kódu se násobí 2 na výkon 0, přidáme k němu další číslice vynásobenou větším počtem 2 a tak dále. V důsledku toho, jak vidíte na obrázku, získáváme při kódování stejné číslo jako původní.

Abecední přístup k měření informací: esence, jednotky

Pro měření množství dat v textové posloupnosti symbolů je nutné použít stávající přístup. Obsah textu zde není důležitý, hlavní věcí je kvantitativní korelace znaků. Z tohoto hlediska se vypočítá hodnota textové zprávy zakódované v počítači. Podle tohoto přístupu je kvantitativní hodnota textu úměrná počtu znaků zadaných z klávesnice. Díky tomu způsob měření Informační objem se často nazývá objemový. Symboly mohou být značně odlišné. Je zřejmé, že takové číslice jako 0 a 1 nesou 1 bit informací a písmena, interpunkční znaménka, prostor - další váha. Můžete se podívat na tabulku ASCII, abyste zjistili binární kód konkrétního znaku. Chcete-li vypočítat požadovaný objem textu, je třeba přidat váhu všech značek - částí celého textu. Jedná se o abecední přístup k určení množství informací.

abecední přístup k měření množství informací

V oblasti výpočetní techniky existuje mnoho termínů, které se stále častěji používají v každodenním životě. To znamená, že abeceda v informatice je soubor znaků, včetně držáků, prostor, interpunkce, symbolů, cyrilice, latina, které nejsou ničím jiným než částí textu. Zde jsou dvě definice, kterými se vypočítá toto množství.

1. Vzhledem k první definici je možné vypočítat výskyt znaků v textové zprávě, pokud je jejich pravděpodobnost výskytu zcela odlišná. Takže můžeme říci, že některé dopisy v ruských slovech se objevují velmi zřídka, například "ъ" nebo "ё".

2. V některých případech je však výhodnější vypočítat množství, které potřebujeme, zavedením ekvivalentního vzhledu každého symbolu. Potom se použije další výpočetní vzorec.

Jedná se o abecední přístup k měření informací.

abecední přístup k měření informací

Pravděpodobnost výskytu znaků v textovém souboru

Abychom tuto definici vysvětlili, je nutné předpokládat, že všechny znaky v textu nebo zprávě se objeví se stejnou frekvencí. Chcete-li vypočítat, kolik paměti obsadí v počítači, musíte se ponořit do teorie pravděpodobnosti a jednoduchých logických závěrů.

Řekněme, že text je zobrazen na obrazovce monitoru. Před námi je úkolem vypočítat, kolik počítačové paměti potřebuje. Nechte text skládat ze 100 znaků. Ukazuje se, že pravděpodobnost výskytu jednoho písmena, symbolu nebo znamení bude stotinovou částí celkového objemu. Pokud knihu o teorii pravděpodobnosti, že je možné najít poměrně jednoduchý vzorec, který přesně určit číselnou hodnotu šance výskytu znaku v každé poloze textu.

Pravděpodobně důkaz o vzorcích a věty nebude pro každého zajímavý, a proto, s přihlédnutím k vzorcům známých vědců, je odvozen vypočtený výraz:

i = log₂(1 / p) = log₂N (bit) - 2ⁱ= N,

kde i - to je hodnota, která se musíme naučit, p - číselná hodnota možnosti znak v textu pozicích, N, ve většině případů se rovná 2, protože počítač stroj kóduje data v binárním kódu, sestávající ze dvou proměnných.

Abecední volumetrický přístup k měření informací předpokládá, že váha jedné znakové značky se rovná 1 bit - minimální měrné jednotce. Pomocí vzorce můžete určit, co se rovná bajtu, kilobajtu, megabajtům atd.

Různá pravděpodobnost výskytu symbolů v textu

Budeme-li předpokládat, že tyto znaky zobrazují s různou frekvencí (nebo, v jakékoliv poloze textu jejich pravděpodobnosti výskytu se liší), pak můžeme říci, že jejich hmotnost je také různé informace. Měření informací je třeba vypočítat jiným vzorcem. Abecední přístup témat je univerzální, což znamená jak stejnou, tak i odlišnou možnost četnosti výskytu znamení v textu. Nebudeme se dotýkat složitého vzorce pro výpočet tohoto množství, s přihlédnutím k rozdílné pravděpodobnosti výskytu tohoto symbolu. Je třeba si uvědomit, že takové písmena jako "ъ", "х", "ф", "ч", v ruských slovech jsou mnohem méně časté. Proto je nutné zvážit četnost vzhledu podle jiného vzorce. Po provedení některých výpočtů vědci dospěli k závěru, že informační váha vzácných symbolů je mnohem větší než hmotnost dopisů, které se často vyskytují. Chcete-li vypočítat množství textu, je třeba zvážit množství opakování jednotlivých znaků a jejich hmotnost, jakož i velikost abecedy.

Měření informací: jemnost aspektu obsahu

Smysluplný a abecední přístup k měření informací

Můžete ignorovat abecední přístup k měření informací. Informatika nabízí ještě jeden aspekt měření dat - smysluplný. Zde se vyřeší mírně odlišný problém. Předpokládejme, že osoba sedící u počítače dostane informace o jevu nebo nějakém objektu. Předem je zřejmé, že nic neví, takže existuje určitý počet možných nebo očekávaných možností. Po přečtení zprávy nejistota zmizí a ponechá jednu možnost, jejíž hodnota musí být vypočtena. Otočíme se k pomocnému vzorci. Hodnota bude vypočítána v minimální jednotce - bity. Stejně jako abecední přístup k měření množství informací bude správný vzorec zvolen s přihlédnutím k 2 možným situacím: rozdílné a stejné pravděpodobnosti výskytu událostí.

Události, které se vyskytly se stejnou pravděpodobností

Stejně jako v případě, pokud se jedná abecední objektivní přístup k měření informace, pokud je to žádoucí vzorec smysluplný přístup vypočtená z již známého vzoru, který dal vědec Hartley:

2ⁱ= N,

kde i je velikost události, kterou musíme najít, a N je počet událostí, se kterými se setkáváme s frekvencí ekvivalentnosti. Hodnota i je považována za minimální jednotku výpočtu - bitů. Lze je vyjádřit v logaritmu.

Příklad výpočtu události ekvivalentní

Řekněme, že na talíři máme 64 pelmen, v jednom z nich je překvapení skryto místo masa. Je nutné vypočítat, kolik informací událost obsahuje, když byl tento pes, který byl vytažen s překvapením, tj. Měřit informace. Abecední přístup je stejně jednoduchý jako objektivní. Ve dvou případech by byl stejný vzorec použit pro výpočet množství informačních materiálů. Nahrazujeme dobře známý kvantitativní vzorec: 2ⁱ= 64 = 2^6.. Výsledek: i = 6 bitů.

abecední objemový přístup k měření informací

Měření informací s přihlédnutím k různým pravděpodobnostem výskytu události

Předpokládejme, že máme událost s pravděpodobností výskytu p. Předpokládáme, že hodnota i vypočtená v bitech je číslo charakterizující skutečnost, že událost nastala. Na základě toho lze argumentovat, že hodnoty lze vypočítat podle stávajícího vzorce: 2ⁱ= 1 / p.

Rozdíly mezi abecedními a informačními přístupy k informační dimenzi

Přístup k objemu se liší od podstatného? Koneckonců, vzorce pro výpočet množství informací jsou zcela stejné. Rozdíl spočívá v tom, že abecední aspekt lze použít, pokud pracujete s textem, zatímco obsah vám umožňuje vyřešit všechny problémy teorie pravděpodobnosti, vypočítat množství informací o nějaké události s ohledem na jeho pravděpodobný vzhled.

Závěry

Abecedně přístup k měření informace, stejně jako informativní, neboť umožňuje zjistit, které datové jednotky, a do jaké míry bude přijímat textové znaky, nebo jakékoli jiné informace. Můžeme přeložit všechny textové a číselné soubory, zprávy do počítačového kódu a zpět, a zároveň vědět, kolik paměti budou obsazeny v počítači.

Sdílet na sociálních sítích:

Podobné