Smysluplný a abecední přístup k měření informací
Vývoj počítačových technologií v novém informačním věku vyvolává mnoho dalších otázek, otevírá nové příležitosti a znalosti. Ale spolu s tím je mnoho dilemat, které je třeba vyřešit. Například studoval výpočetní techniky, je důležité pochopit, jak to zvládá, ukládá a přenáší soubor, který je formát kódování dat a v němž se provádí měření informace. Hlavním tématem diskuse je však otázka, jaké jsou hlavní přístupy k měření informací. Příklady a vysvětlení každého aspektu budou podrobně popsány v tomto článku.
Obsah
- Informace v informatice
- Kódování informací elektronickým počítačem
- Výpočtové systémy v poli počítače
- Abecední přístup k měření informací: esence, jednotky
- Pravděpodobnost výskytu znaků v textovém souboru
- Různá pravděpodobnost výskytu symbolů v textu
- Měření informací: jemnost aspektu obsahu
- Události, které se vyskytly se stejnou pravděpodobností
- Příklad výpočtu události ekvivalentní
- Měření informací s přihlédnutím k různým pravděpodobnostem výskytu události
- Rozdíly mezi abecedními a informačními přístupy k informační dimenzi
- Závěry
Informace v informatice
Abychom začali chápat informační přístupy ukládání dat, je nejprve nutné zjistit, jaké informace představují v počítačové sféře a co to ukazuje. Koneckonců, pokud budeme vědy o počítačových vědách, pak jejím hlavním předmětem studia jsou informace. Samotné slovo latinského původu a překlad do našeho jazyka znamená "známost", "vysvětlení", "míchání". Každá věda používá různé definice tohoto pojetí. V oblasti počítačů jsou všechny informace o různých objektů a jevů, které nás obklopují, je opatření, které snižuje míru nejistoty a naše nevědomost o nich. Aby však bylo možné uložit všechny soubory, data symbolů znaků v elektronickém počítači, musíte znát algoritmus převést je do binárního kódu a stávajících jednotek měření množství dat. Abecední přístup k měření informací ukazuje, jak přesně počítačový stroj převádí symboly na binární kód nuly a ty.
Kódování informací elektronickým počítačem
Počítačová technologie dokáže rozpoznávat, zpracovávat, ukládat a přenášet pouze informace v binárním kódu. Pokud se jedná o zvukovou nahrávku, text, video, grafický obrázek, jak je stroj schopen se lišit datových typů převést na binární typ? A jak jsou v této podobě uloženy v paměti? Tyto otázky lze zodpovědět, pokud znáte abecední přístup k určení množství informací, aspektu obsahu a technické podstaty kódování.
Kódování informací je zašifrovat znaky v binárním kódu sestávajícím z znaků "0" a "1". Je technicky jednoduché se organizovat. Signál je, pokud existuje, nula označuje opak. Někteří se ptají, proč počítač nemůže, stejně jako lidský mozek, udržovat složitá čísla, protože mají menší velikost. Ale elektronická výpočetní technika je jednodušší pracovat s obrovským binárním kódem, spíše než ukládat složitá čísla do vaší paměti.
Výpočtové systémy v poli počítače
Zvykli jsme se počítat od 1 do 10, přidávat, odečíst, množit a provádět různé operace na číslech. Počítač je schopen pracovat pouze dvěma čísly. Ale dělá to ve zlomcích milisekund. Jak počítač počítač zakóduje a dekóduje symboly? Jedná se o poměrně jednoduchý algoritmus, který lze považovat za příklad. Abecední přístup k měření informací, jednotky měření dat, budeme zvažovat trochu později, poté, co je podstatou kódování a dekódování dat jasné.
Existuje mnoho počítačových programů, které vizuálně překládají systémy číselného nebo textového řetězce binární kód a zpět.
Budeme provádět výpočty ručně. Kódování informací se provádí obyčejným dělením 2. Takže řekněme, že máme desetinné číslo 217. Potřebujeme jej převést na binární kód. Chcete-li to provést, rozdělte jej o číslo 2, dokud zbytek není nula nebo jedna.
- 217/2 = 108 se zbytkem 1. Samostatně píšeme pozůstatky a vytvoříme konečnou odpověď.
- 108/2 = 54. Zde je zbytek číslo 0, protože 108 je úplně rozděleno. Nezapomeňte označit se zbytky. Koneckonců, pokud ztratíte alespoň jedno číslo, původní číslo bude jiné.
- 54/2 = 27, zbytek je 0.
- 27/2 = 13, zapište 1 do zbytku. Naše čísla z ostatních tvoří binární kód, který musí být přečten v opačném pořadí.
- 13/2 = 6. Zde je jednotka ve zbytku, píšeme to.
- 6/2 = 3 se zbytkem 0. V konečné odpovědi by čísla měla být více než všechna provedená akce.
- 3/2 = 1 se zbytkem 1. Zapsáme zbytek a číslo 1, což je konečné dělení.
Pokud naformátujete odpověď, počínaje číslem v první akci, výsledek je 10011011, ale toto je nesprávné. Binární číslo musí být přepsáno v opačném pořadí. Zde je konečný výsledek překladu čísla: 11011001. Smysluplný a abecední přístup k měření informací používá data přesně tohoto formátu pro ukládání a přenos. Binární kód je zapsán do kódové tabulky a uložen tam, dokud jej nemusíte zobrazit na obrazovce monitoru. Pak jsou informace přeloženy do známé formy, nazvané dekódování.
Obrázek jasně ukazuje algoritmus pro překlad z binárního na desetinný. Jedná se o jednoduchý vzorec. První číslice kódu se násobí 2 na výkon 0, přidáme k němu další číslice vynásobenou větším počtem 2 a tak dále. V důsledku toho, jak vidíte na obrázku, získáváme při kódování stejné číslo jako původní.
Abecední přístup k měření informací: esence, jednotky
Pro měření množství dat v textové posloupnosti symbolů je nutné použít stávající přístup. Obsah textu zde není důležitý, hlavní věcí je kvantitativní korelace znaků. Z tohoto hlediska se vypočítá hodnota textové zprávy zakódované v počítači. Podle tohoto přístupu je kvantitativní hodnota textu úměrná počtu znaků zadaných z klávesnice. Díky tomu způsob měření Informační objem se často nazývá objemový. Symboly mohou být značně odlišné. Je zřejmé, že takové číslice jako 0 a 1 nesou 1 bit informací a písmena, interpunkční znaménka, prostor - další váha. Můžete se podívat na tabulku ASCII, abyste zjistili binární kód konkrétního znaku. Chcete-li vypočítat požadovaný objem textu, je třeba přidat váhu všech značek - částí celého textu. Jedná se o abecední přístup k určení množství informací.
V oblasti výpočetní techniky existuje mnoho termínů, které se stále častěji používají v každodenním životě. To znamená, že abeceda v informatice je soubor znaků, včetně držáků, prostor, interpunkce, symbolů, cyrilice, latina, které nejsou ničím jiným než částí textu. Zde jsou dvě definice, kterými se vypočítá toto množství.
1. Vzhledem k první definici je možné vypočítat výskyt znaků v textové zprávě, pokud je jejich pravděpodobnost výskytu zcela odlišná. Takže můžeme říci, že některé dopisy v ruských slovech se objevují velmi zřídka, například "ъ" nebo "ё".
2. V některých případech je však výhodnější vypočítat množství, které potřebujeme, zavedením ekvivalentního vzhledu každého symbolu. Potom se použije další výpočetní vzorec.
Jedná se o abecední přístup k měření informací.
Pravděpodobnost výskytu znaků v textovém souboru
Abychom tuto definici vysvětlili, je nutné předpokládat, že všechny znaky v textu nebo zprávě se objeví se stejnou frekvencí. Chcete-li vypočítat, kolik paměti obsadí v počítači, musíte se ponořit do teorie pravděpodobnosti a jednoduchých logických závěrů.
Řekněme, že text je zobrazen na obrazovce monitoru. Před námi je úkolem vypočítat, kolik počítačové paměti potřebuje. Nechte text skládat ze 100 znaků. Ukazuje se, že pravděpodobnost výskytu jednoho písmena, symbolu nebo znamení bude stotinovou částí celkového objemu. Pokud knihu o teorii pravděpodobnosti, že je možné najít poměrně jednoduchý vzorec, který přesně určit číselnou hodnotu šance výskytu znaku v každé poloze textu.
Pravděpodobně důkaz o vzorcích a věty nebude pro každého zajímavý, a proto, s přihlédnutím k vzorcům známých vědců, je odvozen vypočtený výraz:
i = log2(1 / p) = log2N (bit) - 2i= N,
kde i - to je hodnota, která se musíme naučit, p - číselná hodnota možnosti znak v textu pozicích, N, ve většině případů se rovná 2, protože počítač stroj kóduje data v binárním kódu, sestávající ze dvou proměnných.
Abecední volumetrický přístup k měření informací předpokládá, že váha jedné znakové značky se rovná 1 bit - minimální měrné jednotce. Pomocí vzorce můžete určit, co se rovná bajtu, kilobajtu, megabajtům atd.
Různá pravděpodobnost výskytu symbolů v textu
Budeme-li předpokládat, že tyto znaky zobrazují s různou frekvencí (nebo, v jakékoliv poloze textu jejich pravděpodobnosti výskytu se liší), pak můžeme říci, že jejich hmotnost je také různé informace. Měření informací je třeba vypočítat jiným vzorcem. Abecední přístup témat je univerzální, což znamená jak stejnou, tak i odlišnou možnost četnosti výskytu znamení v textu. Nebudeme se dotýkat složitého vzorce pro výpočet tohoto množství, s přihlédnutím k rozdílné pravděpodobnosti výskytu tohoto symbolu. Je třeba si uvědomit, že takové písmena jako "ъ", "х", "ф", "ч", v ruských slovech jsou mnohem méně časté. Proto je nutné zvážit četnost vzhledu podle jiného vzorce. Po provedení některých výpočtů vědci dospěli k závěru, že informační váha vzácných symbolů je mnohem větší než hmotnost dopisů, které se často vyskytují. Chcete-li vypočítat množství textu, je třeba zvážit množství opakování jednotlivých znaků a jejich hmotnost, jakož i velikost abecedy.
Měření informací: jemnost aspektu obsahu
Můžete ignorovat abecední přístup k měření informací. Informatika nabízí ještě jeden aspekt měření dat - smysluplný. Zde se vyřeší mírně odlišný problém. Předpokládejme, že osoba sedící u počítače dostane informace o jevu nebo nějakém objektu. Předem je zřejmé, že nic neví, takže existuje určitý počet možných nebo očekávaných možností. Po přečtení zprávy nejistota zmizí a ponechá jednu možnost, jejíž hodnota musí být vypočtena. Otočíme se k pomocnému vzorci. Hodnota bude vypočítána v minimální jednotce - bity. Stejně jako abecední přístup k měření množství informací bude správný vzorec zvolen s přihlédnutím k 2 možným situacím: rozdílné a stejné pravděpodobnosti výskytu událostí.
Události, které se vyskytly se stejnou pravděpodobností
Stejně jako v případě, pokud se jedná abecední objektivní přístup k měření informace, pokud je to žádoucí vzorec smysluplný přístup vypočtená z již známého vzoru, který dal vědec Hartley:
2i= N,
kde i je velikost události, kterou musíme najít, a N je počet událostí, se kterými se setkáváme s frekvencí ekvivalentnosti. Hodnota i je považována za minimální jednotku výpočtu - bitů. Lze je vyjádřit v logaritmu.
Příklad výpočtu události ekvivalentní
Řekněme, že na talíři máme 64 pelmen, v jednom z nich je překvapení skryto místo masa. Je nutné vypočítat, kolik informací událost obsahuje, když byl tento pes, který byl vytažen s překvapením, tj. Měřit informace. Abecední přístup je stejně jednoduchý jako objektivní. Ve dvou případech by byl stejný vzorec použit pro výpočet množství informačních materiálů. Nahrazujeme dobře známý kvantitativní vzorec: 2i= 64 = 26.. Výsledek: i = 6 bitů.
Měření informací s přihlédnutím k různým pravděpodobnostem výskytu události
Předpokládejme, že máme událost s pravděpodobností výskytu p. Předpokládáme, že hodnota i vypočtená v bitech je číslo charakterizující skutečnost, že událost nastala. Na základě toho lze argumentovat, že hodnoty lze vypočítat podle stávajícího vzorce: 2i= 1 / p.
Rozdíly mezi abecedními a informačními přístupy k informační dimenzi
Přístup k objemu se liší od podstatného? Koneckonců, vzorce pro výpočet množství informací jsou zcela stejné. Rozdíl spočívá v tom, že abecední aspekt lze použít, pokud pracujete s textem, zatímco obsah vám umožňuje vyřešit všechny problémy teorie pravděpodobnosti, vypočítat množství informací o nějaké události s ohledem na jeho pravděpodobný vzhled.
Závěry
Abecedně přístup k měření informace, stejně jako informativní, neboť umožňuje zjistit, které datové jednotky, a do jaké míry bude přijímat textové znaky, nebo jakékoli jiné informace. Můžeme přeložit všechny textové a číselné soubory, zprávy do počítačového kódu a zpět, a zároveň vědět, kolik paměti budou obsazeny v počítači.
- Reprezentace dat v počítači: binární kódování informací
- 1000 Nebo 1024? Kolik megabajtů v gigabyte?
- Smysluplný přístup k měření informací: vše, co potřebujete vědět
- Jednotky informací v informatice. Minimální jednotka informací
- Teorie a definice informatiky
- Petabyte - kolik je tato informace?
- Sémantický způsob měření informací: podstatu, základní pojmy a vlastnosti
- Informatika jako věda
- Klasifikace počítačových sítí
- Základní pojmy počítačových sítí
- Informatika a počítačová zařízení
- Co je informatika a její role v moderním světě?
- Jednotky informací
- Metody, typy informací, počítač, skladování a zpracování
- Metody ochrany informací
- Informační a informační procesy
- Klasifikace informačních technologií a aplikace informací v životě
- Řízení informací: koncepce, základní přístupy a typy firem
- Informační zdroje a jejich role v moderní společnosti
- Informační kultura - nejdůležitější část společnosti
- Informace: definice pojmu, význam, rozsah