Preskočiť na obsah

Textová informácia

z Wikipédie, slobodnej encyklopédie

Text je ustálený jazykový prejav; výsledok rečovej činnosti, t. j. jazykový útvar, ktorý vznikol konkrétnou realizáciou jazykového systému.

Každý text pozostáva zo znakov, ktoré sú pospájané za sebou. Pod znakmi sa myslia všetky písmená, čísla, medzera, interpunkčné znamienka ako bodka, čiarka, otáznik, atď., ale i mnoho ďalších symbolov ako @, &, #.

Pre počítač je text ľubovoľná kombinácia všetkých spomínaných znakov. Aby sa však jednalo o textovú informáciu, musia byť znaky pospájané tak, aby mali význam.


Textová informácia zapísaná pomocou kódu ASCII

[upraviť | upraviť zdroj]

Štandardizovaný kód ASCII hovorí, že na zakódovanie každého znaku sa použije 8 bitov, čo umožňuje definovať kód pre 256 znakov. Pre Slovensko sa by sa mala na kódovanie znakov textu používať medzinárodná norma ISO 8859-2, ktorá sa tiež nazýva Latin 2. Firma Microsoft však tento štandard nepoužíva, používa štandard schválený americkým úradom ANSI (American National Standards Institute), označovaný tiež windows-1250.

Napríklad veta "Ema má mamu." je v počítači uložená nasledovne:

69 109 97 32 109 225 32 109 97 109 117 
E m a medzera m á medzera m a m u 

Textová informácia zapísaná pomocou kódu UNICODE

[upraviť | upraviť zdroj]

Kódovanie UNICODE používa 16 bitov na zakódovanie jedného znaku, čo umožňuje zakódovať 65536 možných znakov. Tento počet znakov umožňuje zakódovať znaky všetkých abecied pomocou jednej medzinárodnej tabuľky. Tento spôsob kódovania používa i kancelársky balík MS Office. Toto kódovanie zabezpečuje, že ten istý znak má rovnaký kód v každej krajine i na každom type počítača.

Veta „Ema má mamu“ je pomocou kódovania UNICODE v počítači uložená nasledovne:

69 00 109 00 97 00 32 00 109 00 225 00 32 00 109 00 97 00 109 00 117 00 
  E        m       a    medzera      m       á     medzera      m       a       m        u

Textový dokument

[upraviť | upraviť zdroj]

Text sa do počítača zapisuje pomocou textového editora. Text, ktorý do tohto editora napíšeme, môžeme uložiť ako textový dokument. Okrem textových znakov však textový dokument obsahuje i formátovacie znaky, pomocou ktorých môžeme v dokumente nastaviť napríklad veľkosť, typ, hrúbku, farbu a ďalšie atribúty písma. Podľa schopností textových editorov môžeme text uložiť dvoma spôsobmi:

  • Jednoduchý textový dokument
  • Formátovaný textový dokument

Jednoduchý dokument pozostáva z textových znakov, v ktorých môžu byť uložené znaky konca riadka a znaky tabulátora a ďalšie znaky, ktoré majú kód 0 až 31 v ASCII tabuľke. Na konci dokumentu je vložený špeciálny znak, ktorý dokument ukončuje. Tieto znaky do dokumentu vkladá textový editor. Typickým príkladom takéhoto editora je Poznámkový blok, ktorý takýto jednoduchý textový dokument ukladá ako súbor s príponou „txt“.

Formátovaný dokument

Formátovaný textový dokument môže obsahovať viacero typov písma, znaky rôznej veľkosti, hrúby, šírky či farby. Do textu môžu byť vložené rôzne ďalšie objekty ako obrázky, tabuľky, rovnice a podobne. Textový editor, ktorý umožňuje uloženie formátovaného dokument musí zabezpečiť, aby sa v dokumente všetky tieto atribúty textu uložili spolu s textom. Tento problém každý textový editor rieši iným spôsobom. Typickým príkladom tohto editora je editor MS Word, ktorý je súčasťou kancelárskeho balíka MS Office. Word svoje formátované dokumenty ukladá do súboru s príponou „doc“. Ďalším editorom, ktorý je čím ďalej tým viac používaný, je textový editor balíka Open Office. Tento editor ukladá svoje textové dokumenty do súboru s koncovkou „sxw“. Oba tieto spôsoby uloženia sú odlišné. Aby bolo možné prenášať textové dokumenty z jedného programu do druhého, vznikla snaha o vytvorenie štandardu i pre uloženie formátovaného textového dokumentu. Tento formát sa volá XML a mali by ho začať podporovať všetci výrobcovia textových editorov.

Princíp uchovávania formátovaných textov.