Bezpečnosť údajov v informačných službách
Myslím, že článek obsahuje řadu nepřesných formulací. Nejvíc mě rozhořčila tvrzení:
- „Počet písmen a znakov abecedy je vetší ako 160. Preto minimálna dĺžka registra na ich kódovanie je n = 8.“
- Najširšie použitie má medzinárodný osembitový kód pre spracovanie a výmenu informácií EBCDIC.
ad 1) Pokud vím, tak rozhodně ani česká, ani slovenská abeceda nedisponuje 160 znaky (v kódových stránkách jsou i řídící kódy pro ovládání HW a semigrafické symboly). Pokud by tvrzení mělo zahrnovat celý svět (tj. arabštinu, hebrejštinu, azbuku, japonštinu), tak se mi zase 160 znaků zná dost málo.
ad 2) Kód EBCDIC se používá v podstatě jen na velkých sálových počítačích IBM a jejich klonech (EC 1026).
Celý ostatní počítačový svět vychází z kódování ASCII (American Standard Code for Information Interchange). Ten pro kódování znaku používá 7 bitů v základní sadě (jen písmena římské abecedy). Rozšířená část (8 bitů, znaky s hodnotou 128–255) se používá pro různá národní prostředí (Microsoft – CP852, MS WIN 1250 pro češtinu), různé počítačové platformy (UNIX, znakové sady ISO 8859).
Ze základní znakové sady ASCII vychází i kódování UNICODE, které je 16bitové, použité např. v jazyku JAVA. Tedy i celý internetovský svět vychází z kódování ASCII, nikoli z EBCDIC.
Odpověď autora:
V článku hovorím, že ochrane údajov je venovaná pozornosť na úrovni, ktorá je daná ich dôležitosťou alebo výnosnosťou. V civilnom sektore sú to hlavne banky, ktoré majú dlhodobé skúsenosti v tejto oblasti. Preto som sa historicky vrátil ku kódu EBCDIC (a dokonca k dnes už neexistujúcemu DKOI, zomrelému s RVHP), ktorý bol vytvorený pre prax hromadného spracovania údajov. Vychádzal z dielne IBM pôvodne pre prácu s 80stĺpcovými diernymi štítkami s 12 dierovacími miestami. Pri 44 grafických znakoch, 40 plus 4 riadiacich znakoch, 16 znakoch číslicových, povinnej rezervy, nie je možné vtesnať do 7bitového kódovania ďalších 52 písmen anglickej abecedy (netreba ešte iné abecedy). Súhlasím s autorom, že formulácia nie je presná. Veta by mala znieť v presmyčke: „Počet písmen abecedy a znakov je väčší ako 160.“
8bitové kódovanie potom vďaka značnej rezerve umožnilo implantovať aj písmená z národnej abecedy európskych krajín. Tak vychádzajúc z horeuvedenej bázy vznikol aj vtedajší KOI – 8čs.
Súhlasím s autorom, že vývoj ide cez ASCII kódovanie. Dokonca poviem, že razantne. Tu ale uvediem (pozri Microsoft MS – DOS User’s Guide and Reference, Microsoft, 1991 a novšie vydania), že: pôvodné ASCII obsahovalo 128 kódov, ktoré zahrňovali anglickú abecedu, interpunkciu a znaky, kontrolné znaky. V súčasnosti najviac systémov rozoznáva 256 kódov: pôvodné 128kódové ASCII plus 128 kódov, nazvané rozšírený súbor. Ten obsahuje písmená len európskych abecied (vrátane špecifických písmen slovenskej a českej – J. L.), grafické znaky, vedecké znaky. Nástup grafiky a vôbec multimediálnych dokumentov samozrejme posúva kódovania v tejto oblasti ďalej. Ale to by bolo zrejme na rozbory omnoho hlbšie, než aké si kládol môj článok.
Ke stažení
- Článek ve formátu PDF [51,01 kB]