LINUXSOFT.cz Přeskoč levou lištu
Uživatel: Heslo:  
   CZUKPL

> NE diakritice v doménách

V posledních dnech se toho hodně děje v oblasti diakritiky a doménových názvů. Již dnes si můžete rezervovat registraci eu domén s diakritikou. A i když česká internetová populace dala několikrát najevo, že nechce diakritiku v názvech domén, objevují se články a celé blogy na podporu IDN systému i u české národní domény.

11.11.2009 00:00 | Ondřej Tůma | Články autora | přečteno 4931×

Obecně

Mezi příznivci najdeme mnoho tzv. zastánců českého jazyka, kteří se snaží prosadit české názvy napříč všemi technologiemi. Budiž jim pochvala za jejich snažení, ale zde trochu přestřelují. Vždy budu odpůrce cpaní češtiny všude, kde to jde, a to zejména z důvodů možných problémů, které mohou být nejen technického, ale i finančního, nebo dokonce bezpečnostního charakteru. Je třeba si uvědomit, že internet je počítačovým systémem, který umožňuje komunikaci všech připojených lidí na celém světě, bez ohledu na jazyk, kulturu nebo vyznání.

Mezi první problémy patří samozřejmě technologická kompatibilita. I dnes je v internetové síti nespočetně mnoho zastaralých systémů, kteří o znakové sadě s diakritikou nemají ani páru. I dnes se na internet připojuje mnoho systémů, které si diakritiku vykládají po svém v závislosti na tzv. znakové sadě. Ano je pravda že tu máme např. UTF-8, a tak máme možnost v jednom textu číst češtinu, francouzštinu, azbuku nebo čínštinu, ale to neznamená že stejné možnosti má soused od vedle.

Je třeba pamatovat na to, že některé dokumenty v různých podobách putují internetem i celou škálou různých systémů, od verzovacích až po zálohovací. Tyto některé systém s diakritikou stále neumí pracovat nebo s ní mohou pracovat velmi špatně. A i rozmanitost počítačového průmyslu je velkou překážkou pro názvy s diakritikou. Jeden dokument může putovat internetem jako mailová příloha skrz několik různých poštovních serverů a několik různých mailových klientů a šance že jeden z těchto systémů špatně pochopí české znaky je poměrně obrovská.

Je třeba oddělit název od obsahu. Zatímco s názvem pracují i ti, které obsah nezajímá, nebo ani neumí, či nechtějí s obsahem pracovat, název je sdílená vlastnost, která není omezena jen na určitou skupinu lidí, mluvící stejným jazykem, nebo mající nainstalovaný stejný jazykový font. V případě práce s libovolným názvem je třeba si uvědomit, jakou cestu onen název musí podstoupit, neboť název je ten, se kterým se nejvíce pracuje.

Domény

Technických problémů s diakritikou v názvech domén je však mnohem víc, než v případě názvů souborů. K doméně je totiž vázáno poměrně velké množství služeb, které si zastánci často ani neuvědomí. Název domény se totiž nezobrazuje jen v adresním řádku prohlížeče, ale i v mailových adresách, v přihlašovacích údajích k různým serverům. Internetové služby nejsou jen webové stránky a mail. Navíc i obyčejné webové stránky mohou procházet různými cachovacími a autorizačními proxy servery.

Krásným příkladem mohou být i mailové adresy. Mnoho uživatelů v internetu často používá diakritiku v mailech již dnes a do svých programů již dnes píší např. Tomáš.Novák@pečivo.cz. Systém, který mail v současné době zpracovává, udělá jednoduchou operaci nad názvem mailové adresy, a převede ho do správného tvaru tomas.novak@pecivo.cz. Prostě systém je tzv. blbuvzdorný a opraví uživatele. Taková oprava již ale nebude možná, neboť doména pečivo.cz bude regulérní doména.

Každý takový název domény již nyní zpracovává obrovské množství algoritmů, ty kontrolují např. správnost názvu. Mnoho názvů domén již dnes prochází neskutečným množství pravidel a filtrů, které na základě různých kriterií s webovou stránkou nebo mailem provedou množství různých operací. Tyto algoritmy jsou různé, zcela autonomní v internetové síti. Majitel domény nikdy dopředu neví, kdo se bude chtít podívat na obsah jeho webových stránek, z jaké země bude, skrz jaké systémy bude přístup proveden.

I když nemůže být technologická zaostalost omluvou, může být důvodem pro nepoužití diakritiky v názvu domén. Někteří si ani neuvědomují v kolika systémech je uvedená mailová adresa, nebo adresa webových stránek. A ještě méně uživatelů, tuší, že k názvu s diakritikou existuje i název bez diakritiky, který umožňuje použití původního názvu. Kolik to asi tuší programátorů, kteří píší všechny ty aplikace pro práci s doménovými názvy.

Ekonomika a bezpečnost

Posledním ne méně důležitým faktorem je ekonomika a bezpečnost. Tyto dva faktory sem spojil do jedné sekce, neboť příčina, který ekonomiku či bezpečnostní politiku rozbije je stejná - zmatek. Zavedením názvů domén s diakritikou přivede ohromný zmatek. Najednou totiž k jednomu názvu domény bude existovat několik dalších možných variant, která bude ale ta správná? Mnozí mohou oponovat, že tato situace existuje již dnes. Neboť i dnes muže uživatel přemýšlet, zda doména je automoto.cz nebo motoauto.cz. V případě "českých" domén ale počet takových variant naroste mnohonásobně.

Jako příklad můžeme použít čestvépečivo.cz. Ke každému písmenku s diakritikou existuje nejméně jedna varianta, tedy bez diakritiky. Je ale nutné si uvědomit, že možných variant je více. Mnoho i evropských jazyků mají znaménko, které vypadá obdobně jako např. znak "c". Nemusíme ale chodit až ke znaku podobnému a tedy zaměnitelnému, stačí že neexistují jen nabodeníčka krátké a dlouhé. Vedle českých háčků a čárek existuje mnoho dalších variant, např. stříšky, obrácené čárky atd. V neposlední řadě je třeba si uvědomit, že i znak bez diakritiky, může mít variantu s diakritikou. Naše domény by mohla tedy vypadat i takto: ćěrštvepécivö.cz.

Je velmi nepravděpodobné, že se takové názvy domén v českých luzích a hájích objeví, je ale pravděpodobné, že taková situace bude nahrávat spekulantům. Majitelé zejména některých domén tak mohou být postaveni před otázku zaplatit dalších 5 variant domény, nebo přijít o své zákazníky díky spekulantům. A jak že je to s tou bezpečností. Bezpečnost se zmatkem přímo souvisí, kdykoli totiž nastane zmatek, je to ideální čas, kdy se ve zmatku chová narušení bezpečnosti. Co takové malé podvržení mailů a vydávání se za ćeskystatistickýustav.cz, nebo ćeskaspoŕitelna.cz ?

S ekonomikou a bezpečnostní samozřejmě souvisí i prvopočáteční důvod, proč diakritika v názvech domén není dobrý nápad. Úprava všech těch systémů, které bohužel již brzo budou pracovat s doménami s diakritikou bude něco stát. A nebude to málo. A kdo zná alespoň trochu zákony pana Murphyho, ví, že opravou jedné chyby (zde úpravou systému) vznikne nejméně jedna chyby nová. Tedy potenciální riziko bezpečnostní chyby ve všech těch předělaných, upravených systémech. Nové možnosti pro útočníky, spamery a podvodníky, kteří zneužívají sebemenší slabosti internetu.

Závěrem

Když si tak po sobě přečtu co všechno sem napsal jako argumenty proč nepoužívat diakritiku v názvu domén, je mi skoro úzko, když si představím, že mé obavy se naplní. Doufám proto, že i tento článek nezůstane zapadlý kdesi v internetu a dostane se do ruky i těm, kteří prosazují IDN systém v české doméně cz. Rozhodně bude zajímavé, co se bude dít v brzké době, až se začnou objevovat takové domény v zóně eu.

Verze pro tisk

pridej.cz

 

DISKUZE

... 11.11.2009 11:13 Dominik Moštěk
Naprosto souhlasím 11.11.2009 13:04 Jirza
Nevidím to tak jednoznačně 13.11.2009 21:13 Juraj Václavík
L Re: Nevidím to tak jednoznačně 14.11.2009 15:46 Aleš Hakl
Jsem pro IDN 13.11.2009 22:54 mmmmario
|- Re: Jsem pro IDN 15.11.2009 01:35 lelo
| L Re: Jsem pro IDN 15.11.2009 09:02 Slavko
L Re: Jsem pro IDN 21.11.2009 21:08 P.B.
cina, japonsko apod. ano, u nas urcite ne 21.11.2009 21:13 P.B.




Příspívat do diskuze mohou pouze registrovaní uživatelé.
> Vyhledávání software
> Vyhledávání článků

1.12.2016 22:13 /František Kučera
Máš rád svobodný software a hardware nebo se o nich chceš něco dozvědět? Přijď na sraz spolku OpenAlt, který se bude konat ve čtvrtek 8. prosince od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Sraz bude tentokrát tématický. Bude retro! K vidění budou přístroje jako Psion 5mx nebo Palm Z22. Ze svobodného hardwaru pak Openmoko nebo čtečka WikiReader. Přijďte se i vy pochlubit svými legendami, nebo alespoň na pivo. Moderní hardware má vstup samozřejmě také povolen.
Přidat komentář

4.9.2016 20:13 /Pavel `Goldenfish' Kysilka
PR: Dne 22.9.2016 proběhne v Praze konference Cloud computing v praxi. Tématy bude např. nejnovější trendy v oblasti cloudu a cloudových řešení, provozování ERP v cloudu, o hostování různých typů softwaru, ale třeba i o zálohování dat nabízeném podnikům formou služby.
Přidat komentář

1.9.2016 11:27 /Honza Javorek
Česká konference o Pythonu, PyCon CZ, stále hledá přednášející skrz dobrovolné přihlášky. Máte-li zajímavé téma, neváhejte a zkuste jej přihlásit, uzávěrka je již 12. září. Konference letos přijímá i přednášky v češtině a nabízí pomoc s přípravou začínajícím speakerům. Řečníci mají navíc vstup zadarmo! Více na webu.
Přidat komentář

27.8.2016 8:55 /Delujek
Dnes po 4 letech komunitního vývoje vyšla diaspora 0.6.0.0
diaspora* je open-source, distribuovaná sociální síť s důrazem na soukromý
Více v oficiálním blog-postu
Přidat komentář

24.8.2016 6:44 /Ondřej Čečák
Poslední týden CFP LinuxDays 2016; pokud byste rádi přednášeli na LinuxDays 2016 8. a 9. října v Praze, můžete svůj příspěvek přihlásit, následovat bude veřejné hlasování.
Přidat komentář

9.8.2016 22:56 /Petr Ježek
Zařazení souborového systému reiser4 do jádra 4.7 znamená konečně konec patchování jádra jen kvůli možnosti použít reiser4.
Přidat komentář

12.7.2016 13:14 /František Kučera
Spolek OpenAlt zve na 130. distribuovaný sraz příznivců svobodného softwaru a otevřených technologií (hardware, 3D tisk, SDR, DIY, makers…), který se bude konat ve čtvrtek 21. července od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5).
Přidat komentář

11.7.2016 16:53 /Redakce Linuxsoft.cz
Konference LinuxDays hledá přednášející. Přihlášky poběží do konce prázdnin, v září bude hlasování a program. Více na https://www.linuxdays.cz/2016/cfp/.
Přidat komentář

   Více ...   Přidat zprávičku

> Poslední diskuze

9.11.2016 7:42 / Mane
hardwood floor waxing

8.11.2016 13:38 / Mira
Konfigurace maldet na Centos serveru

2.11.2016 11:06 / Warlock
Odkaz v PHP

20.10.2016 0:13 / Jan Kuba
Re: Basic

19.9.2016 21:04 / Marek Schoř
Poděkování

Více ...

ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2016) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze