Da sa nejako zistit v akom kodovani (windows-1250, ISO-8859-2, UTF8...) je text ktory uploadujem z webovej stranky na server napriklad pomocou formulara?
dá. je tam malej problém: některé prohlížeče totiž neodesílají v hlavičce http kódování. v tom je ten problém. dá se to nakonec jistými metodami zjistit a to s přesností na 98% možná ještě víc. jenom kontrolovat (a porovnávat) daný znaky. ještě jsem s tim nedělal, ale vim že se to takto někde používá.
a neni kodovani nahodou totozny s tim, ktere je na odesilaci strance formulare?
je. ale když prohlížeč neodešle hlavičku, tak PHP na další stránce neví. potom ho považuje za iso-8859-2. (ale teď nevim jestli nekecám.. ale myslim, že je to to iso)
ale TY prece vis, jake kodovani na webu pouzivas, ne? Neridis se hlavickama, ale vlastnim nastavenim.
Je pravda ze viem ake kodovanie pouzivam, ale mna zaujima co pride od klienta. Ked mi napise nejaky Jozo Omacho prispevok napriklad v Linuxe a odosle to, dost pravdepodobne mi pridu data kodovane v ISO-8859-2. Ked mi tam zas napise Jano Odrbo s Windows tak asi pride windows-1250 (ani nechem vediet aky bordel by prisiel z Ciny). Ja potrebujem zistit o ake kodovanie sa jedna. Lebo ked to co pride od klienta ulozis (DB alebo subor) a potom posles webovemu prehliadacu hlavicku ze to je win-1250 a ono to win-1250 nebude tak bude stranka dost pravdepodobne pekne zaprasena. Nechcem pismenka s diakritiou odstranovat nasilim (aj ked nasilnicke sklony by som si kvoli tomu mohol vypestovat). Samotna konverzia medzi jednotlivymi kodovaniami mi problem nerobi.
pak to tedy zopakuji:
dá se to nakonec jistými metodami zjistit a to s přesností na 98% možná ještě víc. jenom kontrolovat (a porovnávat) daný znaky. ještě jsem s tim nedělal, ale vim že se to takto někde používá.
Myslím, že to naprosto jasně zodpověděl donny. Ty si vytvoříš formulář a té stránce zvolíš kódování. KDOKOLI si ten formulář otevře, podle meta tagu se mu nastaví toto kódování a v tom kódování se odešlou texty. Tedy, od klienta přijde takové kódování, jaké TY nastavíš.
Jediný problém by možná (nevím jistě) mohl nastat v kombinaci Linux - win-1250 (přece jenom je to Majkrosoftí výmysl). Nicméně, pokud zvolíš iso-8859-2 nebo utf-8, neměl by být problém. Nejběžnější prohlížeče všechna tato kódování podporují.
to zbi> DAKOVALA, DAKOVALA! Teraz mozem kludne spavat a kodovat (popripade kodovat v spanku alebo snivat o kodovani v spanku ked spim).
>Jediný problém by možná (nevím jistě) mohl nastat v kombinaci Linux - win-1250
Nemohl. Rozdil mezi iso-8859-2 a Windows-1250 je v tom, ze Microsoft si nechal vypracovat charset pro stredni Evropu od firmyy Software Slušovice pro Win3.0. Ta vypracovala tabulku na bazi iso-8859-2 a do oblasti puvodnich ridicich znaku (128-159) umistila semigraficke symboly. Toto predali Microsoftu. Ten ale tuto tabulku upravil tak, ze netkere znaky (š,ť,č...) presunul z puvodnich pozic prave do te ridici oblasti, patrne, aby vyvolal nekompatibilitu s UNIXem (konkurence). Ale stejne tak, jako Windowsove aplikace podporuji kodovani iso-8859-2, tak linuxove aplikace podporuji windows-1250.