November 10, 2009

Кодировки

Когда компьютеры были большими, а память "маленькой", не хватало места даже записывать год четырмями цифрами. А уж о том, что есть символы не только латинского алфавита никто не думал.
Ну почему было не использовать сразу UTF?
Теперь мучаемся. На старом линух сервере имена файлов в KOI-8R, самба их выдает в DOS866, в базу приходится писать в WIN1251. Упустишь один момент и диск загромождается кучей кракозяб.
А вчера вообще упала CMS при переносе хостером на новый сервак.
Ладно вывод страниц поменялся, там хоть понятно - перекодировал базу и всё.
Так дерево страниц не отображалось в админке и почему не понятно, ведь вроде всё поменял. 8 часов боя дали таки результат: сервер к моему заголовку о посылке xml добавлял charset=cp1251. А мокрохвостовский ActiveX копонент XMLDOM записывал в ответ что не знает такой кодировки. Только ответ этот нигде не виден. Пошаговая отладка в Visual Studio показала этот результат. А о том, что за кодировка удалось узнать только средствами Инструментов разработчиков из десятой Оперы.
Конечно нужно было сразу писать нормально - со всеми проверками и выводом ошибок, но кто мог подумать об этом четыре года назад, запустилось на одном хостинге и ладно... В общем сам дурак.
Была бы одна кодировка сколько бы сил и нервов экономили...
Хотя мои причитания сравни переживаниям по поводу строительства Вавилонской башни. Не начни они тогда строить, говорили бы на одном языке и не ждал бы я сейчас пока появится перевод очередной серии Доктора Хауса. Английские титры уже есть, а русские только через пару часов будут. Мог бы и на английском посмотреть, но лень...
Эх... НЕ надо было её строить, Башню эту... И с кодировками проще было бы...