Когда-то в ТЦИ делали исследовательский проект по интернациональной почте (то есть с не-латиницей до собаки). Я в рамках этого проекта начал реализовывать драфт по поддержке таких адресов в X.509-сертификатах. Реализовал, понятно, с ошибками, но патч засабмитил, его почитали в OpenSSL и заставили переделать драфт. В итоге документ стал RFC 8398 только в этом году.
Автор документа меня, однако, запомнил, и спросил, не допилю ли я патч. Начал допиливать и стал изживать одну из претензий к собственно патчу — зависимость от лишней библиотеки в OpenSSL сочли недопустимой. Ок, всего одна функция. Причём частично прописана в RFC в формате C-шного кода.
А дальше, блин, начинается кино. Разбить доменное имя на части по точке. Сконвертировать каждую часть в последовательность байт (UTF8 же), склеить. Не вылезя нигде за пределы буфера. А длину буфера вернуть, чтобы вызывающая сторона знала, какой буфер передать. В общем, тут даже при готовых функциях то, что на Perl с использованием библиотеки — три вызова, split, map и join, на C даёт пол-экрана.
Написать я это написал. Даже скомпилировал. А вот запускать и отлаживать страшно.
Специально для
ufm: нет, не-ASCII символы в именах доменов и email-адресах — не коварный замысел страшных любителей чебурнета, а нормальный ход нормальных любителей денег. Которым аудиторию по месту (нелатиноалфавитную) очень хочется расширить.
Автор документа меня, однако, запомнил, и спросил, не допилю ли я патч. Начал допиливать и стал изживать одну из претензий к собственно патчу — зависимость от лишней библиотеки в OpenSSL сочли недопустимой. Ок, всего одна функция. Причём частично прописана в RFC в формате C-шного кода.
А дальше, блин, начинается кино. Разбить доменное имя на части по точке. Сконвертировать каждую часть в последовательность байт (UTF8 же), склеить. Не вылезя нигде за пределы буфера. А длину буфера вернуть, чтобы вызывающая сторона знала, какой буфер передать. В общем, тут даже при готовых функциях то, что на Perl с использованием библиотеки — три вызова, split, map и join, на C даёт пол-экрана.
Написать я это написал. Даже скомпилировал. А вот запускать и отлаживать страшно.
Специально для
no subject
Date: 2018-07-19 02:39 pm (UTC)А вот мне - не приятно. И, да. Мне приходилось общаться с китайцами и в емейле и в чатике и голосом. И слава богу, что и у него и у меня были латинские буквы на клавиатуре. И мы оба худо-бедно, но английский оба знали. И свой емейл я смог продиктовать по телефону, а он его набрать.
no subject
Date: 2018-07-19 02:41 pm (UTC)no subject
Date: 2018-07-19 03:00 pm (UTC)Мне, как умеющему всё выше перечисленное, можно иметь _только_один_ емейл который, при этом, не содержит национальных символов?
Можно я буду посылать нахер всех, кто попытается мне продиктовать емейл с национальными буквами, а я в этот момент буду сидеть за компьютером на котором нет данной локали?
Можно я буду считать ... всех тех, кто вместо того что-бы послать бизнес с такими хотелками нахер, идёт на поводу ради денег?
no subject
Date: 2018-07-19 03:23 pm (UTC)Так на них и ориентируются. Вилкой не особо, а палочками - ого-го как.
Ну а как я могу тебе запретить кого-то кем-то считать, я не представляю :)