(1) Не совсем понимаю вопрос. В Юникоде явно описано соответствие precomposed букв и комбинаций. Например, Й = И + ̆. У некоторых комбинаций precomposed форм нет. Ну, строго говоря, у большинства потенциально возможных нет, но у большинства полезных -- есть. Хотя есть исключения. Или тебе интересно, в нормализованном виде тебе шлют спам или нет? А чем это так интересно?
(2) Где-то я видел библиотеку (на go, но это не важно, важна идея :-) специально для создания таких вот "красивеньких" текстов случайным раскидыванием точечек над-под буквами.
... А мой кибер бросит писать стихи и начнёт слушать музыку ...
Означает ли факт существования precomposed-формы факт её существования в диком виде? То, что я проверил (текст уже убил, но кое-что запомнил, например обе буквы O в слове looking) было в виде одного символа, но живьем не видел. Часть символов живьём видел и знаю, из какого алфавита.
Практически уверен, что да. В частности, предполагаю, что обе буквы O из вьетнамского. Но проверять прямо сейчас не буду, я уже и так на целую минуту опаздываю! ;-(
Вернулся. Не, не вьетнамский. Ливский. Причём искать пришлось через французскую википедию. Я сам офигел, чё! А из вьетнамского было бы, например, Ồ или Ộ (тоже в один символ).
... Once upon a time, in a galaxy far, far away ...
Тупо погуглил букву, и посмотрел, нет ли ответа из википедии (на любом языке, капризничать не приходится). Потому что wiktionary и graphemica дают справку по юникоду, но не по языкам, где это встречается. Ну вот нашлось во французской википедии (про одну из двух ещё в норвежской). Я во французском ни бум-бум (исправлено :-), но это и не требуется, там "по смыслу" можно догадаться.
Вдогонку: известная мне с ходу буква, для которой нет precomposed формы, но которая существует в диком виде: G̃g̃. Наверняка и другие есть, но про эту я знал.
no subject
no subject
Хотя популярность у них уже низкая, конечно.
Я сейчас с мобильного интернета и мне будет очень тяжело искать. Попробуйте поискать по запросу "распознать кодировку".
no subject
no subject
no subject
no subject
no subject
no subject
no subject
(2) Где-то я видел библиотеку (на go, но это не важно, важна идея :-) специально для создания таких вот "красивеньких" текстов случайным раскидыванием точечек над-под буквами.
... А мой кибер бросит писать стихи и начнёт слушать музыку ...
no subject
no subject
... Das Imperium schlägt zurück ...
no subject
... Once upon a time, in a galaxy far, far away ...
no subject
Еще, пожалуй, интересны перечеркнутая A, С с точкой и перечеркнутое H. Как ты искал?
no subject
... Навязчивое мудрствование в утренние часы ...
no subject
no subject
no subject
... Шестикрылый серафим на перепутье ...
no subject
... In Soviet Russia, English pidgins YOU!! ...