» Давайте поболтаем о новом FontLab'е

Автор: Kassian
Дата сообщения: 18.09.2003 22:14

Vouk1
Эх. Если б простые смертные могли сказать, в чем именно шрифт кривой...
[Я не иронизирую, вздыхаю совершенно искренне

]

Автор: Vouk1
Дата сообщения: 20.09.2003 05:06

YarYar
файл ушел Вам на мыло, он же и вот здесь http://aut.at.tut.by/TIMELEA_.TTF

Еще такая проблемка.
Посмотревши вот сюда http://www.unicode.org/charts/ оказывается, что кодировка в Фонтлабе уже не соответствует текущему стандарту Unicode.

Например, то что там называется Cyrillic Supplement, в FL4.6 -- все еще Unassigned zone 0500-052F. В некоторых разделах добавились новые буквы (например в Greek). Вообще довольно много поменялось.

Автор: YarYar
Дата сообщения: 20.09.2003 10:39

На первый взгляд - убиты таблицы device metrics (VDMX и LTSH). Fontograher мх не читает, поэтому шрифт открывается, а FontLab и утилиты от MS гибнут. В FL я поставлю затычку, но от всего не застрахуешься.

После посмотрю более подробно, но похоже что таблицы порушены всерьез. Интересно, чем шрифт построен.

Добавлено
Про Unicode Ranges: не уследить мне за Юникодом. Они стандарт меняют чаще чем мы FontLab

Проще всего uranges.dat отредактировать и выложить куда-нибудь для общего удовольствия.

Автор: Vouk1
Дата сообщения: 20.09.2003 17:38

YarYar, если будет возможность обновлять uranges.dat, то это снимает проблемку. Вот бы еще одновременно и прорисовки обновлять (или как это правильно назвать? -- то что нарисовано серым на сером фоне).
Я заметил, что для некоторых разделов, например для Runic, в Фонтлабе уже есть прорисовки (или как их там), но отдельных Unicode Ranges для них нет.

Со шрифтом: кажется нашел, в чем дело.
Фонт генерился из Fontographer 4.1.
Там есть чекбокс Generate Font Files>Advanced>True Type Options>Include extra True Type tables.
По умолчанию он снят, и тогда сгенеренные файлы открываются нормально Фонтлабом. А если поставить галочку, вот тогда -- не открываются.
Скорее всего, это проблема Фонтографера. Но может быть и не проблема, потому что например, Font Creator Program 3.12 этот файл открывает также без проблем. Значит, в Фонтлабе есть что исправить

Тут уже писали, что Fontlab v.3 открывает этот шрифт, и ScanFont 3.13 -- тоже открывает.

Кстати, упомянутый FontCreator хоть и не очень удобный, но им я когда-то открывал большие шрифты, которые не мог открыть ни Fontographer, ни Fontlab v.3.

Автор: YarYar
Дата сообщения: 20.09.2003 17:46

1. Uranges.dat обновлять можно. Он находится в фолдере Data. Структура его проста и понятна, кроме того, она документирована.

2. В фонте многое криво. Зачем-то сохранены таблицы, зависимые от раскладки глифов, при том что эта раскладка изменена самым зловещим образом. Конкретно FontLab убивало чтение таблицы GDEF. Если в Options > OpenType отключить чтение OpenType таблиц (первый чекбокс), то FontLab совершенно спокойно открывает этот убитый шрифт.

Остальные программы открывают шрифт нормально просто потому что многое из него и не пытаются прочитать.

Автор: Vouk1
Дата сообщения: 20.09.2003 22:14

YarYar, спасибо!

Шрифт был сделан из обычного Таймса, видно от него лишние таблицы остались, поскольку Fontographer 4.1 их не читает, они и сохранились. Все-таки Fontographer 4.1 аж в 1996 вышел, так что с него взять.

В uranges.dat действительно все ясно, но у вас там есть просто ачипятки, например идут подряд строки:

0x0D80,0x0DFF,Unassigned zone 0D80-0DFF
0x0D80,0x0DFF,Sinhala (Pre-Unicode 2.0)

Явно первую забыли удалить.

А где хранятся данные об этих вот серых рисунках на фоне? Как их можно изменять?

Автор: YarYar
Дата сообщения: 21.09.2003 00:09

Цитата:

Шрифт был сделан из обычного Таймса, видно от него лишние таблицы остались, поскольку Fontographer 4.1 их не читает, они и сохранились. Все-таки Fontographer 4.1 аж в 1996 вышел, так что с него взять.

FontLab, в общем, тоже не все таблицы понимает. Но по крайней мере отличает "безопасные" таблицы (не зависимые от раскладки глифов) и другие.

Цитата:

В uranges.dat действительно все ясно, но у вас там есть просто ачипятки, например идут подряд строки:

0x0D80,0x0DFF,Unassigned zone 0D80-0DFF
0x0D80,0x0DFF,Sinhala (Pre-Unicode 2.0)

Явно первую забыли удалить.

Не исключено. Я как-то подправлял этот файл, но это было давно. Сам я, как правило, работаю только с codepages (.cpg) или encodings (.enc). Основная проблема обычно - набрать комплект глифов и обозвать правильно. А юникод должет сам считаться в нужный момент по .nam файлу или Питоном.

Кстати советую посмотреть на FreeFontPro - бесплатный OpenType со всеми структурами. Кириллица тоже есть. Лежит у нас на сайте на страничке FontLab.

Цитата:

А где хранятся данные об этих вот серых рисунках на фоне? Как их можно изменять?

То, что появляется в Font окне? Это templates.dat - что-то типа битмапного шрифта. Редактировать его может наш BitFonter. На страничке AsiaFont Studio есть еще парочка темплейтов для скачивания.

Всего наилучшего,
Юрий Ярмола
yar[at]fontlab[dot]com

Автор: Vouk1
Дата сообщения: 21.09.2003 04:29

YarYar
Так ить BitFonter для Мака только

А templates, которые на сайте, еще 97 года выпуска, та что с Фонтлабом -- полнее, еще дорисовать бы чуть чуть.... Чем еще можно это делать?

Взялся делать uranges.dat по стандарту, сделаю -- выложу для пользы общества

.
Вопрос: можно ли там задать диапазон из двух кусков?
т. е. если есть например

0x0410,0x044F, Range1
.....................................
0x0460,0x0481, Range2

то как бы это написать в одну строку?
типа:
xxxxxxxxxxxx, Range1&2 ?

Автор: Kassian
Дата сообщения: 21.09.2003 04:35

YarYar

Цитата:

FontLab, в общем, тоже не все таблицы понимает.

А я правильно понимаю, что от версии к версии число типов таблиц, с которыми работает FL, растет? Или добавление новых таблиц не входит в Ваши планы?

Добавлено

Vouk1

Цитата:

Взялся делать uranges.dat по стандарту, сделаю -- выложу для пользы общества

Надеюсь, что там совсем не будет ошибок. Ну кроме тех, которые допустили сами лоботрясы из юникодной комиссии, чтоб им пусто было, мерзавцам

Автор: YarYar
Дата сообщения: 21.09.2003 10:43

Цитата:

то как бы это написать в одну строку?
типа:
xxxxxxxxxxxx, Range1&2 ?

Никак. Нужно указывать два диапазона. Ну или .cpg сделать.

Цитата:

А я правильно понимаю, что от версии к версии число типов таблиц, с которыми работает FL, растет? Или добавление новых таблиц не входит в Ваши планы?

Правильно. Но все таблицы поддерживаться не будут никогда - их слишком много и часть из них никогда не применялась. Больше всего таблиц наплодил Apple - где-то есть их полный список с краткими описаниями.

Кстати, чтение и запись таблиц вполне можно добавлять к FL при помощи Питона.

Цитата:

Надеюсь, что там совсем не будет ошибок. Ну кроме тех, которые допустили сами лоботрясы из юникодной комиссии, чтоб им пусто было, мерзавцам

Ну люди из технического комитета Юникода - вполне нормальные, как не странно

Другое дело в том что конференции у них слишком часто - не успевают...

Автор: Denisbox
Дата сообщения: 21.09.2003 22:13

YarYar

Цитата:

Кстати, чтение и запись таблиц вполне можно добавлять к FL при помощи Питона.

Не расскажите, как именно это можно сделать?

Автор: YarYar
Дата сообщения: 22.09.2003 00:35

Класс Font имеет параметр truetypetables. Это массив "нестандартных" таблиц (TrueTypeTable). Каждая состоит из поля tag (код таблицы) и value (данные, бинарные).

Кстати, если добавить таблицу с тэгом, который совпадает с одной из стандартных таблиц (например cmap), FL запишет именно ее, а не то, что он пишет обычно. Про Питон и FL немного есть здесь: http://www.fontlab.com/html/python.html

Все работает только если работа с нестандартными таблицами разрешена в Options > TrueType

Автор: Kassian
Дата сообщения: 22.09.2003 01:18

YarYar

Цитата:

Ну люди из технического комитета Юникода - вполне нормальные, как не странно

Это вы шутите?

Особенно, наверное, должны быть благодарны арабы, из алфавита которых забыли пару символов, и теперь Коран невозможно набрать (может, поэтому арабы так американцев не любят

).
Про несчастных славян я и не говорю. Ни одного знака ударения. Нет "а йотированного" (они думаю, что "я" и "а йотированное" - это одна буква). Ну и т.д.
Таких замечаний на несколько страниц набрать можно.

Я немножко (косвенно) знаком с этой конторой (хотя скорее всего меньше, чем вы). Когда-то примеривался разработать для них одни редкий диапазон, но не сложилось.
Юникодная комиссия - это группа алчных мерзавцев, которые не понимают, что, устанавливая сейчас кривой и ошибочный стандарт на ближайшие годы, они очень сильно гадят всему человечеству.
Это люди, которые перед компутерщиками стрят из себя лингвистов и этим отбрехиваются, а перед лингвистами строят из себя компутерщиков. А на самом деле прочто присосались к грантовой кормушке (деньги там хороши выделяются, как я понимаю).
Какие они компуторщики - не знаю, а лингвисты - они полное г-но.

Билл Гейтс - ангел по сравнению с этими безответственными гадами, т.к. Билл не монополист (Мак есть, Линукс, etc.), а они монополисты (после того как Адобе сдало формат t1 и тоже стало продвигать юникод в своих otf).
Будь у меня пулемет, я бы в первую очередь расстрелял именно юникодную комиссию

З.Ы. Про 4-хбайтовый юникод я вообще молчу - там туши свет, чем люди занимаются (и кучу бабок за свое очковтирательство получают).

Автор: Vouk1
Дата сообщения: 22.09.2003 01:36

Kassian,
а что, в самом деле это для них проблема -- добавить в стандарт пару арабских букв?!Дырки ведь там есть, отчего бы и нет? Если они уж такие экзотические письменности вставляют, на которых никто никогда не будет писать, т.к. они только в научной литературе используются (типа Linear B итп.). Вообще то бред, конечно - сложить в кучу живые письменности (т.е. те, на которых создаются новые тексты) и мертвые, на которых уже все написано.
А насчет кириллицы с ударениями - это да, просто караул. Может, просто никто не предлагал?

Автор: Kassian
Дата сообщения: 22.09.2003 01:48

Vouk1
Гы, неужто я нашел своего единомышленника, который тоже считает, что юникод - дурацкая идея.
К сожалению юникод такая же неизбежность, как и глобализация (имею в виду политико-экономический процесс).

Дык дырок-то много, но хочется, чтобы вся арабица была в одном месте, а не допихана абы где.

Добавлено
Кроме того их еще надо убедить, что у них такие-то и такие-то ошибки, а это очень сложно сделать, т.к. им самим это нафиг не надо.

Автор: YarYar
Дата сообщения: 22.09.2003 02:24

Цитата:

Это вы шутите?

Вовсе нет. Я говорил о людях, а не о Юникоде. Технического директора Юникода от Apple я знаю лет 5 (правда в связи с другими проблемами, в основном).

Цитата:

Юникодная комиссия - это группа алчных мерзавцев, которые не понимают, что, устанавливая сейчас кривой и ошибочный стандарт на ближайшие годы, они очень сильно гадят всему человечеству.

Насчет "алчных мерзавцев" - это, мягко говоря, неправда. Большая часть комитетов работает на общественных началах. Например, для упомянутого технического директора (John Jenkins) Юникод - не основная работа, хотя и важная. Он, насколько я знаю, больше озабочен тем чтобы в Mac OS X шрифты хоть как-то работали. Денег там тоже особых нет. Если б были - сам бы занялся

Вот они, эти "мерзавцы": http://www.unicode.org/consortium/directors.html

Цитата:

Когда-то примеривался разработать для них одни редкий диапазон, но не сложилось.

В этом, скорее всего, и проблема. Не ошибается тот, кто ничего не делает. Вот у них - многое сложилось: при всех недостатках, Юникод решает множество проблем. Задам простой вопрос: зная об ошибках в Юникоде, пробовали ли Вы о них сообщить? Это совсем не сложно. Прежде чем принимается очередная версия стандарта она долго обсуждается и проверяется, так что возможности для вмешательства есть.

В общем мне это напомнило обсуждение проблем FL. Интересно, как я должен был узнать об этих самых проблемах, если бы не набрел случайно на этот форум?

Кстати, напомню что Юникод НЕ ЯВЛЯЕТСЯ стандартом в формальном смысле. Это, безусловно, индустриальный стандарт, но не государственный стандарт в смысле ГОСТ.

Да. ISO 10646 основан на Юникоде, но при этом ISO принимает на себя ответственность за качество стандарта, ОБЯЗАТЕЛЬНОГО к применению в некоторых ситуациях. По этому, скорее всего, 10646 существенно отстает от Юникода.

Немного не понял насчет знаков ударения. Юникод кодирует characters, а знак ударения относится к категории glyphs. Не думаю, что Вы хотели бы чтобы слово с ударением и без него сортировались по-разному. Для обозначения ударения я бы использовал свойство символа (типа как swash версию), реализовать это можно, например, при помощи OpenType.

Об арабской части Юникода должны заботиться, прежде всего, арабы. И они в Юникоде есть. Да, символов может не хватать. Но арабский скрипт "покрывает" несколько языков с очень разным набором символов и глифов. Кстати, арабский как раз очень сложный скрипт в этом смысле, на мой взляд - сложнее китайского (где кроме подавляющего количества символов особых проблем нет).

Цитата:

Вообще то бред, конечно - сложить в кучу живые письменности (т.е. те, на которых создаются новые тексты) и мертвые.

Довольно сложно провести грань между "живыми" и "мертвыми" письменностями. Санскрит - живой или мертвый? А латынь? А египетское иеолглифическое письмо? Очевидно - мертвое, но при этом оно может понадобиться большему числу людей, чем письменность одного из малых вымирающих народов.

А что не так с SMP (видимо это имелось в виду под 4-х байтным Юникодом)?

Добавлено
Посмотрел на список участников Юникода и обнаружил следующее:

1. DecoType - ассоциированные члены. Их шеф, Tomas Milo, знает про арабский скрипт больше многих арабов. Я с ним знаком, он как-то даже как-то в Питер приезжал. В общем, если будет большое желание что-то поправить в арабских зонах Юникода - могу с ним связать. По-русски он тоже немного понимает.

2. Смотрел старательно, но не нашел ни одной русской компании или индивидуального члена. И кто должен отстаивать интересы кириллицы? Замечу, что и Пакистан и Индия - полновесные члены Юникода, а иранцы, китайцы и служители иеговы - ассоциированные члены. Видимо у нас "свой путь", а о правильном применении нашей письменности должен Микрософт заботиться...

О пользе глобализации можно спорить, но это - объективная реальность и собственные интересы надо отстаивать.

Добавлено
Подумал про ударения. Действительно, все немного сложнее чем сходу показалось. Можно разглядеть несколько возможных решений, но сначала хотелось бы посмотреть на то, что уже есть в Юникоде.

Про "дырки". Тут нет ничего страшного. Невозможно было сразу учесть все, поэтому практически все скрипты рано или поздно окажутся разнесены на несколько диапазонов.

Автор: Vouk1
Дата сообщения: 22.09.2003 03:42

YarYar,
разницу между живыми и мертвыми письменностями я обозначил: на живых создаются новые тексты, а те, что написанные на мертвых - только изучаются. Древнеславянский, например - мертвый, тексты на нем написанные - все пересчитаны. Конечно, можно попробовать и на нем писать и даже говорить, как и по-древнеегипетски, но только разве ради прикола. Или вот по-эльфийски (Tengwar в стандарт Unicode включен

) Тут уже не вопрос глобализации. Но, конечно, не всегда эта разница между живыми и мертвыми очевидна.

А как вообще можно подать предложение по внесению изменений? У меня есть одно совсем небольшое уточнение (насчет кириллицы), куда об этом писать и как надо аргументировать?

Добавлено

Цитата:

Для обозначения ударения я бы использовал свойство символа (типа как swash версию), реализовать это можно, например, при помощи OpenType.

Ну а как вот например латинские буквы с акутами и множеством прочимх диакритиков? Они ведь реализованы как отдельные cимволы. Вот таким манером хорошо бы и кириллицу с ударениями сделать. Подозреваю, что действительно некому было позаботиться.

Kassian,
а какой это ты диапазон собирался разрабатывать, если не секрет

про себя
Эх... маньячество, чтоб его....

Автор: fontomas
Дата сообщения: 22.09.2003 11:53

Меня нередко упрекают в том, что обращаю внимание на мелкие баги, когда более серьезных масса, однако рискну...

YarYar
Фича с альтернативным интерфейсом достаточно прикольна, но к сожалению не нашел переключателя интерфейса в программе. Т.е. при первом старте он предлагает выбрать интерфейс, после ознакомления с альтернативным фейсом (который, кстати показался мне менее удобным, хотя, видимо в большей степени это наверное дело привычки) мне, например, что бы вернуться к стандартному пришлось лезть в реестр... Лучше бы кнопку в программе. Или я опять чего-то не нашел?..

А, кстати, вот еще. Вчера случайно обнаружил в TypeTool 2 отсутствие команды Delete Intersection... Это баг или фича?..

И еще, Юрий, если не секрет, когда нам ждать Scanfont 4 под Windows?.. Уж очень хочется...

Автор: YarYar
Дата сообщения: 22.09.2003 12:16

Цитата:

Или я опять чего-то не нашел?..

В FontLab весь интерфейс настраивается. Почти все тулбары, клавиши и меню. Так что не надо себя ограничивать двумя вариантами интерфейса.

Цитата:

Вчера случайно обнаружил в TypeTool 2 отсутствие команды Delete Intersection... Это баг или фича?..

Из TypeTool удалено все, без чего можно обойтись. Эффекта Delete Intersection в большинстве случаев можно достичь при помощи Merge Contours и Reverse Contours.

Цитата:

когда нам ждать Scanfont 4 под Windows?..

Работаем. Придется пока подождать. А что не хватает в SF3? Трассёр там такой же.

Автор: Denisbox
Дата сообщения: 22.09.2003 17:33

YarYar

Спасибо

Автор: YarYar
Дата сообщения: 22.09.2003 18:20

Цитата:

А как вообще можно подать предложение по внесению изменений? У меня есть одно совсем небольшое уточнение (насчет кириллицы), куда об этом писать и как надо аргументировать?

Я думаю, что начать стоит с посещения сайта www.unicode.org. Там, например, есть mail list.

Цитата:

Ну а как вот например латинские буквы с акутами и множеством прочимх диакритиков? Они ведь реализованы как отдельные cимволы. Вот таким манером хорошо бы и кириллицу с ударениями сделать. Подозреваю, что действительно некому было позаботиться.

С диакритикой все интересно: собственно, готовые символы (Agrave какой-нибудь, например) считаются не самым удачным решением. Просто так сложилось, что они есть. Называются такие символы precomposed. Другое решение, (composites) предполагает раздельный ввод базового символа и акцента. То есть вводим А, потом grave и получаем A+grave. Технически эффект достирается средствами OS при помощи OpenType или AAT на Маке.

Я так и не понял, какой из вариантов нынче в моде. Честно говоря, нет времени во всем этом как следует разобраться.

И, конечно, я был не прав: слова с одинаковыми символами, но разным ударением (то есть разные слова по смыслу - пИсать и писАть, например) сортироваться, скорее всего, должны по-разному. Вопрос только - как?

Автор: Denisbox
Дата сообщения: 22.09.2003 23:00

Хотелось бы ещё обратить внимание на тот факт, что OpenType существуют достаточно давно, а вот программы поддерживающие большинство функций шрифта, можно пересчитать по пальцам...

Обидно, что до сих пор нет текстовых редакторов, предназначенных в первую очередь для рядовых пользователей...

Автор: Kassian
Дата сообщения: 22.09.2003 23:39

Ух, ну и разговор пошел!

1. Давайте будем все на "ты", ради удобства.

2. Признаю, что я слишком несдержанно употреблял эпитеты. Искренне прошу прощения, если обидел кого-то из людей, уважаемых Юрием.

3. Я профессиональный структурный лингвист, а также специалист по древним языкам - это одна из моих профессий.

4. Задача разработки кодировки для писменности X - это прежде всего задача построения АЛФАВИТА этого X'а (термин алфавит использую не смысле школьного учебника, а в широком смысле - набор смыслоразличительных знаков). Для меня как для лингвиста эта задача представляется одной из самых тривиальных в лингвистическом описании. В современный английский алфавит не входит знак "t swash", т.к. нет слов противопоставленных при помощи "t" и "t swash"; "t swash" - это позиционный и факультативный вариант графемы "t". Но! в современный русский алфавит безусловно входит буква "о с ударением". Ударение имеет смыслоразличительную роль, т.к. союз "что" и местоимение "что" различается этим. В любой грамматике будет написано, что местоимение "что" в некоторых случаях (в начале предложения) должно писаться с ударением, чтобы отличасть от союза. Все сказанное относится и к другим гласным буквам русского алфавита.

5. Я утверждаю ("за базар отвечаю"), что комиссия по юникоду состоит из лингвистически безграмотных людей. Что она состоит из людей ленивых и безответственных, которые не потрудились овладеть материалом даже на таком элементарном уровне, как алфавит, но при этом эти люди беруться за составление единого мирового стандарта писменности.

6. Несколько примеров (не будем касаться арабицы и евреицы, в которых я не слишком петрю).
Пример №1 я привел выше - это русские ударения. Мы не можем в рамках юникода грамотно набрать современный русский художественный текст.

Цитата:

Немного не понял насчет знаков ударения. Юникод кодирует characters, а знак ударения относится к категории glyphs. Не думаю, что Вы хотели бы чтобы слово с ударением и без него сортировались по-разному. Для обозначения ударения я бы использовал свойство символа (типа как swash версию), реализовать это можно, например, при помощи OpenType.

Так все равно, должны быть выделены юникод номера. А запихнуть ли это в OpenType - можно и так, а можно и не запихивать. Как я понимаю, проблема таблиц OpenType никак не относятся к проблеме выделеня юникод диапазона.

7. Пример №2.
Как известно, в старославянской азбуке (кириллице) и в древнерусском ее варианте были т.н. йотированные буквы: "а" с палочкой слева, "е" с палочкой, и у. "Йотированное у" осталось и сейчас в виде буквы "ю" (т.к. звук "у" писался на греческий манер как "оу", а его йотированный вариант как "ю"). "Йотированное е" исчезло примерно в эпоху Петра I (если мне не изменяет память, лень проверять). В это же время "йотированное а" приобрело скорописное начертание и превратилось в известную нам букву "я".
Теперь, что мы имеет в юникоде. Там есть "йотированное е" (ну как же! русским надо набирать их древние тексты. Спасибо юникодчиком за такую заботу). Там есть, ясен пончик, буква "я". Но там нет буквы "йотированное а"!!! Мы не можем в рамках юникода набрать древнеславянский текст: есть юсы, есть ять, но нету "йотированного а"!
Готов спорить на что угодно, что господа юникодчики обратились к кому-нибудь слависту (которых в Америке пруд пруди) и он им сказал, не подумав о последствиях, что мол "я" и "йотированное а" - исторически суть одна буква. Опля, подумали юникодчики, нафига нам плодить разные начертания одной и той же буквы... Занавес.

8. Пример №3.
Как известно, был такой язык - коптский. Лингвистически - наследник древнеегипетского, но не суть. Важно, что копты использовали древнегреческий алфавит. Они добавили несколько новых символов, но самое главное, они использовали несколько другую манеру письма. Разница между коптским письмом и древнегреческим примерно такая же, как между церковнославянским (шрифт типа Ижица) и простым гражданским кириллическим.
Что сделали юникодчики. Они выделили специальный коптский диапазон... и запихнули туда только те символы, которые отсутствуют в греческом диапазоне. Молодцы, ребята! Видна напряженная работа ума! Я вот не понимаю, они что, место экономили что ли?
Для тех, кто не понял: мы не можем сейчас корректно набрать коптский текст. Мы должны набирать его греческими буквами, а дополнительные брать из коптского диапазона. Выглядеть это будет так же ужасно, как если кириллический текст набрать Таймсом и повставлять туда ять из Ижицы.

Продолжать ли мне список этих перлов? (Я могу это еще долго делать, если начать копаться.)

9.
Цитата:

А что не так с SMP (видимо это имелось в виду под 4-х байтным Юникодом)?

Вместо того, чтобы взяться за ум и поиправлять свои ошибки, они занимаются разработкой новых диапазонов. Это очень важные для человечества диапазоны. Развитие цивилизации уже завтра остановится без этих диапазонов. Невозможность набрать русский или коптский текст - это просто мелочи. Есть более важные задачи.
Вот пример такого нового диапазона. Это диапазон для математиков. Как известно, в математике используются прописные греческие буквы, причем курсивные. Казалось бы, в чем проблема: греческие буквы уже есть, курсивное начертание у шритфа есть. "Нет!", решили наши герои. Идеология юникода - "все-в-одном-шрифте". Мы не можем бросить бедных математиков на произвол судьбы. И в юникод (для шрифта прямого начертания!) запихивается диапазон с курсивными греческими буквами. Отметьте: всеми буквами, от альфы до омеги. Кто уже начал улыбаться? Прекратить смеяться! Юникод это не шутки!
Ну а я просто валялся по полу когда это услышал: курсив в прямом шрифте - это фигня, механическое дублирование греческого алфавита - тоже фигня. Самое смешное, что в математике используются только некоторые греческие буквы, а не все. Прописные альфа или омикрон не используются никогда, т.к. они совпадают по своему виду с латинскими A и O. No comments.

10.
Цитата:

а какой это ты диапазон собирался разрабатывать, если не секрет

Совершенно не секрет. Примеривался к клинописи, т.к. это одна из моих лингвистичеких специализаций. Слоговое письмо палочкой на глиняных табличках. Изобретена шумерами в Двуречье на рубеже 4-3 тыс. до н.э. Просуществовала вплоть до н.э. Использовалась кучей народностей. Имеет кучу изводов отличающихся, примерно как латиница от кириллицы. Инвентарь насчитывает несколько тысяч знаков.
Разработать хорошую и удобную кодировку для этого дела - задача очень кропотливая. Думаю, заняло бы уж не меньше года. Года три назад юникодчики как раз искали человека, который бы за это взялся (представляю, кого они нашли, если вообще нашли).
Отказался я от этого плана почти сразу, т.к. это дело ну абсолютно бессмысленное. Клинопись никому не нужна. Клинописные тексты транслитерируют латиницей с небольшим кол-вом диакритики. Иногда автор научной работы хочет вставить именно клинописный знак, он рисует его от руки - но в таких случаях шрифт не нужен, т.к. речь идет об палеографии, т.е. важно именно это индивидуальное начертание знака, а не унифицированная форма, которая будет в шрифте.

11. Вывод.
Может быть члены юникодной комиссии - милейшие люди. Может быть они гениальнейшие программисты. Но они абсолютные профаны в лингвистике, а кроме того просто безответственные люди. Беруться за то, в чем ничего не смыслят, и более того, даже не пытаются разобраться в этих, новых для них предметах.
По-хорошему, весь современный юникод надо было бы засунуть в помойную корзину и начать разрабатывать стандарт с нуля.

Vouk1

Цитата:

Эх... маньячество, чтоб его....

Мне кажется, все участники этой ветки маньяки. И это хорошо

Прогресс ровно таким маньячеством и движется.

Автор: Vouk1
Дата сообщения: 23.09.2003 00:57

Kassian

Цитата:

Готов спорить на что угодно, что господа юникодчики обратились к кому-нибудь слависту (которых в Америке пруд пруди)

imho ты слишком резок. Ты же не знаешь, как оно там было, а прямо уж мысли ихние читаешь. Обращался ли ты к ним со своими замечаниями? Если да, то что ответили? A кроме ударений, нужны еще и буквы с обратным ударением (grave), а также с двойными acute и grave, да еще много чего, что используется в лингвистике, и уже сделано для латиницы. Но про это ведь в первую очередь должны были позаботиться те, кто собирается этим пользоваться. Я бы выдвинул претензии скорее, к российским славистам, которые никуда ни к кому не обращались. А копты уж пущай сами о себе позаботятся. Кстати, ’греческий диапазон’ в стандарте так и называется Greek and Coptic.
Хотя местами я с тобой согласен.

YarYar

Цитата:

С диакритикой все интересно: собственно, готовые символы (Agrave какой-нибудь, например) считаются не самым удачным решением.

Хм, совсем недавно (кажется, с год назад?) в Cyrillic добавили две буквы для македонского языка:
0400 CYRILLIC CAPITAL LETTER IE WITH GRAVE
040D CYRILLIC CAPITAL LETTER I WITH GRAVE
Так что не все потеряно.
Вопрос к вам: как в uranges.dat прописать диапазоны, начинающиеся с 10000? например,
10000-1007F Linear B Syllabary
Никак не получается.

Автор: Kassian
Дата сообщения: 23.09.2003 01:06

Vouk1
Нет, не обращался. Готов выслушать справедливые упреки в своей лености

Автор: YarYar
Дата сообщения: 23.09.2003 01:18

Цитата:

Обидно, что до сих пор нет текстовых редакторов, предназначенных в первую очередь для рядовых пользователей...

Почему же? MS Word вовсю использует OpenType для рендеринга некоторых хитрых скриптов. Скорее всего, Вы имели в виду так называемые типографические фичи (advanced typography features) - их действительно никто, кроме Adobe, не поддерживает. Насколько я знаю, ситуация постепенно меняется. Выпущено уже много OpenType шрифтов и еще больше находится в разработке. Понимание, что advanced typograpy - это хорошо тоже постепенно проникает в массы

Цитата:

Задача разработки кодировки для писменности X - это прежде всего задача построения АЛФАВИТА этого X'а.

Так и есть. Они в Юникоде стараются в последнее время глифы с символами не путать. Хотя был грех, наплодили "presentation forms" без меры...

Цитата:

Но! в современный русский алфавит безусловно входит буква "о с ударением".

Все же не буква, наверное, а вариант буквы. Так же как Ё - акцентированный вариант Е (в отличие от Й, которая ничей не вариант, а вполне самостоятельная буква). Мне кажется, что нужен символ кириллического ударения, который бы срабатывал совместно с гласной.

Цитата:

Ударение имеет смыслоразличительную роль, т.к. союз "что" и местоимение "что" различается этим.

Это я понял и признал свою ошибку. Ударение не менее важно в русском чем некоторые акценты в европейских языках. Только повторю свой вопрос - кто это объяснит Юникоду, если там русских нет?

Цитата:

Но там нет буквы "йотированное а"!!! Мы не можем в рамках юникода набрать древнеславянский текст: есть юсы, есть ять, но нету "йотированного а"!

Тут я немного знаю, к сожалению. Я вседа считал, что Я и йотированное А - действительно разные изображения одной буквы. Хотя мне это кажется странным. Но в кириллическом диапазоне есть место - можно заставить их ввести нужные символы. А что такое 0466?

Цитата:

Они выделили специальный коптский диапазон... и запихнули туда только те символы, которые отсутствуют в греческом диапазоне.

И абсолютно правильно сделали! Если копты "использовали греческий алфавит" - то зачем плодить лишние коды если они УЖЕ ЕСТЬ? Не надо путать зону Юникода и кодовую страницу (читай - клавиатурную раскладку), удобную для набора. Win XP позволяет создавать собственные раскладки и мешать туда что угодно, хоть кириллицу, хоть греческий, хоть все сразу.

Цитата:

Выглядеть это будет так же ужасно, как если кириллический текст набрать Таймсом и повставлять туда ять из Ижицы.

Ничего подобного! Снова - путаница. Есть буква, есть код, а есть шрифт - набор картинок для отображения букв. При использовании правильного шрифта, в котором есть и греческие и коптские буквы, никакох проблем не будет. Никого ведь не удивляет, что при наборе большинством кириллических шрифтов латиницу тоже можно использовать?

Цитата:

Как известно, в математике используются прописные греческие буквы, причем курсивные.

(Курсивные -- в смысле "похожие на рукописные", старо-греческие, а не в смысле "наклонные" -- это я для ясности).

Все же мне кажется, что греческое пи и математическое пи - есть сущности разные (относятся к разным алфавитам) и их надо различать. Хотя бы для целей сортировки. Заметим отличие от примера с коптским языком, в котором греческие символы - действительно относятся к греческому алфавиту.

Цитата:

Прописные альфа или омикрон не используются никогда, т.к. они совпадают по своему виду с латинскими A и O

Это ошибка. И альфу и омегу надо использовать правильно. Встречный вопрос - а почему тогда не использовать латинские A и O вместо кириллических? А греческие - вместо латинских? Ведь исторически эти буквы имеют одинаковый смысл и возникали одна из другой. Где граница между исторически связанными алфавитами?

Цитата:

Разработать хорошую и удобную кодировку для этого дела - задача очень кропотливая. Думаю, заняло бы уж не меньше года. Года три назад юникодчики как раз искали человека, который бы за это взялся (представляю, кого они нашли, если вообще нашли).

А то, что в Юникоде 4 добавлено (всякие картинки из черточек) - это не оно? Честно говоря, знаю об этом немного. В общем, почти ничего и не знаю.

Цитата:

Беруться за то, в чем ничего не смыслят, и более того, даже не пытаются разобраться в этих, новых для них предметах.
По-хорошему, весь современный юникод надо было бы засунуть в помойную корзину и начать разрабатывать стандарт с нуля.

Этот вывод мне кажется по меньшей мере странным. Если следовать такому подходу, то ничего никогда ни в одной области деятельности сделано не будет. Это позиция кажется агрессивной, но на самом деле она более чем пассивная

Например, вернемся к теме ветки: я больше других осведомлен о недостатках FontLab. Но это не значит, что я должен его "засунуть в помойную корзину и начать разрабатывать с нуля". То есть я, может бы и хотел это сделать, но, боюсь, многие пользователи меня не поймут. Так же и с Юникодом

Цитата:

Прогресс ровно таким маньячеством и движется.

Относительно меня спешу разочаровать. Все исключительно из-за денег

Вот снег и горы - это другое дело!

Добавлено

Цитата:

Вопрос к вам: как в uranges.dat прописать диапазоны, начинающиеся с 10000? например,
10000-1007F Linear B Syllabary
Никак не получается.

Никак и не получится. SMP в FL поддержаны очень странным способом - коды больше 10000 нужно задавать в имени символа. Юникоды в FL не более чем 16-битные.

Единственное решение - создать .enc файл с соответствующими именами. Да, все это заработало только в 4.6, причем с багом, который будет поправлен в 4.6.1.

Автор: Kassian
Дата сообщения: 23.09.2003 01:52

YarYar

Цитата:

Я вседа считал, что Я и йотированное А - действительно разные изображения одной буквы. Хотя мне это кажется странным. Но в кириллическом диапазоне есть место - можно заставить их ввести нужные символы. А что такое 0466?

0466 - это "юс малый" (я носовое). Отдельная буква.

Цитата:

И абсолютно правильно сделали! Если копты "использовали греческий алфавит" - то зачем плодить лишние коды если они УЖЕ ЕСТЬ? Не надо путать зону Юникода и кодовую страницу (читай - клавиатурную раскладку), удобную для набора. Win XP позволяет создавать собственные раскладки и мешать туда что угодно, хоть кириллицу, хоть греческий, хоть все сразу.

Да нет же. Коптская альфа очень похожа на греческую, но не идентична ей! У коптских букв другое пОшиб. Это таже история, что и с деванагари - новоиндийские писменности (например язык Бенгали) используют деванагари, но заслуживают отдельных диапазонов, т.к. это деванагари с особым начертанием знаков.

Цитата:

Все же мне кажется, что греческое пи и математическое пи - есть сущности разные (относятся к разным алфавитам) и их надо различать. Хотя бы для целей сортировки.

Да, все так. Но только Альфа и Оимкрон не входят в математический алфавит. Математики их не используют.

Цитата:

А то, что в Юникоде 4 добавлено (всякие картинки из черточек) - это не оно?

Видимо, нет. Я чего-то сейчас посмотрел и не нашел, может плохо смотрел. Увидел Угаритский силлабарий - он тоже на основе клинописи (просто слямзили значки у соседей), но в нем несколько десятков знаков. А в настоящей клинописи несколько тысяч.

Цитата:

Этот вывод мне кажется по меньшей мере странным. Если следовать такому подходу, то ничего никогда ни в одной области деятельности сделано не будет. Это позиция кажется агрессивной, но на самом деле она более чем пассивная Например, вернемся к теме ветки: я больше других осведомлен о недостатках FontLab. Но это не значит, что я должен его "засунуть в помойную корзину и начать разрабатывать с нуля". То есть я, может бы и хотел это сделать, но, боюсь, многие пользователи меня не поймут. Так же и с Юникодом

Не-а

Подтасовка. FL- не является стандартом и монополистом. Если у тебя получилась хорошая программа, все скажут спасибо. Если бы получилось плохо, то никто бы не стал тебя проклинать.
А юникод это стандарт, по которому человечество будет жить ближайшие десятки лет. Тут задача намного более ответственная.

На самом деле, видимо, я не понимаю какой-то концептуальной вещи. Не мог бы ты мне объяснить разницу между символом и глифом с точки зрения юникод номера?
Я считал, что разницы никакой нет. У каждого элемента есть свой юникод номер. А дальше уже можно составлять опентайпные таблицы подстановок, etc.
Например в адобевских otf все эти своши и прочие типографические вкусности зафигачены в прайват ареа, но все равно со своими номерами. А как еще может быть (без номеров в смысле)?!

Автор: Vouk1
Дата сообщения: 23.09.2003 05:52

YarYar

Цитата:

Так же как Ё - акцентированный вариант Е (в отличие от Й, которая ничей не вариант, а вполне самостоятельная буква).

Возможно, в русском так, а вот в белорусском разница между Ё и Е существенная.

Тут еще и другие проблемки есть.
Вот например
0406 CYRILLIC CAPITAL LETTER BYELORUSSIAN-UKRAINIAN I
Эту букву во всех шрифтах рисуют в точности как латинскую I.
Но в докомпьютерных нормальных изданиях она была традиционно с точкой сверху. Типа ’Idot’ (0130), только точка жирнее. Я об этом и хочу в unicode сообщить.
(В дореволюционной российской орфографии такая буква тоже была, жаль, у меня нет изданий того времени, интересно, как она тогда печаталась?)

Еще вот у сербов в курсивном начертании очень своеобразно выглядят буквы ’т’, ’п’,’г’, ’д’. В адобовских шрифтах эти варианты есть, но в unicode их нет.
см. http://partners.adobe.com/asn/developer/pdfs/tn/5013.Cyrillic_Font_Spec.pdf
afii10063, afii10064, afii10192, afii10831, afii10832, afii10846

Автор: YarYar
Дата сообщения: 23.09.2003 09:26

В общем, эту дискуссию надо перевести и отослать в Юникод

Привет из Франкфурта!

Автор: Kassian
Дата сообщения: 23.09.2003 12:13

YarYar
Да. Но только все время руки не доходят, т.к. по хорошему, это тоже запара на несколько недель - сформулировать основные претензии и предложения. Но ты знаешь, сколько раз я себя проклинал за эту леность

Цитата:

Привет из Франкфурта!

А у меня не склалось поехать

Интересно на ярмарке?

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

Предыдущая тема: COREL Draw vs Adobe Illustrator vs Macromedia FreeHand

Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.