bdfy Цитата: разрешение ему подавай от 600дпи
Это, наверно, чтобы он мог распознавать индесы индексов.
Цитата: мне кроме демки ихней ни одного листа формул распознать так и не удалось
А мне удалось.
Вот пример:
Ваш файл test_tiff.rar (размер 281 кбайт)
доступен по адресу: webfile.ru/259724 в течение 21 дня до 04:34 06.05.2005.
Ваш файл test_iml.rar (размер 87 кбайт)
доступен по адресу: webfile.ru/259727 в течение 21 дня до 04:40 06.05.2005.
Мои выводы:
С тех пор, как Ридер стал запускаться из командной строки, стал работать корректнее:
вылетает не так часто, правда не некоторых сканах в 600 dpi всё равно вылетает без объяснения причин - то ли не нравятся ему неидеальные буквы, то ли пугается каких-то математических символов.
Так что для перевода электронных документов в редактируемый формат еще может сойти, но не советую пробовать распознавать реально отсканированные в 600 dpi книги.
Хронически путает в формулах латинское "а" и греческое альфа.
Хронически распознаёт запятую как закрывающую скобку.
Вы только посмотрите, что он делает с английским предлогом "on" - буква "о" и большой символ дизъюнктного объединения!
Естественно, путает курсивный текст с математикой.
На последней странице $D_x^{\epsilon_1}\subset D_x^{epsilon_2}$ распознал как $D_{x^1}^{\epsilon}\subset D_{x^2}^{\epsilon}$, т.е. распознал нижние индексы у верхних индексов как верхние у нижних - вот вам и нейронные сети.
Вообще иногда путает символы, а также текст и математику.
Я распознавал за один раз сразу несколько тиффов - так он зачем-то каждый распознал дважды.
Несмотря на мои баг-репорты доктору Сузуке, символы суммы, пересечения, тензорного произведения, пустого множества, многие готические буквы так и не отображаются.
С символом бесконечности есть прогресс - в текстовом режиме он отображается, в математическом нет.
В своем родном формате iml сохраняет. (Не хватало, чтобы еще и в нем не сохранял!
Хотя когда-то и такое было.) В html сохраняет (с формулами в png) - суммы не отображаются тоже. Даже в xml (mathml) сохраняет, но он ИнтернетЭксплорером не читается, зато Мазиллой читается - причем тут суммы уже отображаются.
Но ни в tex, ни в human readable tex не сохраняется!
Это при том что и его родной latex стоит, и нормальный miktex и еще куча всего. Не знаю, может, кроме того, что прописать переменные среды, надо было еще вокруг него потанцевать с бубном?
На самом деле распознаёт лучше, чем можно было ожидать. Кроме шуток! Хотя, конечно, далеко не так идеально, как родные демки - естественно.
Хорошо бы пообкатывать на большем числе разных файлов.