Ru-Board.club
← Вернуться в раздел «Программы»

» Infty Editor + Infty Reader

Автор: dmitin
Дата сообщения: 12.04.2005 17:12
Появились новые версии:
Infty Editor 2.04a (11 апреля 2005) 3.1 MB (японское издание - 2.9 MB)
Infty Reader 2.4.3a (11 апреля 2005) 5.6 MB

Всех с Днём космонавтики!
Автор: Nep
Дата сообщения: 12.04.2005 17:46
шапку включил
Автор: bdfy
Дата сообщения: 14.04.2005 16:39
dmitin
ну и как каков же changelist ? мне кроме демки ихней ни одного листа формул распознать так и не удалось ( разрешение ему подавай от 600дпи ) - нет подвижек в этом направлении ?
Автор: dmitin
Дата сообщения: 15.04.2005 04:24
bdfy

Цитата:
разрешение ему подавай от 600дпи

Это, наверно, чтобы он мог распознавать индесы индексов.


Цитата:
мне кроме демки ихней ни одного листа формул распознать так и не удалось

А мне удалось. Вот пример:

Ваш файл test_tiff.rar (размер 281 кбайт)
доступен по адресу: webfile.ru/259724 в течение 21 дня до 04:34 06.05.2005.
Ваш файл test_iml.rar (размер 87 кбайт)
доступен по адресу: webfile.ru/259727 в течение 21 дня до 04:40 06.05.2005.

Мои выводы:
С тех пор, как Ридер стал запускаться из командной строки, стал работать корректнее:
вылетает не так часто, правда не некоторых сканах в 600 dpi всё равно вылетает без объяснения причин - то ли не нравятся ему неидеальные буквы, то ли пугается каких-то математических символов. Так что для перевода электронных документов в редактируемый формат еще может сойти, но не советую пробовать распознавать реально отсканированные в 600 dpi книги.
Хронически путает в формулах латинское "а" и греческое альфа.
Хронически распознаёт запятую как закрывающую скобку.
Вы только посмотрите, что он делает с английским предлогом "on" - буква "о" и большой символ дизъюнктного объединения!
Естественно, путает курсивный текст с математикой.
На последней странице $D_x^{\epsilon_1}\subset D_x^{epsilon_2}$ распознал как $D_{x^1}^{\epsilon}\subset D_{x^2}^{\epsilon}$, т.е. распознал нижние индексы у верхних индексов как верхние у нижних - вот вам и нейронные сети.
Вообще иногда путает символы, а также текст и математику.
Я распознавал за один раз сразу несколько тиффов - так он зачем-то каждый распознал дважды.
Несмотря на мои баг-репорты доктору Сузуке, символы суммы, пересечения, тензорного произведения, пустого множества, многие готические буквы так и не отображаются. С символом бесконечности есть прогресс - в текстовом режиме он отображается, в математическом нет.
В своем родном формате iml сохраняет. (Не хватало, чтобы еще и в нем не сохранял! Хотя когда-то и такое было.) В html сохраняет (с формулами в png) - суммы не отображаются тоже. Даже в xml (mathml) сохраняет, но он ИнтернетЭксплорером не читается, зато Мазиллой читается - причем тут суммы уже отображаются. Но ни в tex, ни в human readable tex не сохраняется! Это при том что и его родной latex стоит, и нормальный miktex и еще куча всего. Не знаю, может, кроме того, что прописать переменные среды, надо было еще вокруг него потанцевать с бубном?
На самом деле распознаёт лучше, чем можно было ожидать. Кроме шуток! Хотя, конечно, далеко не так идеально, как родные демки - естественно.
Хорошо бы пообкатывать на большем числе разных файлов.
Автор: dmitin
Дата сообщения: 18.04.2005 00:33
Обновился Infty Reader 2.4.3a (14 апреля 2005) 5.6 MB

На сайте висит объявление, что разработчики OCR-систем могут у них обзавестись их Ground-Truthed Mathematical Character and Symbol Image Database. Подробности в PDF-файле. Для этого надо заполнить регистрационную форму и подписанную отослать им обычной почтой (там надо клятвенно пообещать не распространять и не продавать базу ). Тогда они обещают бесплатно прислать компакт-диск со своей базой данных.
Автор: bdfy
Дата сообщения: 18.04.2005 14:55
dmitin
примеры с вебфайла мне утянуть явно не светит, ну да ладно верю на слово..
Вот бы придумать что нибудь чтобы разделять русский текст и формулы для раздельного рраспознавания...
ЗЫ апдейты что-то пошли чаще чем я могу на форум попасть
Автор: dmitin
Дата сообщения: 18.04.2005 15:53
bdfy

Цитата:
примеры с вебфайла мне утянуть явно не светит

_http://dmitin1.pochta.ru/test_iml.bmp
_http://dmitin1.pochta.ru/test_tiff.bmp
После скачивания расширение поменять на .rar .


Цитата:
апдейты что-то пошли чаще чем я могу на форум попасть

Всё правильно. У японцев то месяцами ничего не меняется, то чуть ли не через день обновленеия начинают выходить. Достаточно понятно: то пишут новую версию, то как напишут - найдут очередные баги, пофиксят и тут же выложат и т.д.


Цитата:
Вот бы придумать что нибудь чтобы разделять русский текст и формулы для раздельного рраспознавания...

Потом еще собирать надо...
Автор: xalex
Дата сообщения: 18.04.2005 16:37
bdfy

Цитата:
Вот бы придумать что нибудь чтобы разделять русский текст и формулы для раздельного рраспознавания...

Это можно сделать относительно легко с помощью утилиты gencho FRFgrab 1.09 ,
поскольку FineReader записывает в FRF-файл тип символов в каждом подблоке текста.
Те известно где русские, где английские буквы и где нетекстовые символы.
Автор: bdfy
Дата сообщения: 18.04.2005 23:05
xalex
почему я этой софтинки не вижу в варезнике\программах ?
хотя dmitin дело говорит - потом же фиг соберешь..

dmitin
ссылки работают, сейчас заценю.
Автор: dmitin
Дата сообщения: 19.04.2005 01:27
bdfy

Цитата:
почему я этой софтинки не вижу в варезнике\программах ?

Потому что на нее нет отдельного топика. Обсуждение идет в http://forum.ru-board.com/topic.cgi?forum=35&topic=1478 (см. в частности тамошнюю шапку).
Раньше лежала на бывшем сервере Колхоза и на scientific-library.
Сейчас должна быть здесь:
http://lib.homelinux.org/_djvu_index.html#29
(Требуется авторизация. Индекс загружается достаточно долго.)
Автор: dmitin
Дата сообщения: 28.04.2005 17:40
Обновились:
Infty Editor 2.04a (27 апреля 2005) 3.1 MB (японское издание - 2.9 MB)
Infty Reader 2.4.3a (28 апреля 2005) 5.6 MB
Автор: dmitin
Дата сообщения: 29.05.2005 22:34
Обновились:
Infty Editor 2.04a (22 мая 2005) 3.1 MB (японское издание - 2.9 MB)
Infty Reader 2.4.3b (18 мая 2005) 5.6 MB
Автор: dmitin
Дата сообщения: 30.06.2005 00:52
Текущие версии:
InftyEditor 2.04c (29 июня 2005) 3.1 MB
InftyReader 2.4.3b (24 мая 2005) 5.6 MB
LaTeX Install Kit 2.1 (16 июня 2005) 49 MB
Автор: quaxter
Дата сообщения: 04.08.2005 11:56
xalex

Цитата:
Есть ли где-нибудь описание iml-формата ?

Ну хотя бы на японском, что ли...
nadgol

Цитата:
впечатления о Тошиба оср -
качество ОСР очень плохое: английский ни в какое сравнения с другими, да и родной японский плохо тянет.

У меня есть статья о методике борьбы с японским текстом при OCR (дву- и многопроходное распознавание) с учетом предварительной сегментации сплошного иероглифического текста и с учетом использования базы данных сочетаний иероглифов (дуплеты, триплеты и т.д.) + разделение на иероглифы/кану.
Полный вариант статьи (инструмент заточен как раз под тосибовскую OCR) на японском и резюме в объеме 1/6 на английском храню в архиве публикаций.
Авторы клянутся, что довели точность распознавания до 95% именно на иероглифическом (точнее - кандзи-канамадзи-римбун) тексте.
Жаль, что подобных разработок нет для китайского
Автор: xalex
Дата сообщения: 04.08.2005 22:01
quaxter

Цитата:
Цитата:
Есть ли где-нибудь описание iml-формата ?

Ну хотя бы на японском, что ли...

Да это просто текстовый файл с очевидным синтаксисом.
Автор: 4get
Дата сообщения: 26.09.2005 15:44
Обновления:

InftyEditor Ver.2.04e (15 сентября 2005)
InftyReader Ver.2.4.3f (13 сентября 2005)
Автор: ACiDru
Дата сообщения: 12.01.2006 15:29
InftyReader у меня все время пишет "failed to open the log file.". версия вроде последняя
Автор: Fr1end
Дата сообщения: 23.01.2006 09:49
Есть ли у кого-нибудь InftyReader Ver.2.4.3z, выпущенная до обновления 16.01.2006? Выложите пожалуйста куда-нибудь. Или хотя бы файл InftyOcr.dll (можно и более ранней версии 2.4.3_).
Автор: dalx
Дата сообщения: 14.02.2006 13:28
народ. кто нить победил редактор/распозновалку на предмет руского языка?. или может кто имеет инфу - ожидается ли это в новых версиях?
Автор: quaxter
Дата сообщения: 14.02.2006 18:50
Кстати, написал я им письмишко - выслали мне сидюк InftyCDB-1.
Пимерно 256 МБ, с символьной базой данных и т.п.
Автор: Jurganov
Дата сообщения: 14.04.2006 08:29
Скачал InftyReader E244c.
Установил под XP/SP1

Не могу запустить. Говорит - не могу найти IeditCtrl.dll.

Чё за фигота?
Мож кто знает, в чем дело с установкой. Может, сначала что-то ещё надо было ставить?

И ещё... кто-то писал ,что создал плагин для разделения текста и формул. Его можно получить?
Автор: slonpts
Дата сообщения: 01.09.2006 02:38
Сабж обновился, причем давно, а этого никто не заметил.

Возможно, это никому не надо, но тем не менее, новые версии на http://www.inftyproject.org/en/download.html :

InftyReader Ver.2.4.4c (12/04/2006), --- Free Version
InftyReaderPlus Ver.2.5.1 beta (12/04/2006), --- Product version
InftyEditor Ver.2.04x (12/04/2006)
Автор: Alf007
Дата сообщения: 13.10.2006 16:59
Последние версии subj
InftyEditor Ver.2.5.0.2 (21/09/2006)
InftyEditorE2502.zip (English Edition, about 3.2MB, Free Software)
на http://www.sciaccess.net/download/InftyEditorE2502.zip

и InftyReader Ver.2.4.4e, revised (20/09/2006), --- Free Version
InftyReaderE244e.zip (English Edition, about 5.3MB, Free version)
http://www.inftyproject.org/download/InftyReaderE244e.zip

и комерческая InftyReader Ver.2.5.0 beta(5) (20/09/2006)
InftyReaderE250beta(5).zip, (English Edition, about 26MB)
на http://www.sciaccess.net/download/InftyReaderE250beta(5).zip
пока бета -бесплатно на месяц до появления нового релиза.
последняя поддерживает распознавание из pdf и умеет использовать
информацию из текстового слоя pdf.

Можно вместо предлагаемого LaTeX Install Kit Ver.2.1 (16/6/2005)
texinst.exe (about 49MB, Free software)
http://www.inftyproject.org/testfiles/dl.php?dl=LatexInstallKit

использовать MikTex2.5, если последний установить в
диск:\usr\local\share\texmf и в путях использовать
диск:\usr\local\share\texmf\miktex\bin вместо
диск:\usr\local\bin для предлагаемого LaTeX Install Kit.
Рекомендую полную установку MikTex2.5.

Автор: MagicWolf
Дата сообщения: 18.07.2007 08:47
Народ, поделитесь плиз последними free версиями Infty, а то их не где взять.
Автор: quaxter
Дата сообщения: 18.07.2007 09:41
ну, не знаю, мне в ответ на мэйл из японии дисочек прислали InftyCDB-1... и просили, чтобы я сам и коллеги отзывы слали. абсолютно рабочий диск. правда, было это в далеком 2005 году.
Попробуй написать письмишко на мэйл с офсайта.
Автор: MagicWolf
Дата сообщения: 19.07.2007 08:51
Спасибо! Попробую, но счас у них только коммерческая версия на сайте, нет бесплатной.

Вот нашел - InftyEditorE262.zip. Может кто подкинет InftyReaderE244e.zip?
Автор: Vskazka
Дата сообщения: 19.07.2007 14:03
MagicWolf
Могу выложить InftyReaderE243z.zip - последнее, что у меня есть из свободного
Автор: MagicWolf
Дата сообщения: 20.07.2007 15:42
Буду очень благодарен! Выложи пожалуйста, куда-нибудь на share! Например, rapidshare.
Автор: Vskazka
Дата сообщения: 20.07.2007 15:51
MagicWolf
_http://rapidshare.com/files/43991852/InftyReaderE243z.zip
Автор: MagicWolf
Дата сообщения: 23.07.2007 14:42
Огромное спасибо! Все взял - все ok!

Страницы: 12345

Предыдущая тема: Управление компутером с помощью email


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.