Ru-Board.club
← Вернуться в раздел «Программы»

» Программы для распознавания математических формул

Автор: dmitin
Дата сообщения: 03.09.2004 00:19
Кто-нибудь знает хорошие РАБОТАЮЩИЕ программы для распознавания математического текста с большим количеством формул?
ABBYY FineReader этого толком делать не умеет.

На выходе желательно получить формат, который возможно редактировать: Word/MathType или TeX/LaTeX.
В крайнем случае пусть программа сохраняет формулы как графический объект, но автоматически распознаёт в большинстве случаев, где формулы, а где текст. Хотя это, конечно, уже не совсем то.

Обсуждение подобных вопросов на форуме "Программы" в темах:
"GOCR - программа распознавания формул" (на самом деле оказалось, что программа этого не умеет)
http://forum.ru-board.com/topic.cgi?forum=5&topic=9159#1 ,
"Ищу программу: что-то вроде OCR (+)"
http://forum.ru-board.com/topic.cgi?forum=5&topic=10503#1 ,
"Помогите вытащить формулы из *.pdf файла!"
http://forum.ru-board.com/topic.cgi?forum=5&topic=3247#1 ,
"Infty Editor + Infty Reader" (насколько я знаю, единственная программа, которая умеет распознавать формулы, но в ней пока много недоработок)
http://forum.ru-board.com/topic.cgi?forum=5&bm=1&topic=12982#1 .
Автор: dmitin
Дата сообщения: 07.09.2004 11:22
Многообещающе выглядит следующая статья:

Searchable retrodigitised mathematical articles with linked references
http://www.exp-math.uni-essen.de/algebra/veranstaltungen/aa.html

с презентациями:

K. Yokota "ExpressReader Pro adapted to retrodigitization of mathematical documents" (625 KB)
http://www.exp-math.uni-essen.de/algebra/veranstaltungen/YokotaAnnArb.ppt

M. Okamoto "A mathematical formula recognition method and its performance evaluation" (660 KB)
http://www.exp-math.uni-essen.de/algebra/veranstaltungen/okamoto.ppt

M. Suzuki "Extraction of text data and hyperlink structure from scanned images of mathematical journals" (979 KB)
http://www.exp-math.uni-essen.de/algebra/veranstaltungen/suzuki.ppt

E.Ando "A recognition system of voluminous journals of mathematics" (968 KB)
http://www.exp-math.uni-essen.de/algebra/veranstaltungen/ando.ppt

Но меня интересуют реальные доступные программы.

Автор: dmitin
Дата сообщения: 13.09.2004 12:30
Еще здесь поднимался этот вопрос:

http://forum.all-win.ru/index.php?showtopic=2269&hl=
http://www.imho.ws/showthread.php?t=55305
http://www.scientific.ru/dforum/software/1094257141
http://forum.ixbt.com/0023/024417.html
http://forum.vingrad.ru/index.php?showtopic=28561&hl=
http://crimea-board.net/index.php?act=ST&f=13&t=1311&s=
http://www.exponenta.ru/forum/viewtopic.asp?t=1438
http://physics.nad.ru/matboard/messages/12467.html
http://www.aspirantura.spb.ru/cgi-bin/ib/topic.cgi?forum=7&topic=17
http://irodov.nm.ru/cgi-bin/ikonboard/topic.cgi?forum=3&topic=50
Автор: dmitin
Дата сообщения: 16.09.2004 14:09
Японцы, похоже продвинулись в своих разработках
http://forum.ru-board.com/topic.cgi?forum=5&bm=1&topic=12982#1

Но их программу мне тоже невсегда удается заставить работать, хотя здесь ситуация выглядит оптимистичнее, чем с гокром.
Автор: dmitin
Дата сообщения: 13.10.2004 16:11
Вот ответ Красноперова Дмитрия - проектировщика интерфейса FineReader -
относительно перспектив включения в 8-ую версию программы возможности распознавания математических формул
(взято с http://forum.ixbt.com/0023/024810.html ):


Цитата:
Честное решение проблемы распознавание формул очень трудоёмкое (обилие грамматик и различие между ними). Частичное решение - формулы в виде маленьких изображений многих не устроит.


Так что, по-видимому, нет (даже не обещается автоматическое сохранение формул как картинок).

Автор: albel
Дата сообщения: 14.10.2004 22:22
жаль
очень хотелось верить, что в виде картинок формулы начнут распознаваться в ближайших версиях FR
Автор: dmitin
Дата сообщения: 14.10.2004 23:21
albel
Я тоже надеялся на это. Но судя по настроениям, царящим среди разработчиков Файнридера, раньше скорее японцы доисправляют баги в своей
программе. Но в ней, естественно, поддержки кириллицы не предвидется, и хотя формулы она более-менее и распознаёт в редактируемом формате, но сам текст она распознает несколько хуже, чем FR.
Автор: 10000000
Дата сообщения: 19.12.2004 03:26
Я всё внимательно прочитал и понял, что для распознания математических формул и сохранения их в любом текстовом редакторе еще нужно долго ждать. И мне еще долго прийдется их набирать вручную.
Я использую для этих целей MathType 5.2a. И работа с ним довольно кропотливая и по моему не достаточно быстрая (во всяком случае как хотелось бы мне).
Мне не с чем сравнивать, так как я с другими прогами не работал.
Подскажите какие еще существуют проги для набора математических формул, которые удобнее, а самое главное более производительнее, чем MathType 5.2a?
Автор: dmitin
Дата сообщения: 19.12.2004 05:10
10000000

Цитата:
для распознания математических формул и сохранения их в любом текстовом редакторе еще нужно долго ждать

Может, и не очень долго... По разным оценкам знакомых, которых я спрашивал, - от "где-то с полгода" до "пару лет минимум". Смотря, о чем говорить, - о том, когда японцы дофиксят первоочередные баги в своей Инфти, о том, когда прикрутят поддержку других языков, кроме английского и японского, о том, когда у этой проги появятся конкуренты, о том, когда будет улучшено качество распознавания, о том, когда распознавание формул появится в ФайнРидере...


Цитата:
Подскажите какие еще существуют проги для набора математических формул, которые удобнее, а самое главное более производительнее, чем MathType 5.2a?

Если Вы созрели для перехода с Word + MathType на что-то более подходящее для профессионального набора математики, то ответ очевиден - LaTeX.
Что касается конкретных программ, то ответ зависит от Вашей операционки. Под Windows для многих (в том числе и меня) нет ничего лучше MiKTeX + WinEdt. Правда, это не WYSIWYG-редактор, и по началу работа продвигается медленно, зато чем дальше, тем быстрее, причем появляются очень богатые возможности (для тех, кто любит, чтобы их формулы выглядели идеально - в точности так, как они хотят).
С другой стороны, многим нравится WYSIWYG-редактор под LaTeX - Scientific Word. Правда, мне казалось, что у него несколько меньше возможности. Но, возможно, истинные любители SciWord'а меня поправят.
Автор: YURGEN SPB
Дата сообщения: 27.09.2009 14:12
на днях озадачили вопросом по распознаванию формул, а сегодня увидел новость, что вышел ABBYY FineReader 10.

Подскажите, пожалуйста, есть какие нибудь подвижки в этом вопросе за прошедшие 5 лет?
Автор: NepADM
Дата сообщения: 22.06.2010 14:09
походу файн ридер никак не продвинулся
Автор: Serzhan76
Дата сообщения: 27.07.2010 13:24
значить Fine Reader 10 формулу не можеть распозновать да ?
Автор: zhe_zho
Дата сообщения: 27.07.2010 19:23

Цитата:
распозновать да ?

Не, ну почему, если а + б, то нормально. А вот если дроби, то легче набрать заново чем потом редактировать. Не умеет он распознавать и вставлять их как редактируемые объекты редактора формул.
Автор: nikonimag
Дата сообщения: 28.09.2010 09:57
А все таки кто нибудь может подсказать, как настроить FR 9 на распознавание сложных математических выражений в виде картинок?
Автор: violaxic
Дата сообщения: 13.02.2011 13:21
Не знаю как там дела с FR 9, но я нашел комплекс программ предназначенные для распознавания формул, туда и InftyReader входит. Если кому надо http://21-12-2012.at.ua/board/raspoznavanie_formul_teksta/raspoznanie_formul/raspoznanie_formul/3-1-0-1

Страницы: 1

Предыдущая тема: Помогите с Pinnacle Studio - тормоза


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.