rex Цитата: Нужно распознать около 50 страниц текста конца 19-го века на немецком языке, напечатанного готическим шрифтом.
Недавно была аналогичная ситуация - потребовалось распознать небольшую книгу на готике (на выходе просили PDF с текстовой подложкой) при том, что ничего, кроме обычного FineReader (12 версия) под рукой не было. Прикинул по хлопотности возможные варианты и решил для начала попробовать на обычном FR, в режиме обучения.
Результаты приятно удивили
. Обучение проходило:
а) достаточно просто - подгонять рамку под готическую литеру оказалось не так геморройно, как в прежних версиях;
б) достаточно быстро - в смысле FR быстро начинал сам определять соответствие "литера на скане - символ текста".
В общем после натаскивания программы на нескольких страницах готики качество распознавания получилось более или менее приемлемым, править при вычитке потребовалось примерно как в обычных сканах среднего качества.
Цитата: У меня есть подозрения, что АВВYY могло просто менять оболочку, оставляя сам достаточно сложный модуль
У них, сколько я знаю, вообще модульный подход. Модуль разметки, модуль сканирования, комбинируемый из отдельных блоков модуль распознавания. Собираем из стопки исходных кирпичиков то, что в данный момент требуется (Professional, Corporate, Recognition Server такого-то вида, Recognition Server сякого-то вида), "одеваем" в требуемый интерфейс - вуаля, любуйтесь на очередной готовый продукт ABBYY.