Frantishek Цитата: ... мои задачки можно будет разрешить при помощи лишь ABBYY Recognition Server 3.5
Как-то полистал немного его Help и вспомнилась фраза из русской классики "Чудовище обло, огромно, озорно и лаяй".
Других слов, чтобы описать это чудо программистики просто в голову не приходит.
Но до 10-й версии ничего другого для пакетизации заданий, увы, не водилось
Цитата: Остается лишь дилемма как срастить возможности FR11 и Hot Folder.. видимо зарезали функционал чтобы почетче позиционировать под сервер автоматизацию (сценарии и пр.)
Здесь такое впечатление, что сначала сделали толковый инструмент, а потом сами испугались сделанного. И начали его всеми силами до мизера доводить.
Что же до HotFolder в 11-версии, то мои знакомые нашли вполне работающий способ обходить процессорный ограничитель (с остальными в варезной ветке уже справились).
Берется какой-нибудь "антиквариат" времен Pentium 4, на него ставится Corporate-вариант 11-й версии и запускается в режиме 24*7. Техники этих времен по чуланам все еще немало валяется, а производительность получается примерно 1 к 5-6 (за один час работы сегодняшнего четырехпроцессорника надо отдать 5-6 часов работы на Р4). Если найдется несколько штук таких "старичков", то в сумме можно получить вполне приемлемые темпы.
VitRom Цитата: Хотя ЕМНИП в тех решениях, что видел я, юзались вообще какие-то "3-пати" тулзы, вроде даже что-то открытое.
Если это были времена прошлых версий, то примерно так и должно было быть. Собрали с бору по сосенке, где что нашлось и попытались соорудить из найденного нечто дееспособное.
Цитата: Тогда получается, что для 9/10 задач хватит "чистого" ФР-11...
У разработчиков сейчас надо думать период освоения нового инструментария, так что к результатам работы FineReader с DjVu некоторое время надо относиться по правилу "Доверяй, но присматривайся".
Наткнулся как-то на оф. форуме на интересное обсуждение. Оказывается где-то год назад тамошний народ еще и не подозревал, что деление на слои - это только для цветных сканов, а в ч/б оно изначально без надобности. В результате первый релиз генерил жутко перетяжеленные ч/б DjVu. К счастью эту ошибку уже давно убрали.
Цитата: Или в обрезке/кадрировании/чистке ФР-11 тоже переплюнул уже спецтулзы вроде БукРесторер-а или СканКромсатор-а?
В том, что касается разрезания разворотов на две страницы, IMHO очень и очень неплох. Я ему скармливал совершеннейшие безнадеги вроде хреново отсканированных газет довоенных времен, на которых не всегда сам мог понять - где одна страница, а где другая. Так он резал их с процентом выхода около 95.
Выравнивание делает плюс-минус прилично, но оставляет после себя клинья серого цвета. Если в конечном итоге требуется PDF, то приходится отключать.
Обрезкой IMHO не занимается вообще. Точнее может обрезать по фиксированному размеру (столько-то пикселей на столько-то пикселей), но так чтобы самому определить участок с фоном и отрезать только его - этого пока нет.
Так что на ближайшие годы BookRestorer скорее всего так и останется инструментом №1. ScanKromsator тоже хорош, спору нет, но отсутствие документации, но необходимость за ним постоянно присматривать и подкручивать...