» ScanKromsator СканКромсатор (Часть 2)
Smokeer
Этот вопрос обсуждался на 47 странице
Этот вопрос обсуждался на 47 странице
shch_vg
Процитируйте пожалуйста? ибо не вижу вупор.
PS: хотя вообще раза 2 уже об этом сам писал... где-то начиная с версии 5.6
Процитируйте пожалуйста? ибо не вижу вупор.
PS: хотя вообще раза 2 уже об этом сам писал... где-то начиная с версии 5.6
BooBoo
Ага... ясно. Спасибо... читать розучился.
Ага... ясно. Спасибо... читать розучился.
bolega
Привет! У меня в DjvuOCR 2.3 уже работает режим, сохраняющий координаты картинок. Информация сохраняется в файл, формат следующий, вот пример:
Picture Frame v.15: items = 1, file = "G:\jram13\0001.frf"
898 1945 1097 2208
Picture Frame v.15: items = 1, file = "G:\jram13\0030.frf"
241 1326 1847 2331
Picture Frame v.15: items = 3, file = "G:\jram13\0129.frf"
144 1264 1072 1412
144 1412 974 1502
144 1502 1072 1554
v.15 указывает версия FineReadera (10 - FR7, 15 - FR8)
items - количество строк с координат прямоугольников
file - Path к FRF файл в проект FineReader
Зона у FineReader может не быть прямоугольник, а состоятся из пересечение несколько прямоугольников, поетому появляется например items = 3 - имеются три прямоугольника формирующие зону. Координаты прямоугольников: top, left, bottom, right.
Если в файле появится строка не начинающая с "Picture Frame", ее надо пропускать - она сообщает о картинки в табличних клетках, которые пока пропускаю: они обычно получаются при плохой скан, часть текста маркируется как картинка.
Вообще, иногда FineReader не маркирует картинки как надо - или маркирует часть, или больше. Хорошая стратегия: получить тот файл с координаты, пройтись по тексте и исправить маркировка картинок, и потом снова получить файл с координаты.
Привет! У меня в DjvuOCR 2.3 уже работает режим, сохраняющий координаты картинок. Информация сохраняется в файл, формат следующий, вот пример:
Picture Frame v.15: items = 1, file = "G:\jram13\0001.frf"
898 1945 1097 2208
Picture Frame v.15: items = 1, file = "G:\jram13\0030.frf"
241 1326 1847 2331
Picture Frame v.15: items = 3, file = "G:\jram13\0129.frf"
144 1264 1072 1412
144 1412 974 1502
144 1502 1072 1554
v.15 указывает версия FineReadera (10 - FR7, 15 - FR8)
items - количество строк с координат прямоугольников
file - Path к FRF файл в проект FineReader
Зона у FineReader может не быть прямоугольник, а состоятся из пересечение несколько прямоугольников, поетому появляется например items = 3 - имеются три прямоугольника формирующие зону. Координаты прямоугольников: top, left, bottom, right.
Если в файле появится строка не начинающая с "Picture Frame", ее надо пропускать - она сообщает о картинки в табличних клетках, которые пока пропускаю: они обычно получаются при плохой скан, часть текста маркируется как картинка.
Вообще, иногда FineReader не маркирует картинки как надо - или маркирует часть, или больше. Хорошая стратегия: получить тот файл с координаты, пройтись по тексте и исправить маркировка картинок, и потом снова получить файл с координаты.
gencho
Замечательно! Спасибо!
А нет ли там еще подозрительного флага, который бы определял тип картинки (растр или векторная). Наверняка, при layout-анализе FR это определяет, может, он этот тип и в frf-файл пишет.
Цитата:
Понятно. Так же windows хранит внутри себя произвольные зоны.
Замечательно! Спасибо!
А нет ли там еще подозрительного флага, который бы определял тип картинки (растр или векторная). Наверняка, при layout-анализе FR это определяет, может, он этот тип и в frf-файл пишет.
Цитата:
Зона у FineReader может не быть прямоугольник, а состоятся из пересечение несколько прямоугольников
Понятно. Так же windows хранит внутри себя произвольные зоны.
Не думаю что там есть векторные картинки, ведь изображения которыми работает FR это BMP, TIFF... Сама картинка в FRF файла нет.
bolega
Нельзя ли это (координаты картинок) как-то использовать для автоматического выделения шахматных диаграмм?
Ошибка в SK 5.91:
В Result view в режиме Zones лупа с + действует только на левую часть окна, независимо от того, в какой находится курсор, т.е. зону можно только уменьшать с помощью лупы-, а увеличить нельзя.
Хорошо бы еще здесь сделать, чтобы выборка нового размера из списка лупы+ распространялась только на ту сторону, на которой находится курсор.
Нельзя ли это (координаты картинок) как-то использовать для автоматического выделения шахматных диаграмм?
Ошибка в SK 5.91:
В Result view в режиме Zones лупа с + действует только на левую часть окна, независимо от того, в какой находится курсор, т.е. зону можно только уменьшать с помощью лупы-, а увеличить нельзя.
Хорошо бы еще здесь сделать, чтобы выборка нового размера из списка лупы+ распространялась только на ту сторону, на которой находится курсор.
bolega
А что значит "Not enough storage to process this command" во время обработки?
Опять-таки и оперативки достаточно, и места на дисках. При попытке продолжить пишет "Out of memory". Помогло опять-таки только закрытие СК с повторным запуском.
Можно ли сделать хотя бы автосохранение обработки при возникновении ошибки?
А что значит "Not enough storage to process this command" во время обработки?
Опять-таки и оперативки достаточно, и места на дисках. При попытке продолжить пишет "Out of memory". Помогло опять-таки только закрытие СК с повторным запуском.
Можно ли сделать хотя бы автосохранение обработки при возникновении ошибки?
Да, похоже, неправильная работа с памятью - переполнение и фрагментация? - происходит именно при работе с зонами. Нужно было повторно обработать около 50 полутоновых изображений, отфильтровал только файлы с зонами, поставил на обработку. Через полчаса получил ту же ошибку. И опять непонятно теперь, где именно обработка была прервана
to ghosty - определи методом золотого сечения или хотя бы делением пополам
bolega
а можно ли резаками управлять с клавиатуры??
а можно ли резаками управлять с клавиатуры??
bolega
Введите, пожалуйста, в фильтры для обработки picture-зон банальный box (по-моему, он ещё median называется). На моих картинках (600dpi) он полностью чистит растр как ничто другое при размере 7х7. Ни гаусс, ни (извините) inverse dithering не спасают. А то приходится гонять сторонние программы перед раздельным кодированием.
Введите, пожалуйста, в фильтры для обработки picture-зон банальный box (по-моему, он ещё median называется). На моих картинках (600dpi) он полностью чистит растр как ничто другое при размере 7х7. Ни гаусс, ни (извините) inverse dithering не спасают. А то приходится гонять сторонние программы перед раздельным кодированием.
Мож я что-то не понимаю, но вопрос сразу хочется задать...
1)Почему нет русского языка (мне все-равно, но некоторые слова впервые увидел и пришлось воспользоваться Лингво)
2)Очень странно отсутствие кнопок сохранить, Так и хочется сохранить в djvu, ан-нет Приходится делать извращения FR-SK-ВоМг Editor.
3)Очень странная технология работы, еле-еле сам разобрался. Хотя я все ответы (почти) нашел в мануале, но это не добавляет оптимизма. Может я уже стар в свои-то 20 и не могу разобратся с прогой за пару щелчков...?
4)Технология выделения мне не нравится, но это твердое ИМХО
5)А вот выставлять настройки для каждой страницы хотелось бы иметь.
Хотелось бы услышать критику и помощь. Спасибо!
1)Почему нет русского языка (мне все-равно, но некоторые слова впервые увидел и пришлось воспользоваться Лингво)
2)Очень странно отсутствие кнопок сохранить, Так и хочется сохранить в djvu, ан-нет Приходится делать извращения FR-SK-ВоМг Editor.
3)Очень странная технология работы, еле-еле сам разобрался. Хотя я все ответы (почти) нашел в мануале, но это не добавляет оптимизма. Может я уже стар в свои-то 20 и не могу разобратся с прогой за пару щелчков...?
4)Технология выделения мне не нравится, но это твердое ИМХО
5)А вот выставлять настройки для каждой страницы хотелось бы иметь.
Хотелось бы услышать критику и помощь. Спасибо!
Ну что тут можно сказать - отсканируешь и приведешь в нормальный вид скажем 2-3 десятка книг, тогда и поймешь все тонкости, жаль я только после 50 книг примерно узнал про 300 grey - 600 b/w, так было обидно, что исходников не сохранил . Сейчас на моем счету не так уж и много - около 120 книг, со временем ты начнешь чувствовать что и где поставить и не будешь даже задумываться, так что не переживай, что за 5 минкт не разобрался.
Помогите решить проблему!
При перегоне книги из формата *.pdf (Color 24bit, 600dpi) в картинки *.tif (b/w, 600dpi)
Вот что получается:
[img=http://img110.imageshack.us/img110/9743/015gz6.th.png]
Подскажите пожалуйста какие настройки выставить в SK для получения нормальных (читабельных) картинок *.tif
При перегоне книги из формата *.pdf (Color 24bit, 600dpi) в картинки *.tif (b/w, 600dpi)
Вот что получается:
[img=http://img110.imageshack.us/img110/9743/015gz6.th.png]
Подскажите пожалуйста какие настройки выставить в SK для получения нормальных (читабельных) картинок *.tif
bruteALEX
Цитата:
Выставляя какие либо настройки Вы и так выставляете их для одной страницы
Только используя Ctrl Вы выставляете подобные настройки для всех страниц
Цитата:
5)А вот выставлять настройки для каждой страницы хотелось бы иметь.
Выставляя какие либо настройки Вы и так выставляете их для одной страницы
Только используя Ctrl Вы выставляете подобные настройки для всех страниц
Мне кто нибудь поможет!
Еще один ламерский вопрос, какой программой можно собрать много *.tif картинок в одну книгу *.djvu?
Еще один ламерский вопрос, какой программой можно собрать много *.tif картинок в одну книгу *.djvu?
DEE 5.1
BooBoo
Загляни в личку.
Загляни в личку.
shch_vg
Цитата:
Исправил
Добавлено:
ghosty
Цитата:
Ошибку я все-таки нашел. Проявляется только в режиме auto-depseckle-mouse-up (при обработке все нормально) и только тогда, выделение на 1 пиксел больше, чем заданный рзамер спекла. Исправил
Добавлено:
vitaly1
Цитата:
С трудом удалось все-таки выложить
Добавлено:
darkseed
Цитата:
Исправил. Очень мудрено страницы были описаны внутри того pdf
Цитата:
Ошибка в SK 5.91:
В Result view в режиме Zones лупа с + действует только на левую часть окна, независимо от того, в какой находится курсор, т.е. зону можно только уменьшать с помощью лупы-, а увеличить нельзя.
Хорошо бы еще здесь сделать, чтобы выборка нового размера из списка лупы+ распространялась только на ту сторону, на которой находится курсор.
Исправил
Добавлено:
ghosty
Цитата:
Вот, попробуйте, пожалуйста, воспроизвести (условия я уже описывал выше): если в верхней строке попытаться выделить область над словом "теорию", захватив при этом и само слово - до перекладины буквы "е" (т.е. линия выделения остается над перекладиной), верхней части "е" как не бывало
Ошибку я все-таки нашел. Проявляется только в режиме auto-depseckle-mouse-up (при обработке все нормально) и только тогда, выделение на 1 пиксел больше, чем заданный рзамер спекла. Исправил
Добавлено:
vitaly1
Цитата:
А почему на офсайте нет ехе-шника последней версии - 5.91?
С трудом удалось все-таки выложить
Добавлено:
darkseed
Цитата:
izvlekaytsa libo tolko chotniye (2,4,6,...), libo tolko nechotniye (1,3,5,...) stranitsi! V chom delo? V pop-up window nichego ne menayu!
Исправил. Очень мудрено страницы были описаны внутри того pdf
Помогите пожалуйста с настройками в Кромсаторе 5.91. Надо почистить сканы и перевести в нормальный ч/б вид. Вот образец скана вытащенного из книги в Djvu
http://up.spbland.ru/files/08030725/
http://up.spbland.ru/files/08030725/
bolega
Цитата:
А что толку, если на Ваш сайт сейчас не попасть?
Цитата:
С трудом удалось все-таки выложить
А что толку, если на Ваш сайт сейчас не попасть?
shch_vg
Накрылся сайт медным тазом. Я теперь и сам на него не могу попасть. Что они с ним сделали, не знаю
Накрылся сайт медным тазом. Я теперь и сам на него не могу попасть. Что они с ним сделали, не знаю
bolega
а здесь в шапке ссылку на файлообменнике на новую версию выложить?
а здесь в шапке ссылку на файлообменнике на новую версию выложить?
Осталась все-таки проблема с неверным определением края блока текста при наличии ряда цифр сбоку:
http://rapidshare.com/files/98447793/MAIN_B.rar.html
Можно ли для DK ввести наряду с Text Vert. Sensibility также и Text Horiz. Sensibility?
http://rapidshare.com/files/98447793/MAIN_B.rar.html
Можно ли для DK ввести наряду с Text Vert. Sensibility также и Text Horiz. Sensibility?
Честно говоря, в этом году времени на sk совсем нет. Исправил только несколько багов, скоро выложу исправленную версию. Больше никаких новшеств нет. До осени-зимы работать над ним скорее всего не буду. А там посмотрим.
Добавлено:
Aleks196
Цитата:
В действительности там 150dpi (хоть и закодированы в djvu с профилем 300dpi). Из таких сканов, да еще после djvu, ничего нормального уже не получить в принципе
Добавлено:
Aleks196
Цитата:
Надо почистить сканы и перевести в нормальный ч/б вид
В действительности там 150dpi (хоть и закодированы в djvu с профилем 300dpi). Из таких сканов, да еще после djvu, ничего нормального уже не получить в принципе
bolega
Цитата:
Спасибо за консультацию, а то я с этой книгой и так и этак, а ничего не получается на выходе, думал может не знаю каких нибудь хитрых приемов.
Цитата:
В действительности там 150dpi (хоть и закодированы в djvu с профилем 300dpi). Из таких сканов, да еще после djvu, ничего нормального уже не получить в принципе
Спасибо за консультацию, а то я с этой книгой и так и этак, а ничего не получается на выходе, думал может не знаю каких нибудь хитрых приемов.
Доброго времени суток!
Прочитал последние 10 страничек (все 50 не осилил, сорри). Может кто подскажет в чем дело:
При кромсании в 5.91 если выделять картинки на страничке просто (Selection style -> Rectangle), то все работает, кромсает, картинки вытаскивает (потом делаем merge и все ок).
В вот если выделять каритнку полигонально (Polygon selection), то в процессе кромсания процесс доходит до этой странички и обрывается следующим сообщением:
"Access violation at adress 0085C51E in module `sk.5.91.exe`. Read address 00000038".
Причем в папке, куда складываются готовые странички, появляется сам рисунок (тот который был выделен), а вот странички, к которой он должен быть "приклеен" нет (сам процесс обрывается на этой страничке и файл не создается).
Может подскажете что делать. А то не всегда картинки ровные на страничке (чуть с наклоном) и приходится больший размер выбирать и соответственно появляется полосочка-рамочка вокруг рисунка.
Это как-то решаемо?
Прочитал последние 10 страничек (все 50 не осилил, сорри). Может кто подскажет в чем дело:
При кромсании в 5.91 если выделять картинки на страничке просто (Selection style -> Rectangle), то все работает, кромсает, картинки вытаскивает (потом делаем merge и все ок).
В вот если выделять каритнку полигонально (Polygon selection), то в процессе кромсания процесс доходит до этой странички и обрывается следующим сообщением:
"Access violation at adress 0085C51E in module `sk.5.91.exe`. Read address 00000038".
Причем в папке, куда складываются готовые странички, появляется сам рисунок (тот который был выделен), а вот странички, к которой он должен быть "приклеен" нет (сам процесс обрывается на этой страничке и файл не создается).
Может подскажете что делать. А то не всегда картинки ровные на страничке (чуть с наклоном) и приходится больший размер выбирать и соответственно появляется полосочка-рамочка вокруг рисунка.
Это как-то решаемо?
Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970
Предыдущая тема: MoleskinSoft Clone Remover
Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.