Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 2)

Автор: Smokeer
Дата сообщения: 20.02.2008 23:10
В профилях этот пункт не работает
Автор: shch_vg
Дата сообщения: 21.02.2008 10:33
Smokeer
Этот вопрос обсуждался на 47 странице
Автор: Smokeer
Дата сообщения: 21.02.2008 16:57
shch_vg
Процитируйте пожалуйста? ибо не вижу вупор.
PS: хотя вообще раза 2 уже об этом сам писал... где-то начиная с версии 5.6
Автор: BooBoo
Дата сообщения: 21.02.2008 17:08
Smokeer
http://forum.ru-board.com/topic.cgi?forum=5&topic=24351&start=920#15
И далее 2 сообщения
Автор: Smokeer
Дата сообщения: 21.02.2008 17:40
BooBoo
Ага... ясно. Спасибо... читать розучился.
Автор: gencho
Дата сообщения: 22.02.2008 01:32
bolega
Привет! У меня в DjvuOCR 2.3 уже работает режим, сохраняющий координаты картинок. Информация сохраняется в файл, формат следующий, вот пример:

Picture Frame v.15: items = 1, file = "G:\jram13\0001.frf"
898 1945 1097 2208
Picture Frame v.15: items = 1, file = "G:\jram13\0030.frf"
241 1326 1847 2331
Picture Frame v.15: items = 3, file = "G:\jram13\0129.frf"
144 1264 1072 1412
144 1412 974 1502
144 1502 1072 1554

v.15 указывает версия FineReadera (10 - FR7, 15 - FR8)
items - количество строк с координат прямоугольников
file - Path к FRF файл в проект FineReader

Зона у FineReader может не быть прямоугольник, а состоятся из пересечение несколько прямоугольников, поетому появляется например items = 3 - имеются три прямоугольника формирующие зону. Координаты прямоугольников: top, left, bottom, right.

Если в файле появится строка не начинающая с "Picture Frame", ее надо пропускать - она сообщает о картинки в табличних клетках, которые пока пропускаю: они обычно получаются при плохой скан, часть текста маркируется как картинка.

Вообще, иногда FineReader не маркирует картинки как надо - или маркирует часть, или больше. Хорошая стратегия: получить тот файл с координаты, пройтись по тексте и исправить маркировка картинок, и потом снова получить файл с координаты.
Автор: bolega
Дата сообщения: 22.02.2008 08:36
gencho
Замечательно! Спасибо!
А нет ли там еще подозрительного флага, который бы определял тип картинки (растр или векторная). Наверняка, при layout-анализе FR это определяет, может, он этот тип и в frf-файл пишет.

Цитата:
Зона у FineReader может не быть прямоугольник, а состоятся из пересечение несколько прямоугольников

Понятно. Так же windows хранит внутри себя произвольные зоны.
Автор: gencho
Дата сообщения: 22.02.2008 10:04
Не думаю что там есть векторные картинки, ведь изображения которыми работает FR это BMP, TIFF... Сама картинка в FRF файла нет.
Автор: shch_vg
Дата сообщения: 22.02.2008 14:34
bolega
Нельзя ли это (координаты картинок) как-то использовать для автоматического выделения шахматных диаграмм?

Ошибка в SK 5.91:
В Result view в режиме Zones лупа с + действует только на левую часть окна, независимо от того, в какой находится курсор, т.е. зону можно только уменьшать с помощью лупы-, а увеличить нельзя.
Хорошо бы еще здесь сделать, чтобы выборка нового размера из списка лупы+ распространялась только на ту сторону, на которой находится курсор.
Автор: ghosty
Дата сообщения: 22.02.2008 21:18
bolega
А что значит "Not enough storage to process this command" во время обработки?
Опять-таки и оперативки достаточно, и места на дисках. При попытке продолжить пишет "Out of memory". Помогло опять-таки только закрытие СК с повторным запуском.
Можно ли сделать хотя бы автосохранение обработки при возникновении ошибки?
Автор: ghosty
Дата сообщения: 23.02.2008 13:18
Да, похоже, неправильная работа с памятью - переполнение и фрагментация? - происходит именно при работе с зонами. Нужно было повторно обработать около 50 полутоновых изображений, отфильтровал только файлы с зонами, поставил на обработку. Через полчаса получил ту же ошибку. И опять непонятно теперь, где именно обработка была прервана
Автор: Gazoved
Дата сообщения: 23.02.2008 14:13
to ghosty - определи методом золотого сечения или хотя бы делением пополам
Автор: skrt
Дата сообщения: 27.02.2008 12:20
bolega

а можно ли резаками управлять с клавиатуры??
Автор: Melirius
Дата сообщения: 27.02.2008 12:28
bolega

Введите, пожалуйста, в фильтры для обработки picture-зон банальный box (по-моему, он ещё median называется). На моих картинках (600dpi) он полностью чистит растр как ничто другое при размере 7х7. Ни гаусс, ни (извините) inverse dithering не спасают. А то приходится гонять сторонние программы перед раздельным кодированием.
Автор: bruteALEX
Дата сообщения: 29.02.2008 20:38
Мож я что-то не понимаю, но вопрос сразу хочется задать...
1)Почему нет русского языка (мне все-равно, но некоторые слова впервые увидел и пришлось воспользоваться Лингво)
2)Очень странно отсутствие кнопок сохранить, Так и хочется сохранить в djvu, ан-нет Приходится делать извращения FR-SK-ВоМг Editor.
3)Очень странная технология работы, еле-еле сам разобрался. Хотя я все ответы (почти) нашел в мануале, но это не добавляет оптимизма. Может я уже стар в свои-то 20 и не могу разобратся с прогой за пару щелчков...?
4)Технология выделения мне не нравится, но это твердое ИМХО
5)А вот выставлять настройки для каждой страницы хотелось бы иметь.
Хотелось бы услышать критику и помощь. Спасибо!
Автор: Gazoved
Дата сообщения: 29.02.2008 23:19
Ну что тут можно сказать - отсканируешь и приведешь в нормальный вид скажем 2-3 десятка книг, тогда и поймешь все тонкости, жаль я только после 50 книг примерно узнал про 300 grey - 600 b/w, так было обидно, что исходников не сохранил . Сейчас на моем счету не так уж и много - около 120 книг, со временем ты начнешь чувствовать что и где поставить и не будешь даже задумываться, так что не переживай, что за 5 минкт не разобрался.
Автор: FUTURiTY
Дата сообщения: 01.03.2008 00:08
Помогите решить проблему!
При перегоне книги из формата *.pdf (Color 24bit, 600dpi) в картинки *.tif (b/w, 600dpi)
Вот что получается:
[img=http://img110.imageshack.us/img110/9743/015gz6.th.png]

Подскажите пожалуйста какие настройки выставить в SK для получения нормальных (читабельных) картинок *.tif
Автор: BooBoo
Дата сообщения: 01.03.2008 07:58
bruteALEX

Цитата:
5)А вот выставлять настройки для каждой страницы хотелось бы иметь.

Выставляя какие либо настройки Вы и так выставляете их для одной страницы
Только используя Ctrl Вы выставляете подобные настройки для всех страниц
Автор: FUTURiTY
Дата сообщения: 01.03.2008 15:54
Мне кто нибудь поможет!

Еще один ламерский вопрос, какой программой можно собрать много *.tif картинок в одну книгу *.djvu?
Автор: BooBoo
Дата сообщения: 01.03.2008 17:34
DEE 5.1
Автор: FUTURiTY
Дата сообщения: 01.03.2008 18:01
BooBoo
Загляни в личку.
Автор: bolega
Дата сообщения: 06.03.2008 16:38
shch_vg

Цитата:
Ошибка в SK 5.91:
В Result view в режиме Zones лупа с + действует только на левую часть окна, независимо от того, в какой находится курсор, т.е. зону можно только уменьшать с помощью лупы-, а увеличить нельзя.
Хорошо бы еще здесь сделать, чтобы выборка нового размера из списка лупы+ распространялась только на ту сторону, на которой находится курсор.

Исправил


Добавлено:
ghosty

Цитата:
Вот, попробуйте, пожалуйста, воспроизвести (условия я уже описывал выше): если в верхней строке попытаться выделить область над словом "теорию", захватив при этом и само слово - до перекладины буквы "е" (т.е. линия выделения остается над перекладиной), верхней части "е" как не бывало

Ошибку я все-таки нашел. Проявляется только в режиме auto-depseckle-mouse-up (при обработке все нормально) и только тогда, выделение на 1 пиксел больше, чем заданный рзамер спекла. Исправил

Добавлено:
vitaly1

Цитата:
А почему на офсайте нет ехе-шника последней версии - 5.91?

С трудом удалось все-таки выложить

Добавлено:
darkseed

Цитата:
izvlekaytsa libo tolko chotniye (2,4,6,...), libo tolko nechotniye (1,3,5,...) stranitsi! V chom delo? V pop-up window nichego ne menayu!

Исправил. Очень мудрено страницы были описаны внутри того pdf
Автор: Aleks196
Дата сообщения: 07.03.2008 10:48
Помогите пожалуйста с настройками в Кромсаторе 5.91. Надо почистить сканы и перевести в нормальный ч/б вид. Вот образец скана вытащенного из книги в Djvu
http://up.spbland.ru/files/08030725/
Автор: shch_vg
Дата сообщения: 09.03.2008 20:27
bolega

Цитата:
С трудом удалось все-таки выложить

А что толку, если на Ваш сайт сейчас не попасть?
Автор: bolega
Дата сообщения: 10.03.2008 10:34
shch_vg
Накрылся сайт медным тазом. Я теперь и сам на него не могу попасть. Что они с ним сделали, не знаю
Автор: VadimirTT
Дата сообщения: 10.03.2008 10:39
bolega
а здесь в шапке ссылку на файлообменнике на новую версию выложить?
Автор: ghosty
Дата сообщения: 10.03.2008 17:31
Осталась все-таки проблема с неверным определением края блока текста при наличии ряда цифр сбоку:
http://rapidshare.com/files/98447793/MAIN_B.rar.html
Можно ли для DK ввести наряду с Text Vert. Sensibility также и Text Horiz. Sensibility?
Автор: bolega
Дата сообщения: 11.03.2008 00:00
Честно говоря, в этом году времени на sk совсем нет. Исправил только несколько багов, скоро выложу исправленную версию. Больше никаких новшеств нет. До осени-зимы работать над ним скорее всего не буду. А там посмотрим.

Добавлено:
Aleks196

Цитата:
Надо почистить сканы и перевести в нормальный ч/б вид

В действительности там 150dpi (хоть и закодированы в djvu с профилем 300dpi). Из таких сканов, да еще после djvu, ничего нормального уже не получить в принципе
Автор: Aleks196
Дата сообщения: 11.03.2008 06:36
bolega

Цитата:
В действительности там 150dpi (хоть и закодированы в djvu с профилем 300dpi). Из таких сканов, да еще после djvu, ничего нормального уже не получить в принципе

Спасибо за консультацию, а то я с этой книгой и так и этак, а ничего не получается на выходе, думал может не знаю каких нибудь хитрых приемов.
Автор: forestry
Дата сообщения: 11.03.2008 20:25
Доброго времени суток!
Прочитал последние 10 страничек (все 50 не осилил, сорри). Может кто подскажет в чем дело:

При кромсании в 5.91 если выделять картинки на страничке просто (Selection style -> Rectangle), то все работает, кромсает, картинки вытаскивает (потом делаем merge и все ок).
В вот если выделять каритнку полигонально (Polygon selection), то в процессе кромсания процесс доходит до этой странички и обрывается следующим сообщением:
"Access violation at adress 0085C51E in module `sk.5.91.exe`. Read address 00000038".
Причем в папке, куда складываются готовые странички, появляется сам рисунок (тот который был выделен), а вот странички, к которой он должен быть "приклеен" нет (сам процесс обрывается на этой страничке и файл не создается).
Может подскажете что делать. А то не всегда картинки ровные на страничке (чуть с наклоном) и приходится больший размер выбирать и соответственно появляется полосочка-рамочка вокруг рисунка.
Это как-то решаемо?

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970

Предыдущая тема: MoleskinSoft Clone Remover


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.