Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор

Автор: ignatav
Дата сообщения: 10.05.2007 16:23
bolega

Цитата:
С одной стороны, это не всегда удобно (напр., как в случае, который Вы описали), с другой стороны - предохраняет от ошибок.


Согласен, всего не предусмотриш...

Но вы согласны, что

Цитата:
Поидее выбор Нет должен либо Переименовать файл или Сохранить как.
(так можно сохранять несколько вариантов одного скана обработаного с разными настройками для сравнения)


Иначе Нет дублирует Отмену?
Автор: bolega
Дата сообщения: 10.05.2007 16:54
ignatav

Цитата:
Но вы согласны, что

В ск не предусмотрено иметь на выходе по несколько вариантов одного и того же файла (но если очень хочется, можно просто добавить в список один и тот же файл несколько раз, я так иногда делаю, а на заключительном этапе снимаю галки с ненужных дублей, при этом кромсатор сам переименовывает вых. файлы). Переименовать то можно, но вот смотреть кромсатором все эти варианты не получится. Это я точно делать не буду, т.к. для этого придется очень много переделывать в коде, включая сильное изменение структуры spt-файла. Информацию о зонах на выходе тоже придется дублировать, как и сами зоны. А смотреть в других программах - не знаю, удобно ли.

Добавлено:
Joker_XN_Team

Цитата:
при предпросмотре тем не менее все они обрабатываются

При полном preview, если задано изменение цветности файла, т.е. напр., gray->b/w, то зоны тоже перводятся в b/w (в отличие от обработки). По другому невозможно. При обработке зоны помещаются в свои собственные отдельные файлы, сделать это непосредственно в preview в главном окне невозможно, иначе получится жуткая каша из исходных зон, выходных файлов зон и прочего.
Автор: Joker_XN_Team
Дата сообщения: 10.05.2007 17:45
Ага, сеньк, я уже опытным путем до этого тоже дошел Программа мощная, но требует к себе внимания и понимания вкупе с опытами
Автор: 12341234
Дата сообщения: 11.05.2007 05:03
Подскажите, а нигде нет максимально подробной инструкции по сканированию и обработке сканов цветных журналов? Там ведь есть своя специфика, и не хочется делать абы как, хочется хорошо, но знаний не хватает .
Автор: ghosty
Дата сообщения: 11.05.2007 13:27
12341234
http://www.upload2.net/page/download/JhC5AEhSL9w4qeN/Scan.RAR.html

bolega
А нет ли возможности в режиме AutoDespecle защитить запятые, точки и знаки переноса?
Автор: ignatav
Дата сообщения: 11.05.2007 16:02
ghosty

Цитата:
А нет ли возможности в режиме AutoDespecle защитить запятые, точки и знаки переноса?


заключить запятые, точки и знаки переноса в зоны-исключения
или поставить размер спеклов 2-3, использовать файн деспекл.

bolega
Кромсаю книгу на 1780 страниц, на каждой странице 2-3 серых рисунков, расставляю зоны.....ужос....никогда незакончу....Вам это знакомо?

Вы не думали реализовать распознавание картинок как зон автоматически (как в файнридере)?
Автор: ghosty
Дата сообщения: 11.05.2007 16:40
ignatav

Цитата:
или поставить размер спеклов 2-3, использовать файн деспекл.
Да нет, у меня как раз спеклы величиной с точки и запятые - 15-16 где-то. Вот вариант защиты - если спекл находится на baseline, не удалять...

Цитата:
Кромсаю книгу на 1780 страниц, на каждой странице 2-3 серых рисунков, расставляю зоны.....ужос....никогда незакончу....Вам это знакомо?
Да, у меня тоже такие есть книжки, но я в их сторону даже не смотрю. Если бы bolega мог сделать хотя бы возможность чтения координат рисунков из пакета FR, мы все были бы счастливы, наверно
Автор: Kiljes
Дата сообщения: 11.05.2007 16:40
ignatav

Цитата:
Вы не думали реализовать распознавание картинок как зон автоматически (как в файнридере)?
дельное предложение. Сам задалбываюсь выставлять.
Автор: terminat0r
Дата сообщения: 11.05.2007 21:36
ghosty

Цитата:
Да, у меня тоже такие есть книжки, но я в их сторону даже не смотрю. Если бы bolega мог сделать хотя бы возможность чтения координат рисунков из пакета FR, мы все были бы счастливы, наверно

может стоить об этом поговорить с gencho?
он ведь знает этот формат как свои пять пальцев.
Думаю это действительно была б красивая опция для кромсатора. Да и книжек с картинками было бы больше
Автор: bolega
Дата сообщения: 11.05.2007 23:35
ghosty

Цитата:
А нет ли возможности в режиме AutoDespecle защитить запятые, точки и знаки переноса?

Без OCR это практически невозможно.

ignatav

Цитата:
Вы не думали реализовать распознавание картинок как зон автоматически (как в файнридере)?

Думал, но ничего путного не надумал. Если у кого есть реальные алгоритмы - милости просим. Идеи разные я читал в статьях, но как и в любой статье, между идеей и ее реализацией - целая пропасть.

terminat0r

Цитата:
может стоить об этом поговорить с gencho?
он ведь знает этот формат как свои пять пальцев.

Идея хорошая, если бы не одно но - FR поворачивает сканы. Сомневаюсь, что он где-то сохраняет угол поворота.
Автор: ghosty
Дата сообщения: 11.05.2007 23:58
bolega

Цитата:
Без OCR это практически невозможно.
Но ведь найти baseline строки не представляет труда? И, видимо, она определяется при deskew? Соответственно, можно и определять, находится ли объект на baseline или нет. Или я неправильно рассуждаю?

Цитата:

Цитата: может стоить об этом поговорить с gencho?
он ведь знает этот формат как свои пять пальцев.

Идея хорошая, если бы не одно но - FR поворачивает сканы. Сомневаюсь, что он где-то сохраняет угол поворота.
Автор: bolega
Дата сообщения: 12.05.2007 11:00
ghosty

Цитата:
Но ведь найти baseline строки не представляет труда?

Я бы не стал утверждать это так категорично.


Цитата:
И, видимо, она определяется при deskew?

Нет, baseline как таковая не нужна при deskew


Цитата:
По сути, нужна утилитка, которая бы прописывала координаты из пакета FR в указанный пользователем *.spt.

Да нет, все гораздо проще. Достаточно выписать их в обычный текстовый файл, а кромсатор прочел бы его и расставил зоны.


Цитата:
С другой стороны, можно попросить Кромсатор определять угол поворота, например, во время Draft Kromsate и прописывать его в *.spt.

А зачем он?
Говоря о повороте FR, я имел ввиду развороты. Одиночные страницы я думаю SK и FR развернет почти одинаковы и разница в координатах зон будет незначительна. Либо действительно сначала выровнять их в SK а потом уже скармливать их FR.
Насчет "двух зайцев", думаю, что ради зон можно будет потерпеть и двухразовое распознавание, не так уж это долго, выигрыш в расстановке зон перевесит это неудобство.
Автор: ghosty
Дата сообщения: 12.05.2007 21:00
Написал gencho на два известных мне адреса ( , ), но автоматические подтверждения доставки не приходят. Может быть, кто-нибудь знает другие адреса или ICQ - напишите в ПМ, пожалуйста.

VadimirTT (на след. сообщение):
Да, правильно, сейчас оставлю.
Автор: VadimirTT
Дата сообщения: 12.05.2007 21:08
ghosty
Может на его сайтике про DJVUOCR в гостевой оставить сообщение?
Автор: DFooz
Дата сообщения: 12.05.2007 22:50
http://rapidshare.com/files/26752751/LekarstvennRastenUSSR.rar

Как в Кромсаторе можно осуществить плавный переход от картинок, кот. в виде зоны к фону (как в ссылке)?
Автор: OlegDobrij
Дата сообщения: 13.05.2007 00:06
Подскажите, вылезает следующее:
режу разворот и одновременно на одной из страниц выделяю пикчер зону. После обработке pdf картинка же вставляется на 2 страницы разворота.
Надо сначала порезать, а потом вторым проходом выделять пикчер зоны, или эта накладка уже как-то исправлена?
Автор: gencho
Дата сообщения: 13.05.2007 02:43
Привет всем!

Странно что мне не приходят писма на djvuocr (at) mail2world .com...
Так, для связи можно оставлять ПМ здесь или писать на gencho (at) mail .bg или gencho (at) mail .ru (без пробелов).

Я не знаю формат блоков отвечающих за картинки в рабочих файлах Файнридера. Надо их "угадать" . В близкие дни попробую найти время для новый анализ формата.

По поводу угла поворота скана в FR, я пока не нашел его в рабочий файл. Но есть такая возможность: после поворота Файнридер записывает новое изображение в соответствующий TIFF. Может кто то сделает алгоритм, который будеть сравнивать новый и оригинальный TIFF и извлекать из етого параметры поворота? Я даю только идея, мне не ясни трудности практического решения.
Автор: VadimirTT
Дата сообщения: 13.05.2007 10:43
DFooz
Вроде бы это я делал этот скан, но мне непонятен Ваш вопрос.
Делал я его, нынче уже стандартным методом - через пикчерзоны. Вся технология описана в двух справках: сканандшаре и в примере к последней версии на сайте кромсатора. Причем, это был мой первый опыт с цветными картинками, поэтому, как мне кажется, можно сделать лучше, в частности требуется всеже подправить настройки кодера, чтобы повысить разрешение картинок.
Автор: ghosty
Дата сообщения: 13.05.2007 10:44
gencho
Спасибо, что откликнулись. С нетерпением ждем результатов Ваших поисков

Теперь о кодировании. Я до сих пор не задумывался об этом, фотографии в моих книжках встречаются редко, и я кодирую их отдельно.
Но если изображений много, то как вы кодируете? Нельзя ли как-нибудь автоматизировать процесс сортировки файлов - если BW, кодируем одним профилем, в другом случае - другим. Кто-то, я помню, делал энциклопедии с картинками, расскажите, пожалуйста, о своем опыте.
Почему пишу здесь - думаю, может быть, действительно на базе Кромсатора такую функцию можно реализовать, тем более если окажется, что можно кодеру передавать координаты рисунков?
Автор: bolega
Дата сообщения: 13.05.2007 12:23
gencho
Если Вам удастся найти информацию о картинках в файле FR, это будет замечательно!
Спасибо!

DFooz
А в чем Вы видите плавный переход? Что имеете ввиду? Минус обсуждаемого справочника в том, что в нем для зон было отключено применение correct illumination.

OlegDobrij
Не могли бы подробнее сказать о последовательности?
Я с таким не сталкивался, потому что делаю так: сначала обрабатываю сканы до полной готовности, получая на выходе тифы и зоны. Затем создаю новое задание (File->Create output task) для pdf. Вы сразу задаете для задания вых. формат - pdf? (т.е. без промежуточной обработки)?
Кроме того, зоны пока не поддерживаются для режима merge after split, т.е. когда на выходе задано объединять разрезанные развороты (т.е. зоны создаются, но после merge поведение кромсатора непредсказуемо, я об этом уже предупреждал).
Автор: OlegDobrij
Дата сообщения: 13.05.2007 12:49

Цитата:
Не могли бы подробнее сказать о последовательности?

bolega
Попался редкий каталог, который кто-то когда-то засунул в Word. Я вытянул оттуда сканы в формате png, часть (где были картинки) в цвете, часть черно/белые. Решил их порезать и заодно привести (как возможно) в божеский вид.
Особо не вдаваясь в подробности как кодировать djvu с пикчер-зонами, раньше я создавал за один проход pdf (вых формат), когда сканы были уже резанные, и все получалось.
Сейчас же попробовал совместить порезку на страницы и перевод с цвета в черно/белый с пикчер-зонами, и получил то что получил - пикчер-зоны наложились на две страницы, т.е. там где надо и там где нет.
Автор: DFooz
Дата сообщения: 13.05.2007 18:11

Цитата:
Вроде бы это я делал этот скан, но мне непонятен Ваш вопрос.


Цитата:
А в чем Вы видите плавный переход? Что имеете ввиду?

Там вроде картинка плавно переходит фон


Цитата:
Минус обсуждаемого справочника в том, что в нем для зон было отключено применение correct illumination.

Зачем он нужен?
ЗЫ: функцию поиска не нашел на этом форуме и Яндекс ничего не выдал
Автор: VadimirTT
Дата сообщения: 13.05.2007 20:18
DFooz
Жмите версию для печати этого топика, а там уж можно искать.
вот еще топик по сканированию
А вообще то, рассказали бы что и как делаете, а то непонятно о чем говорить, смотреть надо.
Автор: ignatav
Дата сообщения: 14.05.2007 13:42
Есть 10 страниц с картинками разного размера, ножно добавить полей до стандартной станицы и всё.
Пробовал сбрасывать все резаки, ставить атополя, фикс размер страницы и поля по 10мм-обрезались куски рисунков но размер выравнялся.
Убрал автополя, раставил резаки- обрезалось по резакам, поля недобавились.
Какие будут предложения?
Автор: shch_vg
Дата сообщения: 14.05.2007 17:56
ignatav

Цитата:
Какие будут предложения?

Ставим резаки, ставим automargins, задаем нужные H и V Gap value, Page width и height ставим в Auto, запускаем и любуемся результатом
Если же сразу известен размер листа, то вместо Auto Fixed c нужными значениями по высоте и ширине.
Автор: ignatav
Дата сообщения: 14.05.2007 18:05
shch_vg

Цитата:
ставим automargins
- поставили

Цитата:
H и V Gap value
= 1см

Цитата:
Page width и height ставим в Auto,
- зачем мне авто? Есть готовая книга - нужно дополнить её иллюстрациями - ставим фиксированые под А4.

Цитата:
запускаем и любуемся результатом
- любуемся обгрызаными и порезаными полурисунками.


Автор: Alexx S
Дата сообщения: 14.05.2007 18:19
ignatav

Цитата:
- зачем мне авто? Есть готовая книга - нужно дополнить её иллюстрациями - ставим фиксированые под А4.

Цитата:
запускаем и любуемся результатом     
- любуемся обгрызаными и порезаными полурисунками.

Зачем так агрессивно? Значит, размер, который Вы задаете меньше, нежели реальный размер области текста с заданными отступами... Попробуйте уменьшить отступы до нулевой величины, а в ориентацию теста на странице (Page-Page h.align выставить на (C)entered). Т.е. я предполагаю, что текст+отступы больше, чем заданный размер страницы и при выравнивании страницы по умолчанию с одной стороны добавляется поле, а остальное обрезается в заданный размер.
Автор: bolega
Дата сообщения: 14.05.2007 19:12
ignatav
Я бы делал так (с нуля).
Загружаем сканы.
щелкаем по кнопке Clear all options and mark all files (под левой панелью).
Держа Ctrl, щелкаем последовательно на опциях (ctrl не отпускаем):
- Automargins
- Всех 4-х под-опциях automargins
В результате у всех файлов галка стоит только перед словом Automargins, для всех ее под-опциях галка снята.
На кнопке с mouse-up-режимами выбираем последний (set cutters).
Обводим мышкой на каждом скане картинку с небольшим отступом от нее.
В момент отпускания мышки резаки становятся по периметру картинки и имеют малиновый цвет.
Затем задаем page width/height=fixed и ставим нужные размеры. Поля gaps можно сбросить в 0 (или 1 мм), если выравнивание задать по центру (Page h.align=v.align=c)
Все.

Автор: ignatav
Дата сообщения: 14.05.2007 22:54
bolega
Я всё так и делал, кроме общего Automargins - я снимал и её, думал она просто отключает все под-Automargins. Видимо это нетак?
Теперь всё вышло, спасибо за помощь.
Автор: VadimirTT
Дата сообщения: 15.05.2007 08:38
Может кто поможет:
1 как оптимально обработать такую цветную страничку в кромсаторе
2 настройки кодирования DEE
скачать

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667

Предыдущая тема: MSN Search Toolbar with Windows Desktop Search


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.