Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor: Часть 2

Автор: iit512
Дата сообщения: 14.09.2011 01:44
Один из моих знакомых натолкнуся вот на какую проблему в СТ:
===
[Отрывок из его письма:]
Если добавлять файлы в проект ("вставить после/перед"), не меняя имя исходного файла, то выходные файлы не "умеют" распознавать следование страниц.
Потому что вот ситуация, когда мне не нужно заменять файл полностью:

Имеем, допустим, в середине книги файл хх_200, и выходные файлы (папка out), допустим хх_200_1L и хх_200_2R (соответствующий страницам 399 и 400)
На развороте этого файла левая страница отсканировалась плохо, а правая -- хорошо.
Весь файл хх_200 мне заменять не надо, поэтому я сканирую (я ещё не закрывал IV) дальше только одну страницу — страницу 400. Поскольку, естественно, я обнаруживаю ляп после главного скана, новая страница нумеруется, допустим, хх_350.
Так вот.
Несмотря на то, что я "вставил после" правильной страницы, на выходе имеем файл хх_200_1L, представляющий страницу 399, и файл хх_350 со страницей 400.
Естественно, Вы понимаете, что произойдёт дальше....

Выхода два: либо пересканировать весь разворот, принудительно задав новому файлу такое же имя (удалив старый файл), либо потом иметь кучу геморроя, выявляя последовательность, и опять же переименовывать уже файлы в папке splitted. Что у меня и вышло, поскольку 6 страниц (правые части разворотов) отсканились плохо.
Я-то думал, что "вставляя после", прога как-то отметит вмешательство в последовательность, ан нет! В результате 20 минут мороки...

Резюме.
Смысл опции "вставить после", раз на выходе всё равно не запоминается что я вставил данную страницу именно после данной? Если всё равно приходится лезть в файлы, переименовывать с заменой?
А, с другой стороны, если я уже правильно назвал новый файл, то мне и совать его не надо в правильное место при помощи этой опции!! Можно в любое место пихнуть, а выйдет-то он всё равно как надо, там же только префикс добавляется...
Недосмотрели...
===
Я думаю, что это баг. Может быть, кто-нибудь донесет это до разработчиков?

Добавлено:
И, чтобы два раза не вставать:
Когда же наконец появится возможность отключать выравнивание освещения на смешанных страницах?
Автор: monday2000
Дата сообщения: 14.09.2011 08:33
По поводу разделения сканов: думаю, такую фичу всё равно придётся встраивать в СТ. Я надеюсь, в будущем перспективная схема создания DjVu-книги будет выглядеть так:

1. СТ + встроенный в него вывод разделённых сканов.

2. ABBYY FineReader 11 - создание чёрно-белой заготовки (из передних субсканов, выведенных из СТ). При этом полученная DjVu-заготовка, разумеется, уже будет иметь OCR-слой. Впрочем, для реализации этого пункта фирме ABBYY ещё нужно будет доработать FineReader - а пока FineReader довольно хреново в DjVu сохраняет.

3. DjVu Imager (или что-то ему на замену) - вставка картинок в DjVu-заготовку из п.2.

Конечно, вряд ли можно будет ожидать, что ABBYY встроит функционал DjVu Imager в FineReader. Но ещё менее вероятно, что Tulon встроит ABBYY SDK прямо в СТ.

Поэтому встраивание функции разделения сканов в СТ - неизбежная необходимость. Tulon-то (да и другие) хотели появления "1-кнопочного кодёра" - специально под неразделённый СТ-вывод. Теперь-то, думаю, всем станет ясно, насколько это нереально.

А даже, представим себе, что вдруг ABBYY всё же встроит функционал DjVu Imager в FineReader. Ну, допустим. Но этого всё равно будет мало - потому что сегодня мы сидим на технологии разделённых сканов - а завтра возьмём и перейдём на что-то более совершенное - скажем, на 3-х-слойные прототипы, да ещё и для текста над фотографиями. Мало ли что будет завтра? ABBYY за всем этим не угонится.
Автор: amaid
Дата сообщения: 14.09.2011 09:04

Цитата:
FineReader довольно хреново в DjVu сохраняет

а в чем конкретно хреновость? (не хотелось бы проглядеть дефект)
Автор: C0USIN
Дата сообщения: 14.09.2011 09:49
Drypchik1985
А чем фотошоп не угодил? Там автоматизировать можно многое.
Автор: Falbhanachaich
Дата сообщения: 14.09.2011 10:47
Astra55
Drypchik1985

Товарищи, небольшой оффтоп, но поскольку всё непосредственно связано со ScanTailor и постобработкой к ней:

В постоянной работе по "электрификации" книг я тоже давно и безысходно искал прогу по ПАКЕТНОЙ коррекции выходных цветных/серых сканов (до или после ST — неважно) такую, чтобы автоподстройка уровней (levels) и другие "авто" применялись к каждому файлу индивидуально, т.е., как метко выразился Drypchik1985, "интеллектуально".

Я так понимаю, что мы с ним имеем в виду одно и то же: во всех прогах т.н. автоподстройка, заданная пилотному файлу (образцу), применяется ко всем файлам в пакете без "индивидуального подхода" к гистограмме каждого файла, т.е. при нажатии "авто" (коррекции цвета, контрастности и т.п.) тупо запоминается цифровой эквивалент положений ползунков, кривых и пр. в пилотнике, и всё это переносится на все файлы пакета без учёта их индивидуальных особенностей...

Нам же надо, чтобы каждый файл обрабатывался "автоматически", но индивидуально, исходя из его цветового наполнения (гистограмм).
Ни AcdSee, ни Ирфан, ни ХnView, ни что либо иное нам этого не даёт.

Я так понял, что рекомендуемая прога (софт от SoftColor) позволяет делать именно это?!
Тогда щас прям бегу качать и ставить, но разъясните, пожалуйста, что именно использовать, там 3 разных проги: в чём различие, и точно ли там вожделенная "интеллектуальная" обработка?

пс. пишу в эту ветку, поскольку эта вся надобность идёт в связи с обработкой е-книг, и через СТ в частности; в варезной же ветке по софтколору активности практически никакой, а в программы, кажется, дублировать софтину не стали.

Так точно качать?! И чем именно пользоваться?
Спасибо!

ппс.
C0USIN
фотошоп и ему подобные программы (Гимп и пр. с оконным редактированием) не угодили тем, что там надо сразу кучу файлов наоткрывать, и каждый файл для отображения загружается в своё подокошко. АсеДесе же, напр., открывает файлы в папке по очереди, пролистыванием (это удобней, чем грузить массу файлов в рабочую фотошопскую область). И кроме того, см. выше )
Автор: Astra55
Дата сообщения: 14.09.2011 11:09
Falbhanachaich

Цитата:
в чём различие


Цитата:
чем именно пользоваться?

WYSIWIG - PhotoEQ, батч обработка есть
Не WYSIWYG - Automata, батч обработка есть
Думается. можно сначала выбрать профиль в PhotoEQ, а потом использовать его в Automata, пскольку установка параметров идентична. А можно выбрать методом научного тыка только в Automata. Сам такое не делал, нет должного количества файлов, а несколько сотен и PhotoEQ может, даже без Hot Folder.
Автор: U235
Дата сообщения: 14.09.2011 12:31
Falbhanachaich

Цитата:
Ни AcdSee, ни Ирфан, ни ХnView, ни что либо иное нам этого не даёт.

Почему? В XnView есть автоконтраст, автоуровни. Автоконтраст растягивает гистограмму "индивидуально".
Автор: Falbhanachaich
Дата сообщения: 14.09.2011 13:04
PhotoEQ - очень прикольная вещь, с предпросмотром и всё такое, но добавление префикса _sc в нашей работе совершенно не в тему (потому что в Имажер надо вставлять файлы с родными именами, без префиксов). Надо как-то от него избавляться (подозреваю, что это элементарно делается в постпроцессинге через батник с прописанными параметрами, но я такое писать не умею), поэтому пока попробуем Automate...
Автор: Drypchik1985
Дата сообщения: 14.09.2011 14:49

Цитата:
но добавление префикса _sc в нашей работе совершенно не в тему


переименовываем через тотал. времени занимает секунд 15 на каждое дело в режиме массового переименования


Цитата:
Я так понял, что рекомендуемая прога (софт от SoftColor) позволяет делать именно это?!


ну не совсем конечно, правда в конкретно моем случае результат PhotoEQ намного лучше чем в AcdSee, Ирфан, ХnView


Цитата:
Нам же надо, чтобы каждый файл обрабатывался "автоматически", но индивидуально, исходя из его цветового наполнения


сам мечтаю о такой программе.

а лучше о дополненном ScanTailor-е. Ведь когда отбеливаются сканы делается это по определенному автоматическому алгоритму? нельзя ли внести некоторые функции ручной корректировки данного процесса, реализованные в виде ползунка а-ля Жирнее\Светлее но только для режима "цветной серый+бел поля+выровнять освещение"? Чтобы если получается бледновато можно было подкрутить контраста и нажать "применить ко всем страницам". Не шибко может быть интеллектуально, зато вполне себе массово, а главное не надо лишний раз вылезать из программы-все вместе в одном месте З.Ы.не подумайте чего плохого )
Автор: ndch
Дата сообщения: 14.09.2011 15:51
iit512

Цитата:
Я думаю, что это баг. Может быть, кто-нибудь донесет это до разработчиков?

ну по-русски он читать умеет. шлите письма.
jartто-что-нужноusers.sf.net

Добавлено:
Drypchik1985
ThumbsPlus с его batchprocess и xe847 и прочими equalize не вариант ?
Автор: Drypchik1985
Дата сообщения: 14.09.2011 16:18
ThumbsPlus напоминает ACDSee. Много настроек и разных ненужных приблуд а толку мало. При поточной обработке лишние функции скорее мешают. А пакетные преобразования у подобных редакторов одной кнопкой не делаются и заставлять операторов из раза в раз шарить по настройкам неблагодарное занятие и трата времени. Начальству ведь не объяснишь что сначала надо приобрести (или написать под заказ) необходимый софт а потом начинать работать. В результате остаешься перед выбором: подстраивать вручную каждый скан и по пол дня сидеть с 1 делом или забить на это и регулярно получать по шее за качество.

зы А за помощь спасибо.
Автор: DikBSD
Дата сообщения: 14.09.2011 20:25
Drypchik1985
Попробуйте для пакетной обработки сканов ImsgeMagick. Правда он работает из консоли. Но зато работает прекрасно!
Скачать его можно тут для Windows: http://www.imagemagick.org/download/binaries/ImageMagick-6.7.2-Q16-windows.zip
Распакуйте этот архив. и в распакованную папку распакуйте мой архивчик со скриптами: http://www.onlinedisk.ru/file/733217/
Т.е. папка со скриптами ScriptsWork должна лежать в папке с ImageMagick.
В папке ScriptsWork есть ряд скриптов для пакетной обработки сканов разной цветности. Есть и AutoLevel.bat - автоуровни. Прекрасный результат - лучше чем у IrfanView (IMHO).
Все скрипты - это bat-файлы, которые используют файл пакетной обработки convert.vbs (в нем ничего менять не надо, если не хотите только его улучшить! ). По примеру скриптов можно самому написАть подобные - описание ключей и опций есть в файлах папки www ImageMagick.
Я понимаю - не совсем привычно работать с консолью. Но - запустив скрипт - можно быть свободным до завершения.
P.S. По умолчанию в скриптах прописаны 2 папки: D:\_In и D:\_Out - для папки исходников и папки результата соответственно. Папки можно изменить в скриптах .bat
Попробуйте...
Автор: Drypchik1985
Дата сообщения: 14.09.2011 21:40
спасибо интересная программка. вот только как назло из всего пакета скриптов именно автоуровни не дают почему-то вообще никакого результата . глюк что ли? или у меня руки не оттуда растут... попробовал весь наборчик - остальное вполне себе работает.

К слову ImageMagick использовалась как составная часть ПО, поставленного нам со сканерами. Программки называются ScanLab Cropping и ScanLab Post Proc. Из названий понятно, что первая обрезает лишнее на сканах (правда больше ручками чем автоматом), вторая обрабатывает: выполняет отбеливание, подстраивает яркость контрастность и сжимает. Именно PostProc использует IM как основу. Фирмачи прикрутили графический интерфейс для выбора и запуска скриптов 1 кликом, установили систему защиты от нелегального распространения по аппаратному идентификатору и ключу. Правда перемудрили немного: софтина частенько косячит и регулярно падает. Потому и не пользуем.

такая вот пичалька
Автор: DikBSD
Дата сообщения: 14.09.2011 22:11
Можно сделать и по другому - в скрипт автоуровней после -auto-level добавьте -normalize, т.е. вместо скрипт будет таким:

@ECHO OFF
ECHO To exit, press Ctrl+C.
ECHO.
rem если Prefix = "no", то перезаписываем картинку, иначе - обработанная картинка имеет в начале имени Prefix и лежит в той же папке, что и оригинал
rem если Ext = "no", то расширение файла - как у исходного
ECHO "== Auto Level Normalize=="
pause
cscript convert.vbs "..\convert.exe" "-auto-level -normalize" "D:\_In" "D:\_Out" "no" "no"
pause

Результат запуска приятно удивит
Надеюсь - у меня значительно улучшились фото и сканы. Только что пробовал
Автор: Drypchik1985
Дата сообщения: 14.09.2011 22:23
О! Заработало Спасибо вам. Будет время на выходных поковыряю сеть на предмет подробных мануалов по работе с программой. Полезная штуковина
Автор: DikBSD
Дата сообщения: 14.09.2011 22:34
Может это поможет:
1. Масса примеров от ImageMagick: http://www.imagemagick.org/Usage/
2. http://help.ubuntu.ru/wiki/imagemagick
3. http://surrender-zen-way.blogspot.com/2009/07/imagemagic.html

Если вспомню еще - напишу...

ДА - ОЧЕНЬ ВАЖНО - ImageMagick НЕ ПОНИМАЕТ РУССКИЕ буквы в названиях файлов!!!
Автор: monday2000
Дата сообщения: 16.09.2011 08:15
amaid

Цитата:
а в чем конкретно хреновость?

Размер DjVu большой получается. Это самое главное. И ещё пара мелких проблем, которые будут, по-видимому, устранены в ближайших релизах файнридера. На форуме abbyy всё расписано.
Автор: amaid
Дата сообщения: 17.09.2011 00:09
в настройках формата для каждого файла можно установить
оптимальное соотношение размера/качества ползунком внизу

[more=см. скриншот] [/more]
Автор: monday2000
Дата сообщения: 23.09.2011 09:03
Небольшой глюк в СТ:

Если проект присутствует в списке последних открывавшихся, но на жёстком диске его нет - то при открытии несуществующего проекта на жёстком диске создаётся пустая папка этого проекта.
Автор: tank0
Дата сообщения: 14.10.2011 19:02
As In this post, most of you are familiar with dewarping, so I ask my question here.
As we all know, Abbyy FineReader can do dewarping very well and very fast. So anyone knows how it does this? Is there any opensource dewarping libraries? What I need is good result and fast speed.

Thanks.

Ru(by google)

Как и в этой должности, большинство из вас уже знакомы с dewarping, поэтому я прошу на мой вопрос здесь.
Как мы все знаем, Abbyy FineReader может сделать dewarping очень хорошо и очень быстро. Так кто знает, как это происходит? Есть ли открытым исходным кодом библиотеки dewarping? Что мне нужно, это хороший результат и быстрой скоростью.

Спасибо.
Автор: unreal666
Дата сообщения: 14.10.2011 20:08

Цитата:
Is there any opensource dewarping libraries?

FineReader's dewarping - no.
Автор: tank0
Дата сообщения: 14.10.2011 20:14
unreal666
Not FineReader's dewarping, but dewarping libraries that has good performance and fast speed. I said FineReader is only for an example.

Ru:
Не FineReader в dewarping, но dewarping библиотеки, имеет хорошую производительность и быстрая скорость. Я сказал FineReader предназначен только для примера.
Автор: unreal666
Дата сообщения: 14.10.2011 21:33
tank0
There is "Leptonica" opensource library. How fast - not know.

site
documentation
Автор: tank0
Дата сообщения: 14.10.2011 21:56
unreal666
I've tried it before, does not work on some images.

Ru:
Я пробовал его раньше, не работает на некоторых изображениях.
Автор: unreal666
Дата сообщения: 14.10.2011 22:06
All dewarping programs do not work on some images.
It's opensource - use a debugger and analyze the code.
Автор: BD
Дата сообщения: 16.10.2011 19:47
Скачал я это недоразумение (0.9.10). Поставил. Создаю проект. Указываю каталог с кучей .jpg. Оно пробегает по списку, "тащит" файлы в проект. В результате справа чистые белые листы, в центре "Файл не загрузился:f:/xxx/xxx/0000000.JPG". Ни один файл "не загрузился". Из-за чего это может быть?
Автор: ycheff
Дата сообщения: 17.10.2011 17:17

Цитата:
Указываю каталог с кучей .jpg.

Преобразуйте jpg в tiff (напр., IrfanView) и попробуйте еще раз.
Автор: tank0
Дата сообщения: 17.10.2011 21:02
unreal666
Thanks. I'll try.

Автор: Dmb_2007
Дата сообщения: 20.10.2011 20:51
Объясните дураку, кто сможет

Есть файл http://brav-vmf.narod.ru/files/348-mzq4-chert.jpg

XnView о нём говорит следующее:

Цитата:
Размер 1.63 Мб (1712582 байт(ов))
Формат: JPEG TrueColor(v1.1)
Ширина 7633
Высота 2803
Размер при печати 25.44 х 9.34 дюймов
Пиксел на дюйм: 300x300
64.62 х 23.73 см
Бит на плоскость: 24
Кол-во плоскостей: 1
Цветовая модель: RGB


СТ кушать отказывается, хочет чтобы я изменил DPI.
Автор: unreal666
Дата сообщения: 20.10.2011 21:49
Скорее всего ST не нравится слишком большой размер ширины при печати. Он думает, что где-то ошибка в DPI. Судя по (7633px/388dpi)*2,54=50 см, у него ограничение на 50 см по ширине.
Просто выставь 600x600. После полной обработки уменьши DPI в XnView/IrfanView обратно в 2 раза.
А на выходе у тебя файл не того размер, потому что на входе DPI "прямоугольный" (388x300), а на выходе "квадратный" (300x300 или чего там у тебя).

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061

Предыдущая тема: CmCkA v4


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.