» Scan Tailor

Автор: monday2000
Дата сообщения: 20.01.2009 09:02

Цитата:

FSDv1.2 - это что за программа?

http://www.djvu-soft.narod.ru/fsd_manfred_v1_2.rar

Добавлено:
Tulon

Цитата:

А почему это "теми или иными" во множественном числе?
Ко мне это не относиться. Исходники открыты, я даже готов объяснить непонятные места, если кто попросит.

Ну тогда я Вас попрошу написать хелп к Вашей программе.

Автор: Arcand
Дата сообщения: 20.01.2009 11:25

denver 22
Цитата:

я сейчас как раз и использую те профили кодирования, которые ты мне дал для DEE.

Я пропустил важный момент - для получения приемлегого качества при кодировании на рисунках надо удалить растр, а то могут вылезать дефекты и искажения из-за растра. О смысле настроек профилей я говорил здесь
Если результат по качеству не устраивает поиграйтесь Quality и BackGround Subsample. Если не устраивает разделение рисунка на маску и фон соответственно поиграйтесь Threshold Level, Pixel-Filter Level и Shape-Filter Level. Но надо набить руку. Поначалу результат может показаться неожиданным. Например, начинаешь уменьшать Threshold Level (больше в маску) а в маску попадает тем не менее меньше (это потому, что большие обекты из маски перекидываются в фон).

monday2000
Цитата:

Если что не так - давайте конкретные примеры. А голословно обвинять - нехорошо.

Так мои слова "я не ручаюсь" не есть обвинение

- их надо понимать как не тестил. В свое время было много говорено, что и как делается в методе разделенных сканов и я совсем не уверен, что Вы поняли меня и сделали все оптимальным образом.
Для уточнения задам вопрос. Как кодируется в DjVu Sep книга состоящая из bw сканов (текст) и gray сканов (текст и с рисунки). Насколько я понял из Ваших слов bw кодируется в DEE (в documenttodjvu.exe), gray в msepdjvu.exe, потом дежавю склеиваются. Слишком хитромудро

.
В FSD все сканы кодируются в msepdjvu.exe, ничего не склеивается - словарь можно сделать один на книгу.

Автор: Tulon
Дата сообщения: 20.01.2009 13:17

monday2000

Цитата:

Цитата:
imageproc

Что это такое? Библиотека алгоритмов?

Алгоритмов и структур данных. Все что касается обработки изображений и не привязано к СТ.

Цитата:

Почему же в СканТейлоре нет скроллбаров? Они что, не поддерживаются этим QPainter? А экранное сглаживание в QPainter есть?

Скроллбаров нет потому, что мне больше нравиться драг чем скроллбары. Кстати учтите, что колесо мыши уже задействовано для зума, так что если бы скролбары и были, их пришлось бы скролить вручную. К тому же в последних бетах зуминг стал центрированным по курсору, а не по центру. То есть я могу навести курсор на ту зону, которую хочу увеличить, и при увеличении она не уедет за пределы экрана.
А что касается сглаживания в QPainter - оно есть, только походу использует билинейную фильтрацию (даже если бикубическую - это ничего не меняет), которая плохо подходит для уменьшающих преобразований, поскольку интерполирует только между четырьмя соседними пикселями. В общем пришлось мне городить свой механизм для высококачественного антиалиазинга. Но даже с учетом некоторых слабостей, QPainter все равно самый мощный движок 2D рисования из тех, что я видел.

Цитата:

Цитата:
А за остальные 34 с половиной вы никак на отчитались.

А что они делают? Может, и там можно что-то в модули упаковать?

Они много всего делают, и они специфичны для СТ. Например класс PageId привязан к СТ в том смысле, что предполагает раздельную обработку половинок двухстраничного скана. А уж к этому классу привазана добрая половина всех остальных.

Цитата:

Цитата:
В общем никакая модульность не понизит сложность разработки ниже нескольких десятков тысяч строк.

"Большой размер" это не всегда синоним понятия "сложность". Программа может быть большой - но состоять из относительно простых типовых элементов - и наоборот. Если эти "десятки тысяч строк" состоят из типовых конструкций Qt (или MFC) - то это относительно не так уж страшно. Страшно - это когда нужен, например, компонент-графический движок - а его нет. Даже если он и в пределах тысячи строк.

А что значит типовые конструкции Qt или MFC? Естественно активно используются Qt'шные классы, там где Qt предоставляет то, что надо.
Я просто хочу сказать, что других альтернатив ждать не стоит, потому что это огромный объем работы, даже если выдрать и использовать ту же imageproc из СТ. Вообще, если существует проект с открытыми исходниками для определенной задачи, то нужны очень веские причины, чтобы начинать делать альтернативу. Такой причиной например может быть "легче написать с нуля, чем довести это до ума", что к СТ явно не относиться. Так какая же по вашему может быть причина создавать еще одну альтернативу?

Автор: monday2000
Дата сообщения: 20.01.2009 13:24

Arcand

Цитата:

Как кодируется в DjVu Sep книга состоящая из bw сканов (текст) и gray сканов (текст и с рисунки).

Всё подробно расписано тут:

http://www.djvu-soft.narod.ru/scan/djvu_sep.htm

Обычные Сканы-текст ЧБ кодируются в documenttodjvu.exe. Сканы, имеющие картинку, разделяются в СК на пару субсканов - и эта пары кодируется через сsepdjvu.exe.
Затем то, что получилось из пар, автоматом вставляется в нужные места того, что вышло из-под documenttodjvu.exe.

Цитата:

и я совсем не уверен, что Вы поняли меня и сделали все оптимальным образом.

Всё я так понял и всё оптимально сделал. Народ на ершовском форуме уже потестил и благодаря им я нашёл все баги и устранил их.

Цитата:

В FSD все сканы кодируются в msepdjvu.exe, ничего не склеивается - словарь можно сделать один на книгу.

Это-то да. Но msepdjvu.exe - это варез. ИМХО нам ни к чему лишний раз использовать варез - если можно достаточно удовлетворительно обойтись легальным софтом. DjVu Sep - абсолютно легальная программа, а FSD - варез.
Вот когда Леон Боту подправит подклейку фонов - тогда можно будет сделать программу, работающую точно так же, как и msepdjvu.exe - т.е. с единым словарём.

Добавлено:
Tulon

Цитата:

Скроллбаров нет потому, что мне больше нравиться драг чем скроллбары. Кстати учтите, что колесо мыши уже задействовано для зума, так что если бы скролбары и были, их пришлось бы скролить вручную.

Да, вручную - ну и что? А таскать рисунок мышкой вручную - что, легче?

Цитата:

Например класс PageId привязан к СТ в том смысле, что предполагает раздельную обработку половинок двухстраничного скана.

ИМХО это нерационально. Проще изначально делить скан на 2 половинки - и потом работать с каждой отдельно. Тут Вы также повторяете такую же ошибку bolega.

Цитата:

А что значит типовые конструкции Qt или MFC?

Я имел в виду стандартные классы Qt или MFC.

Цитата:

Я просто хочу сказать, что других альтернатив ждать не стоит, потому что это огромный объем работы, даже если выдрать и использовать ту же imageproc из СТ.

Я не говорю, что все бросятся делать эти альтернативы.

Разумеется, всё это достаточно непросто. И потом - я не знаю, что там и как в Qt - не могу судить.
Я могу лишь с точки зрения MS Visual C++ и MFC объяснить:
MFC - это библиотека классов и функций. Написание MFC-программы, грубо говоря, сводится к использованию этих классов и функций. Конечно, это достаточно непростое занятие - писать MFC-программу.
Но если под какую-то задачу нет нужного класса или нужных функций - то тогда задача написания программы усложняется вообще неимоверно. Именно такая ситуация и наблюдается ИМХО - по крайней мере, с точки зрения MS Visual C++ и MFC. Qt я не знаю и пока не собираюсь изучать.
Логика в том, чтобы сделать эти самые недостающие MFC-классы и функции - и тогда задача создания альтернативы сильно упростится (перейдя из категории "невозможно" в категорию "трудно").

Добавлено:

Цитата:

Так какая же по вашему может быть причина создавать еще одну альтернативу?

Да причин немало. Я вообще вижу сканобработку концептуально немного не так, как Вы её делаете в СТ. В СТ можно насобирать много мелочей - которые в сумме слишком меня не устраивают. Вот список ещё раз:

1. Маленькое окошко на старте.
2. Нет хелпа.
3. Нет скроллбаров.
4. Сглаживание и TIF - если будет, то хорошо.
5. Вся функциональность лепится в одну программу.

Вы вообще так как-то говорите, словно не хотите появления ещё одной альтернативы. Да хотя бы то, что я, к примеру, не хочу лезть в Qt - а кто-то, может, признаёт только Delphi. По крайней мере, библиотека алгоритмов пригодится решительно всем, кто бы ни вознамерился делать ещё одну альтернативу - ибо её относительно нетрудно будет перебить и под Qt, и под Delphi (под Delphi сложнее, мне Delphi очень не нравится - по синтаксису языка). И графический движок - его архитектура будет одинаковой что под Visual C++, что под Делфи.

Кроме того - не только в альтернативе дело - есть потребность в целом спектре скан-программ.

Автор: Tulon
Дата сообщения: 20.01.2009 15:13

monday2000

Цитата:

Цитата:
Так какая же по вашему может быть причина создавать еще одну альтернативу?

Да причин немало. Я вообще вижу сканобработку концептуально немного не так, как Вы её делаете в СТ. В СТ можно насобирать много мелочей - которые в сумме слишком меня не устраивают. Вот список ещё раз:

1. Маленькое окошко на старте.
2. Нет хелпа.
3. Нет скроллбаров.
4. Сглаживание и TIF - если будет, то хорошо.
5. Вся функциональность лепится в одну программу.

То есть по вашему проще создать альтернативу СТ чем написать хэлп и добавить скроллбары? Даже если я не приму скроллбары в основную ветку (ну не нравится мне эта идея и все тут), можно в принципе выпускать свою модификацию со скроллбарами. Кстати программисты хэлпов обычно не читают, так что этот пункт можно смело исключить. А TIFF и высококачественный антиалиазинг есть в последних бетах.

Цитата:

Вы вообще так как-то говорите, словно не хотите появления ещё одной альтернативы.

Я бы предпочел чтобы народ работал над улучшением СТ, а не над альтернативами или бесполезными для СТ алгоритмами обработки изображений.

Автор: Arcand
Дата сообщения: 20.01.2009 15:21

monday2000
Цитата:

Обычные Сканы-текст ЧБ кодируются в documenttodjvu.exe. Сканы, имеющие картинку, разделяются в СК на пару субсканов - и эта пары кодируется через сsepdjvu.exe.

Цитата:

Но msepdjvu.exe - это варез. ИМХО нам ни к чему лишний раз использовать варез - если можно достаточно удовлетворительно обойтись легальным софтом.

Я балдею

- documenttodjvu.exe (чистейший варез) использовать можно, а msepdjvu.exe уже нельзя, видите ли варез. Ха-ха. Не надо вешать лапшу, сознайтесь лучше, что не разобрались в методе разделенных сканов.

Автор: monday2000
Дата сообщения: 20.01.2009 15:37

Tulon

Цитата:

То есть по вашему проще создать альтернативу СТ чем написать хэлп и добавить скроллбары?

Если СТ и дальше будет развиваться без родного хелпа - то ИМХО одно это достаточное основание для иной альтернативы. См. на СК как пример. Правда, здесь, в отличие от СК, можно залезть в исходники и посмотреть. Понимаете, у меня своё видение подобной программы - и если СТ ему не соответствует хоть в чём-то существенном (как хелп) - то по мне - он вообще неинтересен - кроме как копилка агоритмов и идей.
Мне хотелось бы увидеть успешную у юзеров программу - а это налагает достаточно жёсткие рамки - когда собственное "хочу-не хочу" уже не имеет никакого значения.
"Добавить скроллбары" - не знаю, насколько это сложно. Я в Qt не разбираюсь. Что если сложность добавления скроллбаров равна написанию новой программы - мне не известно.

Цитата:

А TIFF и высококачественный антиалиазинг есть в последних бетах.

Это очень хорошо.

Цитата:

Я бы предпочел чтобы народ работал над улучшением СТ, а не над альтернативами или бесполезными для СТ алгоритмами обработки изображений.

Одно другому не мешает.

Но, раз уж Вы не хотите убирать маленькое окошко, писать хелп - то я уже просто не могу себя заставить хотя бы просто ещё раз запустить Вашу программу и ещё раз посмотреть, что она такое есть. Т.е. я давно естественным образом утратил к СТ хоть какой-либо интерес - раз уж там нет того, что мне хотелось бы там обязательно увидеть. Я просто не представляю себе пока при всём желании - как такую программу можно применить для сканобработки... Это ИМХО всё что угодно - но пока уж никак не программа сканобработки.

Автор: Tulon
Дата сообщения: 20.01.2009 15:46

Цитата:

Мне хотелось бы увидеть успешную у юзеров программу - а это налагает достаточно жёсткие рамки - когда собственное "хочу-не хочу" уже не имеет никакого значения.

Но собственное-то ваше "хочу-не-хочу" похоже имеет для вас значение, иначе вы взялись бы, да написали этот самый хэлп для СТ. Тем более что я готов отвечать на вопросы / дополнять / исправлять.

Цитата:

Но, раз уж Вы не хотите убирать маленькое окошко, писать хелп - то я уже просто не могу себя заставить хотя бы просто ещё раз запустить Вашу программу и ещё раз посмотреть, что она такое есть.

Я так и понял

И когда же вы в последний раз его пробовали?

Автор: monday2000
Дата сообщения: 20.01.2009 15:51

Arcand

Цитата:

Я балдею - documenttodjvu.exe (чистейший варез) использовать можно, а msepdjvu.exe уже нельзя, видите ли варез.

И documenttodjvu.exe тоже нельзя - да вот деваться некуда - так что ПОКА вынуждены. А в случае msepdjvu.exe такой безнадёги нет - взамен msepdjvu.exe вполне можно применить не намного более худшую сsepdjvu.exe.
Надеюсь, придёт время - и от documenttodjvu.exe откажемся. Это просто случайность, что пока никому нет дела до широкого распространения documenttodjvu.exe и нас никто не взял за задницу. А Вы попробуйте кряк от ФайнРидера, Касперского или 1С свободно пораспространять.

Цитата:

сознайтесь лучше, что не разобрались в методе разделенных сканов.

Да в чём там разбираться-то? Там всё элементарно просто.

Я не исключаю, что 3-х ступенчатая схема, предложенная мною в http://www.djvu-soft.narod.ru/scan/djvu_sep.htm , ещё сложновата для восприятия. Хотя уже сейчас конечному пользователю не надо вникать в детали МРС. Достаточно разметить Picture-зоны в СК, обработать - и затем последовательно:

1. Бросить папку out в DjVu Small и нажать Пуск.
2. Бросить папку out в DjVu Sep и нажать Пуск.
3. Нажать Источн. в DjVu Sep и выбрать результат из п.1.
4. Нажать "Вставить в DjVu" в DjVu Sep.

Сложно? Да, что-то есть. Но это же молодая технология - она ещё может совершенствоваться. Всё новое сначала рождается как сложное - и только потом со временем упрощается.
Конечно, объединять DjVu Small и DjVu Sep в одну программу (как это сделал бы bolega на моём месте) глупо и неправильно.
Пусть сначала вся технология обкатается "как есть". А дальше время покажет, как её упростить/улучшить.

Добавлено:
Tulon

Цитата:

иначе вы взялись бы, да написали этот самый хэлп для СТ

Ну почему этот хелп должен писать кто-то, отличающийся от Вас? Только Вы один знаете свою программу до мозга костей - и можете дать наиболее полное её описание, весь её концептуальный замысел. Некоторые моменты там мне совершенно непонятны. К тому же - меня вот оскорбляет идея написания хелпа к чужой программе, когда доступен её автор.

Цитата:

И когда же вы в последний раз его пробовали?

Версию 0.9 запускал - и, ничего не поняв с налёту, "закрыл и забыл". Беты не смотрел. Я рассуждаю так: "раз нет хелпа - то не стоит и трудиться пытаться разобраться". Потому что именно так поступит львиная доля потенциальных юзеров - я стараюсь ставить себя на их место, чтобы представить себе их реакцию на программу. Только они-то Вам ничего не скажут - просто молча проигнорируют СТ - и по привычке откроют СК.

Я бы делал всё так:

1. Сначала - программа, разрезающая сдвоенные развороты (ошмётки) и делающая deskew. И всё, и больше ничего! Никаких "лишних" наворотов! Режим цветности не меняется - вошло серое - и вышло серое и т.д. Сложна ли такая программа? Нет, относительно проста. Только вот нет пока графического движка для неё (это там самое сложное). Смысл - отправить в топку все эти "левые-правые" страницы - как в СК. Все сканы должны изначально становиться и не левыми, и не правыми - а "одинаковыми".

2. Затем программа по Grey - Color Enhance + расстановка Picture-зон.

3. Наконец, программа по автообрезке (понимающая на входе Picture-зоны из п.2).

Вот так - минимум 3 независимые программы - и не меньше. Иначе - чудовищная перегрузка интерфейса и внутреннее неимоверное усложнение программы - вплоть до такой степени, когда она выходит из-под контроля самого автора.

Кроме того - наличие именно как минимум 3 раздельных программ позволяет проделывать отдельные этапы обработки в иных программах - кому как захочется.

Автор: Tulon
Дата сообщения: 20.01.2009 16:44

Цитата:

Ну почему этот хелп должен писать кто-то, отличающийся от Вас?

Кому больше всех надо, тот вполне мог бы и написать - дело это вполне посильное. А автор между прочим и так вложил много усилий в этот проект, и по моему вполне в праве надеятся на то, что хоть какие-то задачи кто-то сделает за него.

Цитата:

Версию 0.9 запускал - и, ничего не поняв с налёту, "закрыл и забыл".

Так вы вообще никаких усилий не хотите прилагать. С таким отношением я не уверен, что вы и хэлп прочитали бы. Или скажем начали бы читать, и на первом же непонятном месте забросили бы. Вполне можно было бы спросить здесь, что вам там не понятно было. Да, я понимаю: "есть кромсатор, им я пользоваться умею - зачем мне прикладывать усилия для изучения чего-то другого". Это в принципе нормальная реакция пользователя СК, которого он в общем и целом устраивает. Но вы то вроде не из тех, кого он устраивает

Автор: denver 22
Дата сообщения: 20.01.2009 20:38

Arcand

Цитата:

для получения приемлемого качества при кодировании на рисунках надо удалить растр, а то могут вылезать дефекты и искажения из-за растра.

Зашибись, а я уже несколько книг сделал. Но, считая себя среднестатистическим пользователем электронных книг, могу сказать, что результат в книге аналогичен скану. Так что Я как минимум доволен.

Цитата:

Если результат по качеству не устраивает поиграйтесь Quality и BackGround Subsample. Если не устраивает разделение рисунка на маску и фон соответственно поиграйтесь Threshold Level, Pixel-Filter Level и Shape-Filter Level. Но надо набить руку...

Откровенно говоря, вот этих самых "поиграйтесь" я делать не буду. Причина - "считаю себя среднестатистическим пользователем электронных книг".
А вот спорами о том, какой программой пользоваться для метода разделенных сканов окончательно меня запутали. Точнее, не нравится мне ситуация, когда двое разработчиков тянут одеяло на себя, критикуя второго. И что мне? опять сравнивать оба метода? Я, блин, уже не книгу буду делать, а лабораторную работу...
Но за ссылку о параметрах кодирования спасибо. Почитаю.
Tulon
Мда, из-за меня в этой ветке такие споры пошли, которые должны быть совсем в другой.
monday2000 и Arcand: в попытке исправить ситуацию с оффтопом в этой теме прошу вас продолжить обсуждение "метода разделенных сканов" в ветку "Электронные книги". И я её читаю, и другим её читателям это обсуждение будет полезно.

Добавлено:
Arcand
Раз ты разрабатывал одну из программ для кодирования методом разделенных сканов, то можно узнать твоё мнение-сравнение разделенных сканов и кодирования в DEE уже смешанных сканов? И Tulon заодно послушает.

Автор: are
Дата сообщения: 20.01.2009 21:44

чтобы без оффтопа: взял SCANTAYLOR-0.9.1 и запустил через wine под линуксом.
(компилировать QT4 ниасилил, у меня линукс намеренно староват, машина дохловатая тоже)

взял 3 скана в 300дпи сером, на пробу.

первое впечатление хорошее: и без хелпа можно понять, чего от меня хочет программа - пройти по шагам настройки и потом запустить Process.

настроил на выходное разрешение 600х600, ч-б, в общем всё выглядит нормально. Автоматическое разрезание разворотов пополам, автоматическое deskew.

запустил Process, жду результатов, вот уже 10 минут результатов нет, cpu загружен полностью.

[через 20минут получил первый png в директории out... а почему png? я заказывал ч-б, по старой привычке ожидаю TIFF/G4. Ну ладно. png на самом деле 1-битовый, так что наверно это фича такая, что png на выходе.]

вопросы:
1) что такое Otsu и другие методы бинаризации?
2) как настраивать порог чёрно-белого? я потыкал в кнопки с надписью "black" , "white", никакой реакции.
3) есть ли какой-либо progress indicator, или это глючит wine?
[вижу, что после окончания обработки 1-й страницы нечто появилось в главном окне. Но ждать пришлось 20 минут однако. Процессор 1.8Ггц centrino.]

4) на каждой странице был выбран прямоугольник, в котором якобы заключается текст. Что будет дальше сделано с этим прямоугольником? (он будет вырезан из страницы, к нему будут добавлены поля, какие именно, как будет выравнен прямоугольник...? Программа не говорит.

ну, через пару часов, когда всё закончится, увижу результаты...)

5) надо ли на самом деле проходить мышкой по всем страницам, чтобы отметить правильные рамки и т.д., или достаточно пробежаться по thumbnails взглядом?

в остальном всё выглядит замечательно. Скачиваю один exe файл и навсегда забываю о проблемах со сканированием.

чего бы ещё хотелось:
1) help tooltips, чтобы видно было, что означают кнопки - тогда и хелп особо не нужен

2) чтобы можно было стирать библиотечные печати на странице, какой-нибудь примитивный ластик.

большое спасибо за труды!

добавлено

появился второй файл png. Оба файла, к сожалению, содержат чисто белые страницы. Это, наверно, глюк от wine. Обработку не прерываю, но скорее всего ничего не выйдет.

добавлено 2

посмотрел вкладки, очевидно соответствующие стадиям обработки.
после "mask" получается чисто чёрное поле.
может надо было light/dark выставить правильно? Но эти кнопки ничего не давали, когда я их нажимал.

Автор: VidelSamogO
Дата сообщения: 20.01.2009 23:00

О-о-о-чень нестабильно работает! Постоянные runtime error'ы!

Автор: Tulon
Дата сообщения: 20.01.2009 23:21

Цитата:

запустил Process, жду результатов, вот уже 10 минут результатов нет, cpu загружен полностью.

Ну 10 минут это ни в какие ворота не лезет, даже не старой машине, даже из под Wine. Есть гипотеза, что сканы у вас более высокого разрешения, чем 300 DPI, хотя указано там именно 300. Тогда СТ сделает увеличение еще в два раза, а 1200 DPI - это будет очень и очень медленно (если вообще памяти хватит).
Проверить можно так: посмотрите пиксельные размеры своих исходных файлов. Для 300 DPI размеры ни по горизонтали ни по вертикали не должны превышать скажем 3300 пикселей.

Цитата:

[через 20минут получил первый png в директории out... а почему png? я заказывал ч-б, по старой привычке ожидаю TIFF/G4. Ну ладно. png на самом деле 1-битовый, так что наверно это фича такая, что png на выходе.]

В последних бетах вывод делается в TIFF. Для Ч/Б как раз TIFF/G4. Ссылки на беты публиковались в этой ветке.

Цитата:

1) что такое Otsu и другие методы бинаризации?

Вот, этот вопрос еще больше подвинул меня к тому, чтобы совсем убрать этот выбор. Это разные алгоритмы автоматического определения черно-белого порога. В условиях выровненного освещения (это реализовано в 0.9.1), Otsu похоже оптимальный вариант. По крайней мере я еще не видел случая, где какой-другой алгоритм дал бы лучший результат. Ручного выбора порога нет, поскольку мне еще никто не показал такого скана, где Otsu выдал бы непреемлемый результат. То, что было до 0.9.1 - не в счет. Тогда еще не было выравнивания освещения.

Цитата:

2) как настраивать порог чёрно-белого? я потыкал в кнопки с надписью "black" , "white", никакой реакции.

Они активны в режиме Bitonal. Пожалуй его я тоже уберу.

Цитата:

3) есть ли какой-либо progress indicator, или это глючит wine?

Страница обработана - справа в ленте миниатюр выбирается следующая. Это как бы и есть индикатор прогресса. Конечно никто не предполагал 10 минут обработки на страницу.

Цитата:

4) на каждой странице был выбран прямоугольник, в котором якобы заключается текст. Что будет дальше сделано с этим прямоугольником? (он будет вырезан из страницы, к нему будут добавлены поля, какие именно, как будет выравнен прямоугольник...? Программа не говорит.

Хороший вопрос. Этот тот редкий случай, когда пригодился бы мануал. Зона за пределами этого прямоугольника - поля. Размеры полей определяются на стадии Page Layout. В режимах Black and White и Mixed поля заливаются белым. В режиме Color / Grayscale остаются как есть (как на визуальзации Page Layout). Кстати, а почему сказано "якобы заключается текст"? Что, рамка определилась неправильно, или же самого текста не было видно?

Цитата:

5) надо ли на самом деле проходить мышкой по всем страницам, чтобы отметить правильные рамки и т.д., или достаточно пробежаться по thumbnails взглядом?

Там где на миниатюре все выглядит как надо - туда можно не заходить. Я сейчас кстати как раз работаю над улучшением автоопределения рамки, так что надеюсь скоро править вручную почти ничего не придется.

Цитата:

1) help tooltips, чтобы видно было, что означают кнопки - тогда и хелп особо не нужен

Какие именно кнопки вызывают вопросы?

Цитата:

2) чтобы можно было стирать библиотечные печати на странице, какой-нибудь примитивный ластик.

На сайте в разделе "Предложенные улучшения" есть такой пункт. Задача не слишком приоритетная, так что пока проще будет Gimp'ом вырезать на выводе.
Цитата:

после "mask" получается чисто чёрное поле.

Это нормально. Это означает что при расчете фоновой поверхности будет использоваться вся картинка. Что у вас на вкладках background и normalized_illumination? А вообще лучше выложите куда-нибудь пару файлов из проекта и ссылку сюда или мне в личку.

Добавлено:

Цитата:

О-о-о-чень нестабильно работает! Постоянные runtime error'ы!

У меня ни одного. Впрочем один товарищ сообщил о таком единичном случае, но воспроизвести до сих пор не может. Если у вас это воспроизводится - то есть вы знаете, как вызвать этот самый runtime error, то выкладывайте файлы и шаги для воспроизведения.

Автор: VidelSamogO
Дата сообщения: 20.01.2009 23:41

Tulon
Выкладываю пару картинок, на которых вылетает НА ЭТАПЕ ВЫВОД. Воспроизводится на другой винде XP32-SP3. Когда перезагрузился в неё.
http://ifolder.ru/10133505

Автор: are
Дата сообщения: 20.01.2009 23:42

всё зависло после 2х страниц - но это перегрелся компьютер, с ним такое бывает.

всё, что после mask, было чисто чёрным или чисто белым. Наверно, это (и медленная обработка) всё глюки от wine. Но я действительно не могу сейчас сам компилировать qt4 или инсталлировать его development version. Если можно было бы собрать статически с qt4, я бы попробовал нормальную версию. (libc6-2.3.6 у меня в системе стоит)

в моих сканах разрешение 300дпи, серое, это точно. Размеры изображения 3246 на 2358. http://rapidshare.com/files/186791958/p003.tif.html

такого рода сканы в принципе должны обрабатываться без проблем. Не думаю, что надо убирать другие алгоритмы бинаризации, - путь будет несколько, лишь бы работало.

что касается bitonal, то я просто не стал пробовать - может bitonal это значит два цвета (скажем белый и синий), но в любом случае было непонятно, чем отличается bitonal от black/white, и не было видно, что вне режима bitonal кнопки light/dark неактивны (они не серые). Вот для этого и пригодились бы tooltips. Ещё они пригодились бы для того, чтобы понимать, что означают mask, downward fill и прочее, что там ещё было на вкладках.

ещё: первая операция - adjust orientation. Но лишь позже я понял, что это не то же самое, что deskew. А deskew надо делать только после разрезания. Поэтому я какое-то время колебался, надо ли это orientation делать и что это значит. Я бы это назвал "page orientation" и опять-таки tooltip не помешал бы.

выше я написал, что в рамках "якобы" заключается текст - потому, что эти рамки можно двигать вручную, значит можно самому решать, где текст, а где не текст; остаётся понять, что с этой рамкой будет сделано дальше.

в моём тесте все рамки были автоматически определены совершенно верно (впрочем сканы очень простые). В одном случае надо было убрать библиотечную печать, хотелось просто чуть подвинуть для этого рамку, но тогда надо знать наверняка, что всё кроме содержимого рамки будет стёрто. Видимо, это так и предполагается, но юзеру (мне) было неочевидно.

ещё раз спасибо!
в принципе уже сделано почти всё, что нужно для счастья. Обычные сканы - развороты 2 страницы на лист, без цветных иллюстраций, без сносок или цифр на полях, без рисунков, вылезающих за края текста - скорее всего уже без какой-либо ручной работы будут сделаны на СТ без ошибок. Ценная вещь!

Автор: VidelSamogO
Дата сообщения: 20.01.2009 23:43

У меня двухъядерник интел. Может, поэтому...

Автор: denver 22
Дата сообщения: 21.01.2009 00:15

Цитата:

Ссылки на беты публиковались в этой ветке.

Tulon, ещё один повод все таки дублировать эти ссылки и в шапку (не на сайт же предлагаю). Видишь сколько людей пользуются 0.9.0/0.9.1 и критикуют то, что уже давно исправлено/реализовано.

Цитата:

Я сейчас кстати как раз работаю над улучшением автоопределения рамки, так что надеюсь скоро править вручную почти ничего не придется.

Серьезное заявление. Речь ведь идет о "Полезной области"? Желаю удачи!
А Gimp с tif LZW и G4Fax корректно работает? (спрашиваю на всякий случай)

Автор: Tulon
Дата сообщения: 21.01.2009 00:21

VidelSamogO

Цитата:

Выкладываю пару картинок, на которых вылетает НА ЭТАПЕ ВЫВОД

Не воспроизводится

Вы пробовали создавать проект только из этих двух файлов? Если даже так воспроизводится, то пришлите свой проектный файл и точные инструкции для воспроизведения, в частности DPI вывода и режим вывода.
Если так не воспроизводится, шлите проектный файл от полного проекта.

Цитата:

У меня двухъядерник интел. Может, поэтому...

Не должно такого быть. А если падения воспроизводятся, то точно не из-за этого.

Добавлено:
are
А вот на вашем примере падение воспроизвелось. Походу падает на страницах без контента в режиме вывода Смешанный. Это я исправлю, но остальным не расслабляться, поскольку это похоже не то падение, о котором сообщал мне другой товарищ.

Цитата:

такого рода сканы в принципе должны обрабатываться без проблем. Не думаю, что надо убирать другие алгоритмы бинаризации, - путь будет несколько, лишь бы работало.

А смысл, если один уделывает всех остальных?

Цитата:

что касается bitonal, то я просто не стал пробовать - может bitonal это значит два цвета (скажем белый и синий), но в любом случае было непонятно, чем отличается bitonal от black/white, и не было видно, что вне режима bitonal кнопки light/dark неактивны (они не серые). Вот для этого и пригодились бы tooltips. Ещё они пригодились бы для того, чтобы понимать, что означают mask, downward fill и прочее, что там ещё было на вкладках.

Вы правильно поняли что такое Bitonal - это фактически черно-белый с возможностью подменить эти два цвета на другие. Я его собираюсь убрать, потому что вряд-ли кто им будет пользоваться, а с толку сбить он может.
А по поводу всяких там mask, fill и прочих - это вы включили режим отладки - он для разработчиков, для отыскивания проблем под руководством разработчика, и может для тех, кому сильно интересно, как работает тот или иной алгоритм (кстати на разных стадиях набор вкладок разный). На этих вкладках отображаются промежуточные результаты работы алгоритмов. Даже если описать что есть что, это поймут только разработчики.

Цитата:

ещё: первая операция - adjust orientation. Но лишь позже я понял, что это не то же самое, что deskew. А deskew надо делать только после разрезания. Поэтому я какое-то время колебался, надо ли это orientation делать и что это значит. Я бы это назвал "page orientation" и опять-таки tooltip не помешал бы.

Согласен - тултип там нужен. Ну а Fix Orientation vs Page Orientation - по моему не принципиально. Кстати в последней бете есть русский перевод, и в русском варианте это "Исправление ориентации" - по моему достаточно понятно.

Цитата:

в моём тесте все рамки были автоматически определены совершенно верно (впрочем сканы очень простые). В одном случае надо было убрать библиотечную печать, хотелось просто чуть подвинуть для этого рамку, но тогда надо знать наверняка, что всё кроме содержимого рамки будет стёрто. Видимо, это так и предполагается, но юзеру (мне) было неочевидно.

Да, это неочевидно, да и в двух словах не объяснить - поведение зависит от режима вывода. Тут как раз пригодился бы хэлп, желательно встроенный в саму программу.

Цитата:

ещё раз спасибо!
в принципе уже сделано почти всё, что нужно для счастья. Обычные сканы - развороты 2 страницы на лист, без цветных иллюстраций, без сносок или цифр на полях, без рисунков, вылезающих за края текста - скорее всего уже без какой-либо ручной работы будут сделаны на СТ без ошибок. Ценная вещь!

Вы еще не пробовали режим вывода Mixed (Смешанный) - он автоматом выделяет картинки, нормализует в них освещение (борется с тенью от разворота) - а остальное преобразует в черно-белое. Такой фичи даже в СК нет. Алгоритм автовыделения картинок от U235 оказался весьма удачным.

Добавлено:

Цитата:

Tulon, ещё один повод все таки дублировать эти ссылки и в шапку (не на сайт же предлагаю). Видишь сколько людей пользуются 0.9.0/0.9.1 и критикуют то, что уже давно исправлено/реализовано.

Так, а у вас нет прав на редактирование шапки? Там видимо Silver Member нужен или типа того. Ладно - проставлю туда ссылку сам.

Добавлено:
Кстати, denver 22, мы с вами до сих пор не разобрались с белыми тифами на выводе (возможно та же проблема, что и у are, и с тифами, которых не переваривает FineReader. Я жду от вас дополнительный материал (писал в личку что именно нужно).

Добавлено:
Поправил падение на страницах без контента в режиме Mixed. Собирать или не собирать новую бету - на усмотрение denver 22. Я бы сначала с остальными двумя проблемами разобрался.

Автор: VidelSamogO
Дата сообщения: 21.01.2009 03:05

Tulon
Половина файлов из этой книги не выводятся, в конце, вызывая ошибку. эти я прислал для примера. Ошибка появляется вдля версии ИМЕННО на этой парочке эффект стойкий. Завтра попробую на работе.
Высылаю файлы и проект.
http://ifolder.ru/10135486

Автор: U235
Дата сообщения: 21.01.2009 05:37

VidelSamogO
Ошибка возникает из-за того, что на 3 странице (2 разворот) неправильно определилась полезная область. Если ее поправить вручную, то все работает. (см. 146 стр. проекта, отрицательное значение y="-3.552713678800501e-15" из-за этого видимо и возникает runtime error).
Tulon
При выводе в TIFF надо явно прописывать тег 262 - Photometric Interpretation (в данном случае надо в Photometric Interpretation записывать 0.0), иначе просмоторщик XnView показывает негатив. (Также разрешение в тегах желательно прописывать в привычных pixels/inch, а не в pixels/cm и расширение файлов привычнее .tif, а не .tiff).

Автор: Arcand
Дата сообщения: 21.01.2009 05:45

denver 22
Цитата:

Зашибись, а я уже несколько книг сделал.

Не огорчайтесь

. У меня больше книг, которые сейчас я бы намного лучше сделал.
Цитата:

Точнее, не нравится мне ситуация, когда двое разработчиков тянут одеяло на себя, критикуя второго. И что мне? опять сравнивать оба метода?

Вы не так поняли ситуацию. manfred подкинул идею с разделенными сканами, я разобрался с msepdjvu и сделал батники для кодирования книг. Потом manfred сделал GUI - FSD.
В пылу полемики я забыл сказать, что в FSD есть выбор кодировщика: msepdjvu или сsepdjvu. Так что слова monday2000
Цитата:

DjVu Sep - абсолютно легальная программа, а FSD - варез

смехотворны.
В FSD кодирование осуществляется за один проход - сразу создается одно дежавю. Я не против DjVu Sep, я против извращения метода разделенных сканов - спрашивается зачем лепить отдельные дежавю для текста и картинок и потом все это склеивать?

Цитата:

И что мне? опять сравнивать оба метода?

А так не понятно, что есть что? DjVu Sep возник благодаря своеобразному пониманию ее автором метода разделенных сканов.

Цитата:

monday2000 и Arcand: в попытке исправить ситуацию с оффтопом в этой теме прошу вас продолжить обсуждение "метода разделенных сканов" в ветку "Электронные книги"

Не получится - у monday2000 запрет на пост в том топике.

Цитата:

твоё мнение-сравнение разделенных сканов и кодирования в DEE уже смешанных сканов? И Tulon заодно послушает.

Как-то в топике по СК выкладывались сканы закодированные в одном случае в DEE, в другом в msepdjvu (методом разделенных сканов). Мнения, что лучше разделились. Так что это дело вкуса. О своем я уже говорил.

Добавлено:
U235
Раз Вы здесь посмотрите плагин http://abab.front.ru/BgClear.ZIP . Если по Вашему мнению все нормально, буду выкладывать.

Автор: denver 22
Дата сообщения: 21.01.2009 06:28

Цитата:

Кстати, denver 22, мы с вами до сих пор не разобрались с белыми тифами на выводе (возможно та же проблема, что и у are, и с тифами, которых не переваривает FineReader.

Я читал Личку. У меня были технические проблемы с флешкой и Инетом. Я обязательно сделаю тесты, описанные тобой и результаты вышлю.

Цитата:

Собирать или не собирать новую бету - на усмотрение denver 22. Я бы сначала с остальными двумя проблемами разобрался.

Раз проблемы решаются активно, собирать пока не буду. Да и запарка у меня малость. Но если тот, у кого ошибка была исправлена захочет побыстрее проверить исправление, завтра соберу.
Я шапки ещё даже не пытался править

. Ты же разработчик, тебе решать насколько серьезные новшества в бета-сборках. Я-то только собираю.

Добавлено:
Arcand, спасибо за разъяснения. Раз ST оптимален для работы с полутоновыми картинками, и DEE ты хвалишь для кодирования таких сканов, тогда пока не буду заморачиваться с другими методами. А то вчера посмотрел, оказывается мне ещё 81 книгу исправлять. На тестирование неочевидных технологий времени нет

Автор: U235
Дата сообщения: 21.01.2009 06:57

Arcand
Потестировал немного в фотошопе. Глюков в нем пока не заметил, работает весьма быстро!

Пожелания: Возможно имеет смысл разделить плагин на два плагина: с сохранением контента по краям и без. В фотошопе, при файл/автоматизация/пакет каждый раз всплывает окно плагина с галкой. (Возможно я не понял как сделать в фотошопе, чтобы оно не всплывало).
Потестировал в XnView - замечен баг, видимо связаный или с самим xnview(не последней версии), баг проявляется как черная косая однопиксельная линия, начинающаяся с нижнего 1024-го пикселя.

Автор: monday2000
Дата сообщения: 21.01.2009 09:57

Arcand

Цитата:

в FSD есть выбор кодировщика: msepdjvu или сsepdjvu

Да, есть. Но это не избавляет FSD от титула "варез". Вот если бы msepdjvu там вообще не было - то тогда FSD варезом не являлся бы.

Цитата:

я против извращения метода разделенных сканов - спрашивается зачем лепить отдельные дежавю для текста и картинок и потом все это склеивать?

Элементарно, Ватсон.

Чтобы на чисто текстовых сканах (коих, кстати, подавляющее большинство) создавался словарь разделённых символов.

Цитата:

В FSD кодирование осуществляется за один проход - сразу создается одно дежавю.

А что в этом хорошего? Я тоже мог бы сделать "за один проход" (с точки зрения юзера) - если объединить в один флакон DjVu Sep и DjVu Small. За один проход в данном случае делать не стоит - потому что надо в общем случае поиграться с настройками DjVu Sep - если хотите получить книгу вменяемого размера. И только получив готовую МРС-продукцию (множество 1-страничных 2-слойных DjVu), вставлять их в книгу-назначение.

DjVu Sep и DjVu Small - каждый из них кодирует в DjVu слишком разнородную информацию, чтобы их можно было объединить в единую программу (как это сделано в msepdjvu).

Добавлено:
Tulon

Цитата:

Так вы вообще никаких усилий не хотите прилагать. С таким отношением я не уверен, что вы и хэлп прочитали бы. Или скажем начали бы читать, и на первом же непонятном месте забросили бы.

Да, именно таков среднестатистический юзер, который будет пробовать воспользоваться Вашей программой. И с этим ничего нельзя поделать. Юзера не переделаешь - под него можно только попытаться подстроиться.

Добавлено:
denver 22

Цитата:

А вот спорами о том, какой программой пользоваться для метода разделенных сканов окончательно меня запутали. Точнее, не нравится мне ситуация, когда двое разработчиков тянут одеяло на себя, критикуя второго. И что мне? опять сравнивать оба метода? Я, блин, уже не книгу буду делать, а лабораторную работу...

Различие между FSD и DjVu Sep есть. FSD будет давать меньший размер (что есть хорошо) в случае, когда в книге много полутоновых иллюстраций. И это исключительно за счёт того, что msepdjvu делает словарь разделённых символов на передних субсканах - а сsepdjvu, разумеется, нет (т.к. вообще это не умеет).
Но FSD менее удобен для "поиграться с настройками" - нежели чем DjVu Sep. Это может оказаться гораздо более значимым фактором (т.е. подбор "размер/качество" картинок).

Если Леон Боту исправит вот этот глюк со сборкой-разборкой DjVu (он мне обещал), то тогда станет возможной подклейка цветных фонов в готовый многостраничный ЧБ DjVu. И тогда хоть какая-нибудь принципиальная разница между FSD и DjVu Sep исчезнет начисто - останется лишь различие в интерфейсе/удобстве использования.

Добавлено:

Цитата:

Не получится - у monday2000 запрет на пост в том топике.

Да, и это ИМХО дел рук albel. Этот факт ИМХО любопытен тем, что он наглядно демонстрирует, что Руборд уже не лучшее место, где следует заниматься развитием скан-обработки. То есть Руборд показал, что ему глубоко начхать на эту проблему. Здесь ещё до моего появления успела сложиться и закостенеть своеобразная "сканкромсаторно-колхозная мафия"

- которая стала тормозить развитие всякими своими нелепыми закидонами. Вот один из образчиков их логики: "Давайте всячески скрывать технологии книгосканирования - потому что иначе враги догадаются, что ими делаются е-книги, догадаются, что где-то должен быть их обменник, и догадаются, что этот обменник - колхоз." Кстати, и СК этой же логикой пронизан.
Вполне вероятно, что тот же форум Натахаус гораздо более заинтересован в развитии технологий книгосканирования - это и понятно - они существуют за счёт них.

Добавлено:
are

Цитата:

1) что такое Otsu и другие методы бинаризации?

http://www.djvu-soft.narod.ru/bookscanlib/023.htm
http://www.djvu-soft.narod.ru/bookscanlib/024.htm
http://www.djvu-soft.narod.ru/bookscanlib/025.htm

Автор: VidelSamogO
Дата сообщения: 21.01.2009 11:08

U235

Цитата:

Ошибка возникает из-за того, что на 3 странице (2 разворот) неправильно определилась полезная область.

Понятно. Но в том то и дело, что меня интересует корректная работа программы в автоматическом режиме. В книге более 1000 страниц. И на паре десятков из них прога вылетает, что не радует. Нельзя ли это как-то исправить в проге?

Автор: Tulon
Дата сообщения: 21.01.2009 12:11

Цитата:

Понятно. Но в том то и дело, что меня интересует корректная работа программы в автоматическом режиме. В книге более 1000 страниц. И на паре десятков из них прога вылетает, что не радует. Нельзя ли это как-то исправить в проге?

Воспроизвел. Значит скоро исправлю.

Добавлено:
Исправил.

Автор: Arcand
Дата сообщения: 21.01.2009 12:36

U235
Цитата:

В фотошопе, при файл/автоматизация/пакет каждый раз всплывает окно плагина с галкой.

Я автоматизацию делал только для Корела, там окошко при пакетной обработке не выскакивает, нужно только сначала обработать плагином какой-либо скан, после этого настройки в плагине сохраняются и используются в дальнейшем.
Что касается Фотошопа, то там для автоматизации используется специальный ресурс. Корел его игнорирует, поэтому я с ним не заморачивался. Похоже, если нет этого ресурса то Фотошоп при пакетной обработке вызывает плагин с селектором = filterSelectorParameters, т.е. вызывается диалог настроек. Корел этот вызов при пакетной обработке пропускает и сразу вызывает плагин с селектором = filterSelectorPrepare.
Если Вам автоматизация в Фотошопе нужна, то могу разобраться и добавить ее для Фотошопа. Тогда надобность в двух плагинах отпадет. К тому же я планирую делать другие плагины, где с настройками будет побогаче. Поэтому, если делать автоматизацию для Фотошопа, то всяко надо вводить в плагин соответствующий ресурс.
Цитата:

замечен баг, видимо связаный или с самим xnview(не последней версии), баг проявляется как черная косая однопиксельная линия, начинающаяся с нижнего 1024-го пикселя.

В Корел и Фотошоп у меня нормально. Наверное, xnview выдает/считывает плагину изображение не должным образом. Проверить не могу, у меня нет xnview.

Автор: are
Дата сообщения: 21.01.2009 13:35

по поводу алгоритмов бинаризации. В теории всё хорошо, а как на практике - вот например такой скан

http://rapidshare.com/files/187052179/p006.tif.html

там в нескольких местах "смазался" текст при сканировании (книга старая, бумага неплотно прилегает к стеклу, а бороться с этим нелегко)

хотелось бы знать, как с этим работают различные алгоритмы бинаризации и какой лучше?

Автор: Tulon
Дата сообщения: 21.01.2009 13:51

Цитата:

там в нескольких местах "смазался" текст при сканировании (книга старая, бумага неплотно прилегает к стеклу, а бороться с этим нелегко)

хотелось бы знать, как с этим работают различные алгоритмы бинаризации и какой лучше?

А вы сами попробуйте. Я попробовал, и Otsu на мой взгляд был лучшим.

Кстати я воспроизвел тормоза на ваших сканах на версии 0.9.1. В текущих бетах уже не тормозит. А пустые страницы так и не воспроизвел.

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72

Предыдущая тема: Невозможно установить Acronis True Image Home v10.0.4940

Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.