Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor

Автор: dabudada
Дата сообщения: 29.07.2009 14:54
В новой версии обнаружен вылет на стадии разрезки страниц (в предыдущей с этим же пакетом проблем не было), отправить баг-репорт не получается, лучше бы Вы оставили функцию сохранения репорта на компьютере с последующим копи-пастом его здесь.

Добавлено:
Специально решил потестить новую систему разрезки страниц, т.к. хотелось, чтобы
Цитата:
...это тенденция выставлять линию разреза на самом краю картинки в случае одностраничных сканов...
Не сочтите за вредность
Вот страница: http://www.onlinedisk.ru/file/187795/
Автор: Tulon
Дата сообщения: 30.07.2009 00:45

Цитата:
В новой версии обнаружен вылет на стадии разрезки страниц (в предыдущей с этим же пакетом проблем не было), отправить баг-репорт не получается, лучше бы Вы оставили функцию сохранения репорта на компьютере с последующим копи-пастом его здесь.

А что именно происходит после падения? Диалог отправки сообщения о падении открывается? Если нет, то скорее всего отчет совсем не сгенерировался по какой-то причине.

Насчет линии разреза: одну проблему, приводящую к появлению ложной линии скаю, я исправил, зато тут же создал новую, точнее воскресил старую. Новая проблема - алгоритм стал слишком чувствительным к перепаду освешения по краям. Раньше эти перепады подавлялись на стадии препроцессинга как побочный эффект от удаления черного обрамления. Этот препроцессинг ослаблял и саму линию разреза, так что я решил его отключить. Теперь видимо опять включу. Впрочем в вашем примере даже отключение препроцессинга не позволило найти линию сгиба - слишком слабо она видна. Зато перепад яркости скраю был обнаружен и принят да эту самую линию сгиба.
Автор: dabudada
Дата сообщения: 30.07.2009 10:45

Цитата:
А что именно происходит после падения? Диалог отправки сообщения о падении открывается?

Вылазит диалоговое окно, в котором предлагается отослать отчет (при на нажатии на него выскакивает стандартное окно с предложением выбора программы открытия неизвестного файла/расширения, я не имею понятия какая софтина его распознает), нажимаю отослать, но через пару минут внизу пишется, что отсылка отчета не удалась (не цитирую, пишу по памяти).
P.S. Еще мучаю проект с исчезнувшей миниатюрой, пока не пришел ни к каким выводам и не нашел способ Вам его отослать.
Автор: dma200899
Дата сообщения: 30.07.2009 20:17
В диалоге "исправить DPI":

часть сканов 200, часть 300, часть 400 dpi.
добрые люди обрезали кажется в СК, в результате у каждой страницы свой размер в пикселях.
Хочется выделить в диалоге группу групп страниц и задать размер.
А вот фиг. Выделение только по узлам.
А их столько - сколько страниц.

Хоцца группового выделения в диалоге. Т.е. с shift или alt.

Щас же придется все дащит в ACDSEE, сортировать по размерам. делить на три папки по группам размеров и в СК принудительно задавать значения дпи.

прошу:
включить кнопки alt, shift в диалоге "исправить DPI" для выделения одновременно нескольких групп страниц.


Добавлено:
Баг. Как со случаем удаления широкой страницы.

Включил автомат макет.
Одна страница была повернута но 90.
Увидел это на ленте после обработки этой страницы.
Остановил автомат, первернул страницу (исправил ориентацию), продолжил автомат.

Эта страница в итоге видится как самая широкая и у нее сохраняется размер (полей), который был до правильного разворота. В итоге у всех страниц гигантские поля.



Добавлено:
PPS

нельзя ли кнопку сверху ленты запрграммировать следующим образом.
Чтобы когда авто-обработка закончилась нажатие на нее перемещало ленту на ту страницу, которая сейчас в главной зоне.
А то имеем.
Страница в гланой зоне никак не поименована.
Я пошел на самую широкую, а лента осталась стоять.
Я хочу увидеть самую широкую в ленте (сравнить с соседями) а прийти на нее не могу.


Автор: Tulon
Дата сообщения: 30.07.2009 23:11
dabudada

Цитата:
Вылазит диалоговое окно, в котором предлагается отослать отчет (при на нажатии на него выскакивает стандартное окно с предложением выбора программы открытия неизвестного файла/расширения, я не имею понятия какая софтина его распознает), нажимаю отослать, но через пару минут внизу пишется, что отсылка отчета не удалась (не цитирую, пишу по памяти).

У вас выход в инет случайно не через прокси? В принципе могу сделать drag and drop ссылки на файл в файл менеджер, но хотелось бы разобраться, почему отчеты не отсылаются. В принципе если сильно захотеть, можно до этого файла добраться и без drag and drop'а. Правый клик на ссылку -> копировать, вставить в Firefox или IE, и там вам по идее должны предложить сохранить этот файл.

dma200899

Цитата:
часть сканов 200, часть 300, часть 400 dpi.
добрые люди обрезали кажется в СК, в результате у каждой страницы свой размер в пикселях.
Хочется выделить в диалоге группу групп страниц и задать размер.
А вот фиг. Выделение только по узлам.
А их столько - сколько страниц.

Хоцца группового выделения в диалоге. Т.е. с shift или alt.

Это пожалуй можно. Сделаю когда дойдут руки, если не забуду конечно.


Цитата:
Включил автомат макет.
Одна страница была повернута но 90.
Увидел это на ленте после обработки этой страницы.
Остановил автомат, первернул страницу (исправил ориентацию), продолжил автомат.

Эта страница в итоге видится как самая широкая и у нее сохраняется размер (полей), который был до правильного разворота. В итоге у всех страниц гигантские поля.

Воспроизвел. Буду разбираться.


Цитата:
нельзя ли кнопку сверху ленты запрграммировать следующим образом.
Чтобы когда авто-обработка закончилась нажатие на нее перемещало ленту на ту страницу, которая сейчас в главной зоне.

Хм, вроде эта кнопка так и работает - при нажатии прокручивает ленту к текущей выбранной странице. Текущая выбранная - это как раз та, что в главном окне.
Автор: dma200899
Дата сообщения: 31.07.2009 01:24

Цитата:
Хм, вроде эта кнопка так и работает

вот сейчас (прогнал обработку на стадии вывод) - да.
а сразу после того как сделал авто макет - не наблюдалось.

На этом проекте уже не буду, а буду еще какую книгу делать посмотрю на ее поведение.
Фишка в том и была, что я на кнопку жал, а лента стояла.
Я как раз кажется тогда на "самую широкую" (что крутил на 90) перешел после конца работы автомата.
Но потом для проверки и еще пару страниц жал.

Добавлено:
учитывается ли на стадии выводв в режиме "смешанный" исходный скан ?

Обнаружил следующее.
Если рамка полезной зоны стоит ровно на границе картинки часть ее может обелиться. Если же рамка от картинки чуть отстоит - больше вероятность, что сегментация пройдет по краю картинки.
Автор: dabudada
Дата сообщения: 31.07.2009 09:54

Цитата:
У вас выход в инет случайно не через прокси

Прокся-прокся ;( Для таких как я и было бы полезно сохранять отчет на рабочем столе к примеру.
Автор: Tulon
Дата сообщения: 01.08.2009 00:07
dabudada
Думаю можно эту систему и через прокси заставить работать. Может и drag and drop для дамп файла за одно сделаю, если это не слишком сложно окажется.
Автор: ndch
Дата сообщения: 01.08.2009 03:06
Tulon
Было бы здорово, если стало возможно таскать "полезную область" целиком, без изменения размера ...
Автор: dma200899
Дата сообщения: 01.08.2009 04:13
ага, и задавать ее точного пиксельного размера
Автор: AlexShag
Дата сообщения: 01.08.2009 09:30
Прошу прощения, если это уже описывалось.

При обработке теряются знаки умножения-точки в формулах. Возможно ли оставлять их?
Автор: dma200899
Дата сообщения: 01.08.2009 10:46
а галка "удалять пятна" включена или выключена ?
Автор: Tulon
Дата сообщения: 01.08.2009 14:23
Добавил поддержку прокси в краш репортер.
Новая сборка: http://www.onlinedisk.ru/file/189648/

Добавлено:
Прокси с паролем думаю все равно работать не будут.

Добавлено:
ndch

Цитата:
Было бы здорово, если стало возможно таскать "полезную область" целиком, без изменения размера ...

Это есть в планах, но если я буду отвлекаться на мелочи, то никогда не доберусь до действительно серьезных проблем, а именно:
1. Невозможность вручную выделять картинки.
2. Слишком аггрессивное и нерегулируемое удаление пятен.
Автор: ndch
Дата сообщения: 02.08.2009 08:08
Tulon
таскать "полезную область" - это не мелочь.
Это "последняя миля" для кадрирования журналов.

Потому как в файле проекте легко прописать нужный размер кадра на всех страницах, например:
<content-rect width="1920" x="0" y="0" height="2800" />

А вот возможности перемещения области (а особенно перемещения курсорными клавишами ) нет.
Приходится наращивать края и кадрировать в фотошопе.
Автор: dma200899
Дата сообщения: 02.08.2009 09:16
Все книгосканировщики хором с самого начала разработки (см. форум натахауса, пост №5 после объявления атора о начале разработки, и далее многократно) говорят что это край как надо, а тулон (оранж) упирается. По типу как с окошком старта.
Хорошо хоть, что не говорит "докажите, что это так".

А ведь на самом деле кошмар, если люди ручками файл проекта правят, ибо у действительно нужных вещей "приоритет низкий".

Как я уже писал, причина - игнорирование того, что по большей части идет перекидывание сканов из проги в прогу. Я по пальцам могу перечислить книги, которые мной сделаны только в СТ. Даже из своих хороших сканов.

Помимо рамки ещё нужна нормальная стадия формирования проекта, где была бы возможность правки дпи, с индикацией дпи и пиксельных размеров для каждого изображения в проекте.
Как я писал в июне 2008-го:

Цитата:

Очень порадовало окно "Fix DPI". Жалко, что оно видно только в начале и потом никак недоступно. ...
А может можно новую стадию добавить Insert files как первый шаг процесса. А в окне по центру пока картинок страниц нету и показывать таблицу с размерами, прописанными дпи и определять нужны ли какие ресайзинги-ресэмплинги ? Тогда, кстати, можно будет легко добавлять отдельные картинки-файлы в уже существующий проект.



А также возможность отключить исполнение любого этапа. (По сути, monday2000 хочет именно этого).
Сейчас:
1) разрезка страниц - отключаема
2) компенсация наклона - вроде пообещали возможность отключения. Я щас тупо 0 руками применяю к каждой, если что.
3) полезная область - упс. Если только вручную растащить по краям...
править файл проекта - это хорошая идея.
4) макет - можно поставить поля 0 и применить ко всем
5) вывод (сглаживание в ч.б.) как писал тулон если делать в сером, то сглаживания нет -теперь я вывожу в сером (цветном) и тащу бинаризовать в СК.


Как-то в лом подбирать примеры, но у меня есть три типичных ситуации, когда сглаживание СТ вредно
а) наличие паразитного мусора, который сильно ужирняется (а выключить удаление пятен нельзя ибо пропадет и то что нужно). Причем вследствие этого ужирнения его уже становится тяжело удалить.
б) скан, в котором засечки на буквах (например, и, н, п ...) так близко сходятся, что после сглаживания сливаются:
__ __ _____
| | превращается в | |
| | | |
в) уже бинаризованный и сглаженный с ужирнением скан, для которого меняется визуальное восприятие. Нельзя сказать, что он становится нечитаемым, но впечатление таково, что качество ухудшается.
Автор: Tulon
Дата сообщения: 02.08.2009 10:36
ndch

Цитата:
таскать "полезную область" - это не мелочь.
Это "последняя миля" для кадрирования журналов.

По сравнению с невозможностью ручного выделения картинок это таки мелочь. Во первых - книги важнее журналов. Во вторых - без фиксированной рамки обходиться все же можно - тягять эту рамку за края на каждой странице. Тяжело но можно. А вот когда в книге N-ное колличество картинок неправильно определилось - с этим обычный пользователь вообще не справится. В результате многие вообще избегают СТ для книг с картинками.

dma200899

Цитата:
Как я уже писал, причина - игнорирование того, что по большей части идет перекидывание сканов из проги в прогу. Я по пальцам могу перечислить книги, которые мной сделаны только в СТ. Даже из своих хороших сканов.

Это не игнорирование. Просто при таком сценарии проблем на порядок больше, и соответственно решаться они будут еще очень долго.

Кстати мне интересно, что именно мешает сырой скан (допустим что он у вас есть) от начала и до конца сделать в СТ? Про фиксированную рамку и выделение картинок я знаю. Что-то еще?


Цитата:
Помимо рамки ещё нужна нормальная стадия формирования проекта, где была бы возможность правки дпи, с индикацией дпи и пиксельных размеров для каждого изображения в проекте.

Нужна, согласен. Но все же не приоритетна. Подумайте сами: для полного счастья при обработке сырых сканов осталось всего пару моментов реализовать / улучшить. А вот для работы с чужими сканами, которые могут быть:
1. С неправильными DPI (или не дай бог в добавок к этому разнобойными).
2. C полями искусственного происхождения.
3. С низким разрешением.
4. Сжатые в JPEG.
5. С черно-белым мусором.
6. Не разрезанные, но при этом без намека на линию сгиба.

Вот и скажите мне теперь, какое направление более приоритетно: доведение до ума обработки сырых сканов (пара месяцев работы), или попытки поддержки поломанных разными способами чужих сканов? В последнем случае я даже не знаю, сколько времени на это уйдет, и результаты все равно будут не идеальными. В конце концов если не будет проблем с сырыми сканами, возможно горе сканировщики пересядут на СТ, и наступит всеобщая благодать


Цитата:
а) наличие паразитного мусора, который сильно ужирняется (а выключить удаление пятен нельзя ибо пропадет и то что нужно).

Ну удаление пятен в конце концов будет доведено до ума, и задача эта приоритетная.


Цитата:
б) скан, в котором засечки на буквах (например, и, н, п ...) так близко сходятся, что после сглаживания сливаются:

А на входе небось 150 DPI JPEG? Тогда это вполне ожидаемо. Кроме того, для выравнивания освешения очень вредны поля искусственного происхождения.


Цитата:
в) уже бинаризованный и сглаженный с ужирнением скан, для которого меняется визуальное восприятие. Нельзя сказать, что он становится нечитаемым, но впечатление таково, что качество ухудшается.

Ну вы эстет надо сказать. В таком случае - вывод в сером режиме и бинаризация где-то еще - вполне себе решение. Не для масс конечно, но массам это и не нужно.

Автор: dma200899
Дата сообщения: 02.08.2009 12:03

Цитата:
Кстати мне интересно, что именно мешает сырой скан (допустим что он у вас есть) от начала и до конца сделать в СТ? Про фиксированную рамку и выделение картинок я знаю. Что-то еще?


Грязь, но тут вы обольщаетесь, ставя ее приоритетом. Есть такая грязь, что ни БР ни СК ее не берут. Увы, только ручками. Плюс сами буквы могут быть на некоторых страницах попорчены и тогда ластиком в СК - грязь+реставрация отдельных букв.

А вот интересно, что вы знаете про выделение картинок ?

Сейчас очень просто: я прогоняю пакет в СТ в ч/б, в смешанном и в цветном режимах.
А потом собираю отдельно все правильные картинки и картинки, которые надо довести до ума в СК. Как я уже писал, мне в СК резать неудобно, а энхенсинг делать как раз удобно.

Я не думаю, что вы сразу сделаете нормально работу с зонами. Ибо, что я делаю в СК с неполучившимися в СТ страницами (в среднем их где-то 8% от книги):

1) Например в СК есть чистка по краям картинки. руками удаляются ошметки вокруг картинки, не трогая саму картинку.

2) В СТ у меня есть случаи, когда фоном заливается часть картинки - (хорошо бы иметь настройку порога сегментации, но часть картинок действительно сливается с фоном и это не автоматизировать).

3) Для части картинок (малоцвет), когда сегментация в СТ их не выделяет. Для обеления фона я в СК завышаю контраст и снижаю гамму (в уровнях).
Т.е. вам нужен инструмент уровни в СТ.

4) Часть картинок, которые идут в цвете, а СТ в смешанном делает их черно-белым.
Тогда я делаю оутпут цветным и в СК.

5) У вас идет смешение опции цвет/серый. Часть серых картинок выглядят как цветные (желтизна, коричневизна), я их в СК конвертю в серый.

6) Часть картинок, где идет паразитный фон, я в СК делаю магическое выделение цвета.
В некоторых случаях я делаю это в Фотошопе - при минимальном пороге чувствительности. Волшебное выделение.
Это, как правило, где кривые контуры картинок, а сегметация СТ оставила куски фона.

7) Вот как то была книга напечатана в малоцвете, но цвета загрязнились. Я в Фотошопе в иллюстрациях. просто заливал зоны правильным цветом.

8) Вот только что на странице прыгала освещенность, но даже БР не помог. Я в СК просто на всей странице навыделял зон и каждой задавал свой порог бинаризации.

9) не говоря уже о том, что выделение картинок в СК заточено под джвучивание в FSD - т.е. создается пара картинок с принудительной сегментацией на фон и маску.
См. пример на сайте monday2000
http://www.djvu-soft.narod.ru/scan/djvu_sep.htm
Если картинки имеют мелкие контрастные элементы, то это очень выгодно иначе они уйдут в маску и будут выглядеть плохо.


Ну допустим вы сделаете пункты
1 (заливку-ластик, игнорирующие зоны);
4 (запрет на бинаризацию в зоне),
5 (принудительная конвертация в серый)
9 (вы даже кому-то рассказывали где это в СТ внедрять)


Да вот это самое противное: когда серая или цветная картинка по результатам СТ обработки в смешанном режиме оказывается черно-белой. У меня как-то так было. У части страниц я удалил фон и вставлял в фотошопе отдельные картинки (там где фон вокруг картинки удалялся а по всей странице нет, или выделял картинку кривой.
У части - где фон нормально удалялся по всей странице - подменил входные картинки в проекте СТ.


Но вы приоритетами считаете грязь, что не решит проблему.

Выделение картинок, если вы не хотите оутпутить пары субсканов, то это тоже не приоритет, т.к. для нормального кодирования по "методу разделенных сканов" - с использованием программы FSD все равно нужно будет в СК картинки еще раз выделять.

Кстати, bolega много писал про перекрывающиеся зоны, про зоны непрямоугольной конфигурации...

Да вот щас как раз книжку кодил с такими руками заданными кривыми контурами зонами. Там кривоконтурные цветные картинки были встроены в ч.б. текст. И по другому никак. СТ же сегментацию не делал.
Автор: Tulon
Дата сообщения: 02.08.2009 12:28
Зоны я уже начал делать. Они будут из себя представлять многоугольники произвольной формы. У зон будут свойства. Самое нужное свойство - "запрет бинаризации" - реализую в первую очередь. Потом постепенно будут добавляться другие свойства. Проблемы с выделением картинок это решит. Например, когда вы говорите "цветную картинку делает черно-белой" - на самом деле СТ просто не распознал эту картинку совсем.
Автор: dma200899
Дата сообщения: 02.08.2009 13:35
Забыл еще.
В серых зонах, писали здесь на руборде, надо блур делать, чтобы джву не делал неправильную сегментацию.
(Это если не принудительную сегментацию как в FSD, а довериться сегментеру ДЕЕ).

Я щас первый раз с такой фигней столкнулся, что да, нужен блур, иначе фотки идут пятнами.
Автор: Tulon
Дата сообщения: 02.08.2009 16:01
Вопрос ко всем: падения у кого-нибудь были? Я ни одного краш репорта с версии 0.9.6 не получил. dabudada сообщал о падении на стадии полезной области, но он не смог отправить отчет из-за прокси. У кого-нибудь еще падало?
Автор: dma200899
Дата сообщения: 02.08.2009 17:48
Ну у меня на файле dabudada тоже упал.
Шлю репорт.

Но для него СК внизу где инфа о файле пишет
"deflate compr"

Чтобы это значило ?

Причем, если файл не вращать, то не падает.
А если исправить ориентацию (180) то падает.
Автор: Tulon
Дата сообщения: 02.08.2009 18:17
dma200899
Краш репорт получил, но он кастрированный - видимо frame pointer ommission при сборке всегда нужно запрещать. Впредь так и буду делать.

А что за файл то? Его сюда выкладывали? Что-то я не припомню.

Добавлено:
"deflate compr" скорее всего означает deflate compression - видимо TIFF с deflate сжатием. Это не проблема.
Автор: dma200899
Дата сообщения: 02.08.2009 18:31
Выкладывали 20 постов назад. Третий сверху на 61 странице
http://www.onlinedisk.ru/file/187795/
Автор: Tulon
Дата сообщения: 02.08.2009 20:01
Проблему нашел и исправил. Вот новая сборка: http://www.onlinedisk.ru/file/190302/
Автор: dma200899
Дата сообщения: 03.08.2009 11:27
Опять ерунда с размерами страниц.
официальная версия 0.9.6

В проекте на входе развороты.
Делаю проект, делаю вывод.
(даже конверчу в джву)

Потом решаю подменить один из разворотов.
СТ находится в это время на стадии макет.

В момент подмены сносятся правильные размеры страниц и все становятся широкими (втидимо под размер неразрезанного разворота).
И остаются такими даже после разрезки нового файла.

Просто когда у меня прошлый раз в другой ситуации была проблема с размерами вы написали "Воспроизвел. Буду разбираться", но поправлено или нет - неизвестно.
Вчерашнюю сборку не ставил.

Добавлено:
В смешанном режиме на странице справа появляется какая-то черная полоса.
http://www.onlinedisk.ru/file/190912/
Автор: AlexShag
Дата сообщения: 05.08.2009 18:33

Цитата:
При обработке теряются знаки умножения-точки в формулах. Возможно ли оставлять их?

dma200899

Цитата:
галка "удалять пятна" включена или выключена ?


Использую 0.9.5 Не нашел этой опции, подскажите где, и возможно ли настроить, чтобы точки умножения в тексте формул оставались, но пятна удалялись?
Автор: Tulon
Дата сообщения: 05.08.2009 23:21
Народ, я некоторое время буду в ауте, потому как переехал на новое жилье, а подключение интернета займет некоторе время. Сейчас поймал открытую WiFi, с нее и пишу. Коннект очень паршивый, и ноут приходиться чуть ли не на подоконник ставить.

AlexShag
Пока удаление пятен не настраивается. Оно либо включено либо нет. Впрочем это высокоприоритетная задача.

dma200899
Проблема понятна. Она возникает в нескольких ситуациях, и выходит что я не все их учел. Как руки дойдут - поправлю.
Автор: AlexShag
Дата сообщения: 06.08.2009 17:54

Цитата:
Пока удаление пятен не настраивается. Оно либо включено либо нет. Впрочем это высокоприоритетная задача.


Так где же эта опция включения-выключения в программе?
Автор: dma200899
Дата сообщения: 06.08.2009 18:36
на стадии вывод в режиме черно-белый
Автор: dma200899
Дата сообщения: 13.08.2009 03:31
вот опять.
размеры страницы залипли; и
не работает кнопка сверху ленты.
(м.б. это взаимосвязано ?)

как воспроизвести весь ход действий, котоырй к этому привел ????
весь проект скинуть ? 457 Mb

Добавлено:
вышел и вошел.
все вроде нормализовалось ....

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172

Предыдущая тема: Невозможно установить Acronis True Image Home v10.0.4940


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.