Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor

Автор: Tulon
Дата сообщения: 15.11.2009 23:19
StanFreeWare
Все равно не очевидно и все равно заставляет думать. Так или иначе, до окончания работ над деспеклом я не собираюсь улучшать интерфейс.
Автор: anagnost96
Дата сообщения: 15.11.2009 23:21
Лично для меня выпадающие списки в большинстве случаев удобнее, чем переключатели.
Автор: StanFreeWare
Дата сообщения: 15.11.2009 23:37
Пришла в голову мысль:
А что если расширить понятие типа вывода.
Т.е. пусть черно-белый означает удаление всех автозон, но не запрещает добавлять свои зоны вручную. Ведь бывает, что автозоны находятся так криво, что их проще создать вручную, чем исключать все неправильно обнаруженное.
Цветной/серый означает заливку рабочей области автозоной, но опять же не запрещает добавлять свои зоны. Например, когда потребуется часть картинки с текстом перенести в слой foreground.
А при переключении в смешанный ищутся автозоны, как в текущей реализации.
Потенциальную проблему пока что вижу лишь одну - тип ручной зоны "вычесть из автозоны" в черно-белом режиме неактуален.
Автор: Tulon
Дата сообщения: 15.11.2009 23:57
StanFreeWare
Не хочу пока этим заниматься, и даже обдумывать / планировать.
Автор: StanFreeWare
Дата сообщения: 16.11.2009 06:54
anagnost96
поясните про патч:
почему вы не сделали его в окне задания dpi и для всех типов вывода?
Если книжка содержит хотя бы два разных типа, то получается, что нужно отдельно проходить все смешанные картинки и на каждой вручную переключать куда сохранять - в изображения, или в текст. И опять же, возможно проблемы с последующим сбором - как djvu поймет, что смешанные страницы с номером 15, 54 и 72 нужно вставить именно в нужные страницы чб дежавюшки? Вручную создаете 1-14, 16-53 и 55-71 нужного размера, залитые белым, или есть другой способ?
Автор: monday2000
Дата сообщения: 16.11.2009 16:05
StanFreeWare

Цитата:
В Гимпе мне гаусс показался более качественным.

Так а я именно же из Гимпа его и перенёс - причём один-в-один, т.е. у меня он полностью эквивалентен гимповскому. Мне, кстати, тоже гимповский гаусс-блёр показался наиболее качественным - там ведь какая-то сложная формула с экспонентой.
Tulon

Цитата:
Другое дело какой-нибудь инструмент пост-обработки, например тот же DjVu кодер.

Намёк понятен. В принципе, это реально. Я пока ещё не смотрел зоны в СТ, но если будет время, можно будет добавить в поддержку зон из СТ в какую-то из сделанных мною программ для DjVu-кодирования.

Цитата:
Я уже не раз писал, что думаю по этому поводу. Не надо заставлять меня повторять это еще раз.

Вот это пока что главное у нас с Вами принципиальное разногласие. Жаль.

P.S. Вот, кстати, насчёт сегментирования: есть тут один проектик молодой - вот: http://www.ohloh.net/p/didjvu . Автор - тот же, что и у pdf2djvu. Может, там у него что ценное найдётся в этом его didjvu. По крайней мере, я из этой Gamera немало алгоритмов "перебил" тогда под FreeImage успешно.
Автор: anagnost96
Дата сообщения: 16.11.2009 21:06
StanFreeWare

Цитата:
почему вы не сделали его в окне задания dpi и для всех типов вывода?


Ну как-то нелогично было бы делать глобальной такую настройку, которая фактически влияет только на смешанный режим.


Цитата:
Если книжка содержит хотя бы два разных типа, то получается, что нужно отдельно проходить все смешанные картинки и на каждой вручную переключать куда сохранять - в изображения, или в текст.


Я как-то об этом не думал, поскольку для книжек с иллюстрациями (если их не считанные единицы) обычно применяю смешанный режим ко всем страницам и потом переключаюсь на ч/б лишь там, где это позволит избежать обнаружения нежелательных зон.

Однако соглашусь, что некоторое неудобство тут имеется. Мне кажется, наиболее удачное решение проблемы заключалось бы в том, чтобы добавить к диалогу "Применить режим вывода" еще один пункт: "Ко всем страницам с данным режимом".


Цитата:
И опять же, возможно проблемы с последующим сбором - как djvu поймет, что смешанные страницы с номером 15, 54 и 72 нужно вставить именно в нужные страницы чб дежавюшки? Вручную создаете 1-14, 16-53 и 55-71 нужного размера, залитые белым, или есть другой способ?


Склейщик в данном случае руководствуется именами файлов: предполагается, что субскан заднего плана должен отличаться специфическим суффиксом (например, "sep.tiff") от соответствующей ему черно-белой страницы. Если для каких-то страниц такого файла не обнаружится, то, значит, и склеивать ничего не нужно: достаточно просто взять маску как есть. Конечно, для того, чтобы это работало, файлы с картинками нужно как-то переименовывать после вывода, поскольку сам СТ никаких особых суффиксов им не назначает.

На самом деле, для меня как раз некоторую проблему представляют паразитные белые файлы, которые, естественно, генерируются для страниц, содержащих только текст, при обработке их в смешанном режиме с указанием выводить только картинки. Приходится их удалять вручную после вывода.

Автор: StanFreeWare
Дата сообщения: 17.11.2009 01:41
anagnost96

Цитата:
влияет только на смешанный режим

на самом деле (если говорить о выводе картинок в родном разрешении сканов), то должно влиять еще и на страницы в режиме "Цветной/серый".

Цитата:
некоторую проблему представляют паразитные белые файлы


Цитата:
субскан заднего плана должен отличаться специфическим суффиксом

да, в этом есть некоторый костылизм решения. Хотя и переименовывать, и удалять тем же Free (Total) Commander'ом - не проблема. А если не генерировать белые файлы, то придется в СТ посреди экрана писать что-то типа "Текстовый файл не создан из-за отсутствия на данной странице текстовой информации, для отображения страницы прогоните проект в режиме изображение" и наоборот для отсутствующих изображений при генерации текстового вывода. Что скорее всего не прокатит из-за просадки юзабилити.
А что, белый фон сильно портит итоговый djvu?

Цитата:
Склейщик в данном случае руководствуется именами файлов

Я не совсем понял, на входе склейщика (DjVu Imager) на последнем этапе - картинки sep + текстовая djvu. Получается, что информация об именах чб файлов в djvu остается?

Цитата:
"Применить режим вывода" еще один пункт: "Ко всем страницам с данным режимом".

по-моему, так получится масляное масло..
Автор: anagnost96
Дата сообщения: 17.11.2009 13:04
StanFreeWare

Цитата:
на самом деле (если говорить о выводе картинок в родном разрешении сканов), то должно влиять еще и на страницы в режиме "Цветной/серый".


Одно дело -- смена разрешения, а другое -- вывод той или иной составляющей изображения. Это всё-таки разные настройки, хоть их и целесообразно использовать вместе.


Цитата:
А если не генерировать белые файлы, то придется в СТ посреди экрана писать что-то типа "Текстовый файл не создан из-за отсутствия на данной странице текстовой информации, для отображения страницы прогоните проект в режиме изображение" и наоборот для отсутствующих изображений при генерации текстового вывода.


Это еще и потому нежелательно, что иногда вывод пустых страниц целесообразен (я сохраняю пустые страницы книги, чтобы не сбивались нумерация и распределение по разворотам).


Цитата:
А что, белый фон сильно портит итоговый djvu?


Ну а зачем он нужен? Полезной функции не исполняет, а место будет занимать.


Цитата:
Я не совсем понял, на входе склейщика (DjVu Imager) на последнем этапе - картинки sep + текстовая djvu. Получается, что информация об именах чб файлов в djvu остается?


Ну вообще-то да, обычно остается.


Цитата:
по-моему, так получится масляное масло..


А диалог переименовать в "Применить параметры режима вывода", что, кстати, точнее соответствует его назначению. Вот и не будет масла.

Автор: Olive77
Дата сообщения: 18.11.2009 10:16
Tulon

Цитата:
А вот их убил как раз Deskpeckle.


Цитата:
я настроился на доведение до ума Deskpeckle

В настоящее время, н-р, номера в сносках режутся безбожно.
Если нужны примеры, дайте знать.
Автор: StanFreeWare
Дата сообщения: 18.11.2009 11:23
Скрипт для автоматической фильтрации всех tif-ок в папке средствами Gimp. Мне пригодился. http://www.onlinedisk.ru/file/270732/ Использую для борьбы с растром на картинках.
Автор: monday2000
Дата сообщения: 18.11.2009 22:19
StanFreeWare

Цитата:
Получается, что информация об именах чб файлов в djvu остается?

Да (т.е. в многостраничном DjVu). В WinDjView см. Файл - Информация о документе...
Автор: StanFreeWare
Дата сообщения: 20.11.2009 07:17
Русские буквы с пробелами в именах файлов тоже на уровне формата не принимаются? Пока не догадался избавился от них DjVu Imager не хотел подклеивать картинки.
Автор: monday2000
Дата сообщения: 20.11.2009 08:45
StanFreeWare

Цитата:
Русские буквы с пробелами в именах файлов тоже на уровне формата не принимаются?

Точно, это просто djvudump не понимает кириллицу, вот что выдаёт:



Это просто нужно мне подправить.
Автор: are
Дата сообщения: 20.11.2009 12:12
с помощью СТ сделан большой скан (950 страниц, 300дпи серый -> 600дпи чб с выпрямлением)
hччp://rapidshare.com/files/309594879/t08293.rar
пароль twilightzone

определение "полезной области" без ошибок прошло везде, кроме одной страницы, где были сложные иллюстрации и рамка была выбрана неверно. Результат, я считаю, отличный.
Автор: monday2000
Дата сообщения: 20.11.2009 12:33
ST 0.9.7.1: Косячок со скроллбарами: увеличиваю масштаб, протаскиваю картинку, уменьшаю масштаб до минимума - скроллбары не исчезают.
Автор: alpopo
Дата сообщения: 20.11.2009 14:31
Пожелание. При переносе проекта в другой каталог (на другой ПК) он не открывается (не находится на старом месте). Нельзя-ли для этого открыть окно выбора файлов?
Автор: StanFreeWare
Дата сообщения: 20.11.2009 15:21
monday2000

Цитата:
Косячок со скроллбарам

Обсуждалось страницей-двумя выше

alpopo

Цитата:
При переносе проекта в другой каталог

открываете файл проекта в любом текстовом редакторе и заменяете старый путь на новый.

И еще:
Нарисовал временный регулируемый despeckle под windows. Для книг по программированию. Не факт, что быстрее, чем у monday2000 - у меня секунд 7 на страницу.
exe + исходники - http://www.onlinedisk.ru/file/272673/


Автор: Tulon
Дата сообщения: 22.11.2009 20:53
Еще одна сборка: http://www.onlinedisk.ru/file/274878/.
Основная цель сборки - избавиться от последних падений. Тут недавно была статья о ST на SourceForge community blog, в результате которой было много даунлодов и несколько новых падений. Вот их и пытаюсь исправить.

Несколько дней можно тестировать, а потом выпущу версию 0.9.7.2. Особенно надо тестировать удаление / добавление страниц из проекта. Кстати теперь можно удалять много страниц сразу (множественное выделение) и удалять их на любых этапах.

Была пара падений при использовании 3D ускорения на видюхах от Intel и Via, в связи с чем я отключил прямой рендеринг и вообще не даю включать 3D если хоть одна требуемая фича не поддерживается. У меня например под Линуксом на интеловской видюхе не поддерживается мультисэмплинг, из-за чего линии не антиалиазятся. Теперь при таком раскладе 3D ускорение вообще включаться не будет. Кстати отключение прямого рендеринга помогло избавиться от артефактов на той же интеловской видюхе.

Еще пара падений были вызваны нехваткой памяти. Подозреваю, что в режиме отладки. Сделал, чтобы не более трех отладочных картинок сидели в памяти, а остальные - на диске.

vkni

Цитата:
1) Есть ли возможность как-то извлечь документацию по Scantailor из Wiki, чтобы положить её на законное место - в /usr/share/doc/scantailor?

С ходу не нашел такой возможности - попробуйте сами поискать на тему экспорта контента из MediaWiki.


Цитата:
2) Можно ли в меню заменить пункт "Файл" на пункт "Проект"? Чтобы радикально упростить подпункты: например, вместо "Открыть проект" писать просто "Открыть"?

Может быть и можно, хотя как-то нестандартно получится. Отложим это на потом.


Цитата:
3) Я могу безболезненно собрать scantailor с любым патчем под ALT Sisyphus. Точно нужно собрать
его с патчем anagnost96? Кому и куда выслать результат?

В официальную сборку не стоит включать этот патч, а в неофициальную - пожалуйста, вот только я сильно сомневаюсь, что на этом форуме есть пользователи Scan Tailor под ALT Linux.


Перед остальными должен извиниться, если где-то кому-то не ответил. Напрягает меня в последнее время необходимость постоянно отвечать на вопросы / фич-реквесты / баг репорты. Надо дать себе отдохнуть.
Автор: StanFreeWare
Дата сообщения: 22.11.2009 22:03
Что-то новая версия совсем не работоспособна.. Вылетает по ошибке сразу после создания нового проекта даже на 15 файлах. Как серых, так и черно-белых. Или это побочный эффект после 10й деинсталляции/инсталяции?
Автор: ndch
Дата сообщения: 22.11.2009 22:07

Цитата:
2) Можно ли в меню заменить пункт "Файл" на пункт "Проект"? Чтобы радикально упростить подпункты: например, вместо "Открыть проект" писать просто "Открыть"?

Да можно и достаточно просто.
Ранее писал http://forum.ru-board.com/topic.cgi?forum=5&bm=1&topic=27424&start=1388

Вкратце:
Скачать (на данный момент) http://scantailor.git.sourceforge.net/git/gitweb.cgi?p=scantailor/scantailor;a=blob_plain;f=translations/scantailor_ru.ts;hb=71922185e0bbb5566b3e605573dee8d81c700181

Запустить QT Linguist
Открыть,Поправить,Сохранить как .qm в translations\
???
PROFIT!
Автор: Tulon
Дата сообщения: 22.11.2009 22:26
StanFreeWare

Цитата:
Что-то новая версия совсем не работоспособна.. Вылетает по ошибке сразу после создания нового проекта даже на 15 файлах. Как серых, так и черно-белых. Или это побочный эффект после 10й деинсталляции/инсталяции?

Действительно, под виндой вылетает. Буду разбираться, а ссылку на скачивание пока уберу.
Автор: iit512
Дата сообщения: 22.11.2009 22:33

Цитата:
Нарисовал временный регулируемый despeckle под windows.

Прошу прощения за ламерский вопрос -- а как его запустить? У меня не получилось... В архиве четыре exe файла, и все дают ошибку при запуске -- http://img684.imageshack.us/img684/6323/clipboard01g.png
Автор: Tulon
Дата сообщения: 23.11.2009 01:43
Проблему исправил, ссылку в предыдущем посте обновил.

iit512

Цитата:
Прошу прощения за ламерский вопрос -- а как его запустить? У меня не получилось... В архиве четыре exe файла, и все дают ошибку при запуске

Я хоть и не автор, но решение подсказать могу - надо установить Visual Studio Redistributables той же версии, вплоть до сервис пака, как и Visual Studio у автора. Пугаться не надо. Redistributables - они небольшие.

Добавлено:
StanFreeWare
Если вам не трудно, то объясните в двух словах принцип его работы.
Автор: StanFreeWare
Дата сообщения: 23.11.2009 06:50
Tulon

Цитата:
в двух словах

Да банально - хожу квадратом 11x11 пикселов по картинке и смотрю - если суммарное количество черных пикселов во внутреннем квадрате 9x9 меньше порога и на периметре квадрата черных пикселов нет - закрашиваю весь квадрат белым. Такой размер - потому что типографская точка на 600 dpi где-то 10x10 пикселов.
Пока объяснял, понял что зря закрашиваю 11x11 - 9x9 достаточно - периметр-то уже белый))

А ваш принцип какой?

iit512

Redistributable Packages для моей Visual Studio 2008 SP1 - 4 Мб.
http://www.microsoft.com/downloads/details.aspx?familyid=A5C84275-3B97-4AB7-A40D-3802B2AF5FC2&displaylang=en

Вот так напишешь программку - exeшник на 15 кб, а она за собой и NET Framework, и Redistibutable тянет...
Автор: are
Дата сообщения: 23.11.2009 12:33
сейчас я CT попробовал на сканах в разворот (200 страниц серого300дпи).
некоторые страницы были слишком сильно обрезаны снизу (там формулы), вот если хотите потестировать:
hччp://rapidshare.com/files/310997172/1.zip.html
остальное всё было обработано без ошибок на всех этапах. Ручное вмешательство минимально.
(была использована версия 0.9.7.1 под linux/ cxoffice, под wine оно не идёт - вместо букв одни пустые места в интерфейсе почему-то)

я на всякий случай деспекл выключил, не знаю, в каком он сейчас состоянии - не опасно ли им пока что пользоваться.
Автор: iit512
Дата сообщения: 24.11.2009 20:07
Спасибо!
Автор: vkni
Дата сообщения: 25.11.2009 07:19
Tulon


Цитата:
С ходу не нашел такой возможности - попробуйте сами поискать на тему экспорта контента из MediaWiki.


Я искал, естественно, прежде чем обращаться к вам. Мне очень понравилась ваша Вики документация и я хочу её вставить в пакет. Видимо, придётся мне писать скрипт по расшифровке вашего Wiki сайта .


Цитата:
Может быть и можно, хотя как-то нестандартно получится. Отложим это на потом.


Хорошо.


Цитата:
В официальную сборку не стоит включать этот патч


Спасибо.

Добавлено:
ndch


Цитата:
Да можно и достаточно просто.


Спасибо за ответ. Но, прошу прощения, что я ввёл вас в заблуждение. Естественно, я могу сделать и поддерживать патч для меню. Но это совершеннейшая мелочь, которую либо нужно внести в Авторский код (на мой взгляд, очень качественный), либо выбросить из головы.

Я постараюсь проконсультироваться с авторитетным товарищем - Андреем Черепановым, который уже много лет локализует различные версии KDE. Он должен был уже давно сформировать "чувство правильного русского языка в меню" .
Автор: KlsAlex
Дата сообщения: 26.11.2009 10:37
Удалено.
Автор: StanFreeWare
Дата сообщения: 26.11.2009 11:35
KlsAlex


Цитата:
неправильно определяет границы изображений

А зоны на что?
Ссылка


Цитата:
неправильный порог бинаризации

Регулятора насыщенности Тоньше/Жирнее недостаточно?

Tulon
Поправьте ссылку на документацию в шапке.
И как-то нужно обновить зеркало документации - оно устарело. (но это, видимо, уже к Monday2000)

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172

Предыдущая тема: Невозможно установить Acronis True Image Home v10.0.4940


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.