Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor: Часть 2

Автор: Alexx S
Дата сообщения: 03.01.2012 10:12
Очень не помешала бы опция для прямоугольных зон картинок. Книг, в которых картинки исключительно прямоугольные куча, и для всех приходится вручную обрисовывать контуры прямоугольника - автоопределение границ очень часто дает неровные края (в лучшем случае) и вырывает большие куски из картинок (чаще всего)
Автор: DikBSD
Дата сообщения: 03.01.2012 12:30

Цитата:
автоопределение границ очень часто дает неровные края (в лучшем случае) и вырывает большие куски из картинок (чаще всего)

В последних сборках STP на этапе Вывода для смешанного режима есть возможность задать обрисовку автоматом по прямоугольнику для автоопределенной картинки. Режим Rectangle/
Автор: amaid
Дата сообщения: 03.01.2012 12:45
возможно, имеет смысл установить Rectangle по умолчанию.
режим Free дает не очень удачные результаты, поэтому реже используется
Автор: Alexx S
Дата сообщения: 04.01.2012 13:58

Цитата:
В последних сборках STP на этапе Вывода для смешанного режима есть возможность задать обрисовку автоматом по прямоугольнику для автоопределенной картинки. Режим Rectangle/


То, что надо. Спасибо!
Единственное, чего не хватает - возможности редактирования границ зоны
Автор: donbaton
Дата сообщения: 09.01.2012 23:25
СканТейлор 0.9.10
Автоматически не обрабатывает все изображения. Множество вопросительных знаков приходиться каждый клацать вручную. Версия 0.9.8 имеет намного более рабочий автомат, почти все обрабатывает.
Автор: amaid
Дата сообщения: 10.01.2012 09:33
странно, у меня такого ни разу не было, каждый день пользуюсь
и с прежними версиями тоже - всё обрабатывалось до единой картинки...
Автор: DikBSD
Дата сообщения: 13.01.2012 07:54
В ветку plus залил код последних изменений из ветки master. Собрать под Windows пока не могу - надо настроить систему после полной переустановки...
Если кому надо исполняемые файлы для Ubuntu (не deb, а просто собранный бинарник) - пишите, выложу.
Автор: Nikola7
Дата сообщения: 14.01.2012 12:42
DikBSD
После обработки очередной книжки посетила мысль
Алгоритм определения полезной области останавливается на достаточно мелких конгломератах пикселов, отстоящих от основной массы текста на приличное расстояние. А ведь исходный объект не может иметь таких свойств... - допустим, полезный объект "точка, оканчивающая предложение"" не может находиться в 5-ти миллиметрах от основного текстового блока, не возможно представить объект реальной страницы с подобными свойствами...
Возможно, в качестве костыля не помешал бы переключатель чувствительности определения границ?
А по-большому, наверное, стоит пересмотреть модель объекта "граница тесктового блока"?
Автор: anagnost96
Дата сообщения: 14.01.2012 12:53
Nikola7

Переключатель (точнее регулятор) не помешал бы, а вот пересматривать модель в сторону ужесточения не надо. Потому что одно дело -- границы текстового блока, а другое -- полезная область, где таких блоков может быть несколько, причем разнесенных на любое расстояние. И так в полезную область часто не попадают номера страниц или, хуже того, сигнатуры тетрадей.
Автор: unreal666
Дата сообщения: 14.01.2012 13:00
anagnost96
+1
Автор: Nikola7
Дата сообщения: 14.01.2012 22:50
anagnost96
Речь не об ужесточении, а о пересмотре модели, - т.е., допустим, о процедуре дополнительных проверок.
Или о распознавании оставленной за границей информации, и включении её в полезную область (исключении). Может быть ещё и элемент обучения системы на этом этапе реализовать.
Автор: iit512
Дата сообщения: 15.01.2012 08:29

Цитата:
И так в полезную область часто не попадают номера страниц или, хуже того, сигнатуры тетрадей.

О, хоть это и немного оффтоп, расскажите, пожалуйста, почему важно оставлять сигнатуры тетрадей.
Автор: anagnost96
Дата сообщения: 15.01.2012 09:58
iit512

Можете считать это проявлением перфекционизма Просто лично для меня книга важна не только как носитель информации, но и как памятник типографской культуры. Поэтому я стараюсь оставлять все элементы ее оформления, не исключая, например, и рекламных листов в конце.

С другой стороны, я, наверное, всё-таки не буду тратить время на пересъемку страницы только из-за того, что сигнатура случайно не попала в кадр.
Автор: iit512
Дата сообщения: 15.01.2012 10:55
Спасибо. Отнесу по классу перфекционизма
Автор: donbaton
Дата сообщения: 17.01.2012 09:04
Подскажите, как сохранить настройки, чтобы с каждой новой книгой не начинать устанавливать индивидуальные настройки по новой?
P.S. Заметил, что Джпеги последняя версия тоже обрабатывает, только не все. Не берет из Файнридера, полученные открытием некоторых дежавю книг. При этом такие книги возможно обработаются версией 0.9.6
Костыль тиф не очень подходит, так как разница в размере и обработке по времени во множество раз из за таких больших файлов.
Автор: Chiffa
Дата сообщения: 17.01.2012 17:50
Вопрос не совсем в тему, прошу прощения. Надеюсь, не пришибете.
Недавно пришлось перебраться из под винды на мак. СТ+ собрал, работает нормально. Но чем сгребать обработанные страницы в DJVU? Есть ли какой-нибудь аналог/порт DJVU Small под мак? Или маководы выкручиваются как-то иначе?
Автор: DikBSD
Дата сообщения: 17.01.2012 18:44

Цитата:
Подскажите, как сохранить настройки, чтобы с каждой новой книгой не начинать устанавливать индивидуальные настройки по новой?

Просто в ScanTailor Plus в Диалоге Настройки выставить нужные данные. Они срабатывают по умолчанию для новых проектов.

Цитата:
Есть ли какой-нибудь аналог/порт DJVU Small под мак?

У меня брат работает на Мак На Маке есть возможность запускать виндовый софт - прекрасно работает. Так что DJVU Smal должен пойти (не проверял, работаю на Линуксе, но у брата на Маке "монстры" из Вмндовс запускаются)
С доугой стороны - есть прекраснейший скрипт - наверняка пойдет и под Маком :https://github.com/ashipunov


Добавлено:

Цитата:
P.S. Заметил, что Джпеги последняя версия тоже обрабатывает, только не все.

Я не собрал пока последнюю версию СТ+ под Win32... Выложенная версия не корректно работает с jpg (если вы ее имели ввиду). Но в репозитории на sourceforge в ветке plus - самый последний код.
Лучше всего использовать все-таки tif, png чем jpeg. От jpeg - масса искажений в буквах,что отражается на низком качестве сканов, бОльшем размере djvu и болью глаз при чтении (IMHO)
Автор: anagnost96
Дата сообщения: 17.01.2012 19:16
DikBSD

Тем не менее, использование внутрикамерных jpeg'ов зачастую является необходимостью. Да и к качеству их лично у меня особых претензий не возникало.
Автор: alpopo
Дата сообщения: 17.01.2012 19:58
anagnost96
Цитата:
использование внутрикамерных jpeg'ов
Поясните, если не трудно, что это такое. Заметил, что некоторые jpeg'и обрабатываются быстро (особенно вывод), а некоторые очень медленно при одинаковом качестве (300дпи). Отчего это зависит?
Автор: amaid
Дата сообщения: 17.01.2012 20:38

Цитата:
есть прекраснейший скрипт

а как его запускать-то без расширения? объясните чайнику
файл img2djvu имею в виду
Автор: unreal666
Дата сообщения: 18.01.2012 00:25

Цитата:
файл img2djvu имею в виду

это unix-скрипт для командного интерпретатора bash. Запускать или на линуксе или в cygwin или в mingw с соответствующими библиотеками.
Автор: iit512
Дата сообщения: 18.01.2012 04:32
img2djvu -- надо скачать, затем сделать исполняемым и поместить к другим исполняемым файлам (например, в папку /usr/local/bin). Потом надо делать так: после обработки СТ заходим в папку с картинками, СТ должен был сделать там подпапку "out". Запускаем в основной папке терминал, в терминале запускаем команду:
img2djvu -d 600 -a 2 -l 2 -m 40 out
(я исходил из предположения, что СТ выводил картинки в 600 dpi, что есть не-черно-белые страницы, и что предпочтительнее высокое сжатие и среднего размера словарь).
Надо еще убедиться, что в системе стоит ImageMagick, DjVu Libre и minidjvu (последнее необязательно, но желательно, если нужен многостраничный словарь).
Автор: donbaton
Дата сообщения: 18.01.2012 11:44
Благодарю за ответы. Скан Тейлор Плюс собираюсь пробывать через некоторое время. А у него настройки где сохраняются, в папке с программой или в реестре Windows?
А кто какой прогой пользуется для сканирования, сам пробывал Файнридер, сейчас ИнфанВиев юзаю. У файна тифы 8 мегов на выходе, если не ошибаюсь, давно им сканировал, а у Инфайн Виева под двадцатку (со сжатием) , PNG тоже большие, какие еще есть хорошие проги для сканирования, чтобы тиф или пнг поменьше получались, а то у меня со стандартной прогой от МФУ сканер сильно тормозит, сканировать очень сложно и долго.
Автор: Chiffa
Дата сообщения: 18.01.2012 15:23
DikBSD, iit512, unreal666 - огромное спасибо! Выручили, все работает, все получилось. Скрипт действительно замечательный!

DikBSD, и отдельное огромное спасибо за работу над СТ. Дай Бог Вам здоровья !


Автор: DikBSD
Дата сообщения: 19.01.2012 19:58
Tulon прислал мне интересную информацию относительно проблем с JPEG:

Цитата:
Оказалось, что старая версия антивируса Symantec (насчет новых не знаю,
никто не проверял) также вызывает эту проблему. Выяснилось это вот тут:
http://www.diybookscanner.org/forum/viewtopic.php?f=21&t=2394

Так что если у кого проблема не пропала после апдейта с версии без
imageformats/qjpeg4.dll, советуйте обновить антивирус, а если не
поможет, то и перейти на другой.


Он выпустил версию ST 0.9.11. Можно скачать с официального сайта.
На днях залью из нее код в ST+ и соберу под Win32.


Добавлено:
Влил изменения кода в ветку plus из ветки master
Автор: Salvatorul
Дата сообщения: 21.01.2012 16:59
Господа маководы, если не трудно, выложите, пожалуйста, где-нибудь сборку st+
Автор: DikBSD
Дата сообщения: 22.01.2012 13:33
Выложил на sourceforge сборку ScanTailor Plus 0.9.11[32bit], в которую вошел код релиза официального ST 0.9.11
Ссылка дана в шапке, но на всякий случай:https://sourceforge.net/projects/scantailor/files/scantailor-devel/plus/0.9.112012-02-22/
Автор: woodyfon
Дата сообщения: 23.01.2012 19:43
DikBSD
Если не трудно, расскажите какие ключевые отличия от оригинального ST. Уже столько сборок появилось, что и запутался.
Автор: DikBSD
Дата сообщения: 23.01.2012 21:08
Теперь jpg отображаются в ST - добавил папку imageformats с dll-ми...
Скачать можно там же
https://sourceforge.net/projects/scantailor/files/scantailor-devel/plus/0.9.11-2012-01-22/

Добавлено:

Цитата:
Если не трудно, расскажите какие ключевые отличия от оригинального ST. Уже столько сборок появилось, что и запутался.

Главное - Настройки для режима Вывода (для ч/б сканов в LZW или FAX4, Уровень пятен и т.д.). Автосохранение. Еще что-то - не помню уже. Кое-что ушло в официальную версию по мелочам...
В последнем релизе код Петра Ковача для Смешанного режима - обводка по прямоугольнику автоопределения зоны.

В основном в README можно посмотреть:https://sourceforge.net/projects/scantailor/files/scantailor-devel/plus/0.9.11pre-2011-11-30/
Автор: amaid
Дата сообщения: 24.01.2012 20:36
запоминание настроек размера полей сделайте, плиз, если не очень трудно.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061

Предыдущая тема: CmCkA v4


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.