Очень не помешала бы опция для прямоугольных зон картинок. Книг, в которых картинки исключительно прямоугольные куча, и для всех приходится вручную обрисовывать контуры прямоугольника - автоопределение границ очень часто дает неровные края (в лучшем случае) и вырывает большие куски из картинок (чаще всего)
» Scan Tailor: Часть 2
Цитата:
автоопределение границ очень часто дает неровные края (в лучшем случае) и вырывает большие куски из картинок (чаще всего)
В последних сборках STP на этапе Вывода для смешанного режима есть возможность задать обрисовку автоматом по прямоугольнику для автоопределенной картинки. Режим Rectangle/
возможно, имеет смысл установить Rectangle по умолчанию.
режим Free дает не очень удачные результаты, поэтому реже используется
режим Free дает не очень удачные результаты, поэтому реже используется
Цитата:
В последних сборках STP на этапе Вывода для смешанного режима есть возможность задать обрисовку автоматом по прямоугольнику для автоопределенной картинки. Режим Rectangle/
То, что надо. Спасибо!
Единственное, чего не хватает - возможности редактирования границ зоны
СканТейлор 0.9.10
Автоматически не обрабатывает все изображения. Множество вопросительных знаков приходиться каждый клацать вручную. Версия 0.9.8 имеет намного более рабочий автомат, почти все обрабатывает.
Автоматически не обрабатывает все изображения. Множество вопросительных знаков приходиться каждый клацать вручную. Версия 0.9.8 имеет намного более рабочий автомат, почти все обрабатывает.
странно, у меня такого ни разу не было, каждый день пользуюсь
и с прежними версиями тоже - всё обрабатывалось до единой картинки...
и с прежними версиями тоже - всё обрабатывалось до единой картинки...
В ветку plus залил код последних изменений из ветки master. Собрать под Windows пока не могу - надо настроить систему после полной переустановки...
Если кому надо исполняемые файлы для Ubuntu (не deb, а просто собранный бинарник) - пишите, выложу.
Если кому надо исполняемые файлы для Ubuntu (не deb, а просто собранный бинарник) - пишите, выложу.
DikBSD
После обработки очередной книжки посетила мысль
Алгоритм определения полезной области останавливается на достаточно мелких конгломератах пикселов, отстоящих от основной массы текста на приличное расстояние. А ведь исходный объект не может иметь таких свойств... - допустим, полезный объект "точка, оканчивающая предложение"" не может находиться в 5-ти миллиметрах от основного текстового блока, не возможно представить объект реальной страницы с подобными свойствами...
Возможно, в качестве костыля не помешал бы переключатель чувствительности определения границ?
А по-большому, наверное, стоит пересмотреть модель объекта "граница тесктового блока"?
После обработки очередной книжки посетила мысль
Алгоритм определения полезной области останавливается на достаточно мелких конгломератах пикселов, отстоящих от основной массы текста на приличное расстояние. А ведь исходный объект не может иметь таких свойств... - допустим, полезный объект "точка, оканчивающая предложение"" не может находиться в 5-ти миллиметрах от основного текстового блока, не возможно представить объект реальной страницы с подобными свойствами...
Возможно, в качестве костыля не помешал бы переключатель чувствительности определения границ?
А по-большому, наверное, стоит пересмотреть модель объекта "граница тесктового блока"?
Nikola7
Переключатель (точнее регулятор) не помешал бы, а вот пересматривать модель в сторону ужесточения не надо. Потому что одно дело -- границы текстового блока, а другое -- полезная область, где таких блоков может быть несколько, причем разнесенных на любое расстояние. И так в полезную область часто не попадают номера страниц или, хуже того, сигнатуры тетрадей.
Переключатель (точнее регулятор) не помешал бы, а вот пересматривать модель в сторону ужесточения не надо. Потому что одно дело -- границы текстового блока, а другое -- полезная область, где таких блоков может быть несколько, причем разнесенных на любое расстояние. И так в полезную область часто не попадают номера страниц или, хуже того, сигнатуры тетрадей.
anagnost96
+1
+1
anagnost96
Речь не об ужесточении, а о пересмотре модели, - т.е., допустим, о процедуре дополнительных проверок.
Или о распознавании оставленной за границей информации, и включении её в полезную область (исключении). Может быть ещё и элемент обучения системы на этом этапе реализовать.
Речь не об ужесточении, а о пересмотре модели, - т.е., допустим, о процедуре дополнительных проверок.
Или о распознавании оставленной за границей информации, и включении её в полезную область (исключении). Может быть ещё и элемент обучения системы на этом этапе реализовать.
Цитата:
И так в полезную область часто не попадают номера страниц или, хуже того, сигнатуры тетрадей.
О, хоть это и немного оффтоп, расскажите, пожалуйста, почему важно оставлять сигнатуры тетрадей.
iit512
Можете считать это проявлением перфекционизма Просто лично для меня книга важна не только как носитель информации, но и как памятник типографской культуры. Поэтому я стараюсь оставлять все элементы ее оформления, не исключая, например, и рекламных листов в конце.
С другой стороны, я, наверное, всё-таки не буду тратить время на пересъемку страницы только из-за того, что сигнатура случайно не попала в кадр.
Можете считать это проявлением перфекционизма Просто лично для меня книга важна не только как носитель информации, но и как памятник типографской культуры. Поэтому я стараюсь оставлять все элементы ее оформления, не исключая, например, и рекламных листов в конце.
С другой стороны, я, наверное, всё-таки не буду тратить время на пересъемку страницы только из-за того, что сигнатура случайно не попала в кадр.
Спасибо. Отнесу по классу перфекционизма
Подскажите, как сохранить настройки, чтобы с каждой новой книгой не начинать устанавливать индивидуальные настройки по новой?
P.S. Заметил, что Джпеги последняя версия тоже обрабатывает, только не все. Не берет из Файнридера, полученные открытием некоторых дежавю книг. При этом такие книги возможно обработаются версией 0.9.6
Костыль тиф не очень подходит, так как разница в размере и обработке по времени во множество раз из за таких больших файлов.
P.S. Заметил, что Джпеги последняя версия тоже обрабатывает, только не все. Не берет из Файнридера, полученные открытием некоторых дежавю книг. При этом такие книги возможно обработаются версией 0.9.6
Костыль тиф не очень подходит, так как разница в размере и обработке по времени во множество раз из за таких больших файлов.
Вопрос не совсем в тему, прошу прощения. Надеюсь, не пришибете.
Недавно пришлось перебраться из под винды на мак. СТ+ собрал, работает нормально. Но чем сгребать обработанные страницы в DJVU? Есть ли какой-нибудь аналог/порт DJVU Small под мак? Или маководы выкручиваются как-то иначе?
Недавно пришлось перебраться из под винды на мак. СТ+ собрал, работает нормально. Но чем сгребать обработанные страницы в DJVU? Есть ли какой-нибудь аналог/порт DJVU Small под мак? Или маководы выкручиваются как-то иначе?
Цитата:
Подскажите, как сохранить настройки, чтобы с каждой новой книгой не начинать устанавливать индивидуальные настройки по новой?
Просто в ScanTailor Plus в Диалоге Настройки выставить нужные данные. Они срабатывают по умолчанию для новых проектов.
Цитата:
Есть ли какой-нибудь аналог/порт DJVU Small под мак?
У меня брат работает на Мак На Маке есть возможность запускать виндовый софт - прекрасно работает. Так что DJVU Smal должен пойти (не проверял, работаю на Линуксе, но у брата на Маке "монстры" из Вмндовс запускаются)
С доугой стороны - есть прекраснейший скрипт - наверняка пойдет и под Маком :https://github.com/ashipunov
Добавлено:
Цитата:
P.S. Заметил, что Джпеги последняя версия тоже обрабатывает, только не все.
Я не собрал пока последнюю версию СТ+ под Win32... Выложенная версия не корректно работает с jpg (если вы ее имели ввиду). Но в репозитории на sourceforge в ветке plus - самый последний код.
Лучше всего использовать все-таки tif, png чем jpeg. От jpeg - масса искажений в буквах,что отражается на низком качестве сканов, бОльшем размере djvu и болью глаз при чтении (IMHO)
DikBSD
Тем не менее, использование внутрикамерных jpeg'ов зачастую является необходимостью. Да и к качеству их лично у меня особых претензий не возникало.
Тем не менее, использование внутрикамерных jpeg'ов зачастую является необходимостью. Да и к качеству их лично у меня особых претензий не возникало.
anagnost96
Цитата:
Цитата:
использование внутрикамерных jpeg'овПоясните, если не трудно, что это такое. Заметил, что некоторые jpeg'и обрабатываются быстро (особенно вывод), а некоторые очень медленно при одинаковом качестве (300дпи). Отчего это зависит?
Цитата:
есть прекраснейший скрипт
а как его запускать-то без расширения? объясните чайнику
файл img2djvu имею в виду
Цитата:
файл img2djvu имею в виду
это unix-скрипт для командного интерпретатора bash. Запускать или на линуксе или в cygwin или в mingw с соответствующими библиотеками.
img2djvu -- надо скачать, затем сделать исполняемым и поместить к другим исполняемым файлам (например, в папку /usr/local/bin). Потом надо делать так: после обработки СТ заходим в папку с картинками, СТ должен был сделать там подпапку "out". Запускаем в основной папке терминал, в терминале запускаем команду:
img2djvu -d 600 -a 2 -l 2 -m 40 out
(я исходил из предположения, что СТ выводил картинки в 600 dpi, что есть не-черно-белые страницы, и что предпочтительнее высокое сжатие и среднего размера словарь).
Надо еще убедиться, что в системе стоит ImageMagick, DjVu Libre и minidjvu (последнее необязательно, но желательно, если нужен многостраничный словарь).
img2djvu -d 600 -a 2 -l 2 -m 40 out
(я исходил из предположения, что СТ выводил картинки в 600 dpi, что есть не-черно-белые страницы, и что предпочтительнее высокое сжатие и среднего размера словарь).
Надо еще убедиться, что в системе стоит ImageMagick, DjVu Libre и minidjvu (последнее необязательно, но желательно, если нужен многостраничный словарь).
Благодарю за ответы. Скан Тейлор Плюс собираюсь пробывать через некоторое время. А у него настройки где сохраняются, в папке с программой или в реестре Windows?
А кто какой прогой пользуется для сканирования, сам пробывал Файнридер, сейчас ИнфанВиев юзаю. У файна тифы 8 мегов на выходе, если не ошибаюсь, давно им сканировал, а у Инфайн Виева под двадцатку (со сжатием) , PNG тоже большие, какие еще есть хорошие проги для сканирования, чтобы тиф или пнг поменьше получались, а то у меня со стандартной прогой от МФУ сканер сильно тормозит, сканировать очень сложно и долго.
А кто какой прогой пользуется для сканирования, сам пробывал Файнридер, сейчас ИнфанВиев юзаю. У файна тифы 8 мегов на выходе, если не ошибаюсь, давно им сканировал, а у Инфайн Виева под двадцатку (со сжатием) , PNG тоже большие, какие еще есть хорошие проги для сканирования, чтобы тиф или пнг поменьше получались, а то у меня со стандартной прогой от МФУ сканер сильно тормозит, сканировать очень сложно и долго.
DikBSD, iit512, unreal666 - огромное спасибо! Выручили, все работает, все получилось. Скрипт действительно замечательный!
DikBSD, и отдельное огромное спасибо за работу над СТ. Дай Бог Вам здоровья !
DikBSD, и отдельное огромное спасибо за работу над СТ. Дай Бог Вам здоровья !
Tulon прислал мне интересную информацию относительно проблем с JPEG:
Цитата:
Он выпустил версию ST 0.9.11. Можно скачать с официального сайта.
На днях залью из нее код в ST+ и соберу под Win32.
Добавлено:
Влил изменения кода в ветку plus из ветки master
Цитата:
Оказалось, что старая версия антивируса Symantec (насчет новых не знаю,
никто не проверял) также вызывает эту проблему. Выяснилось это вот тут:
http://www.diybookscanner.org/forum/viewtopic.php?f=21&t=2394
Так что если у кого проблема не пропала после апдейта с версии без
imageformats/qjpeg4.dll, советуйте обновить антивирус, а если не
поможет, то и перейти на другой.
Он выпустил версию ST 0.9.11. Можно скачать с официального сайта.
На днях залью из нее код в ST+ и соберу под Win32.
Добавлено:
Влил изменения кода в ветку plus из ветки master
Господа маководы, если не трудно, выложите, пожалуйста, где-нибудь сборку st+
Выложил на sourceforge сборку ScanTailor Plus 0.9.11[32bit], в которую вошел код релиза официального ST 0.9.11
Ссылка дана в шапке, но на всякий случай:https://sourceforge.net/projects/scantailor/files/scantailor-devel/plus/0.9.112012-02-22/
Ссылка дана в шапке, но на всякий случай:https://sourceforge.net/projects/scantailor/files/scantailor-devel/plus/0.9.112012-02-22/
DikBSD
Если не трудно, расскажите какие ключевые отличия от оригинального ST. Уже столько сборок появилось, что и запутался.
Если не трудно, расскажите какие ключевые отличия от оригинального ST. Уже столько сборок появилось, что и запутался.
Теперь jpg отображаются в ST - добавил папку imageformats с dll-ми...
Скачать можно там же
https://sourceforge.net/projects/scantailor/files/scantailor-devel/plus/0.9.11-2012-01-22/
Добавлено:
Цитата:
Главное - Настройки для режима Вывода (для ч/б сканов в LZW или FAX4, Уровень пятен и т.д.). Автосохранение. Еще что-то - не помню уже. Кое-что ушло в официальную версию по мелочам...
В последнем релизе код Петра Ковача для Смешанного режима - обводка по прямоугольнику автоопределения зоны.
В основном в README можно посмотреть:https://sourceforge.net/projects/scantailor/files/scantailor-devel/plus/0.9.11pre-2011-11-30/
Скачать можно там же
https://sourceforge.net/projects/scantailor/files/scantailor-devel/plus/0.9.11-2012-01-22/
Добавлено:
Цитата:
Если не трудно, расскажите какие ключевые отличия от оригинального ST. Уже столько сборок появилось, что и запутался.
Главное - Настройки для режима Вывода (для ч/б сканов в LZW или FAX4, Уровень пятен и т.д.). Автосохранение. Еще что-то - не помню уже. Кое-что ушло в официальную версию по мелочам...
В последнем релизе код Петра Ковача для Смешанного режима - обводка по прямоугольнику автоопределения зоны.
В основном в README можно посмотреть:https://sourceforge.net/projects/scantailor/files/scantailor-devel/plus/0.9.11pre-2011-11-30/
запоминание настроек размера полей сделайте, плиз, если не очень трудно.
Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061
Предыдущая тема: CmCkA v4
Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.