Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor: Часть 2

Автор: Melirius
Дата сообщения: 11.11.2010 13:21
monday2000

За что я Вас люблю - это за умение наводить тень на плетень в самых ясных ситуациях . А за завышенную оценку моих скромных способностей - спасибо, хакером меня ещё пока никто не обзывал .

Вы ж опять придерётесь, что 90Мб FR - это много для того, чтобы качать. Иначе могу сделать.
Автор: monday2000
Дата сообщения: 11.11.2010 16:23
Melirius

Цитата:
Вы ж опять придерётесь, что 90Мб FR - это много для того, чтобы качать. Иначе могу сделать.

А зачем качать сам Файнридер? Сделайте такую программу, и пусть она будет уметь работать с любым 8 Файнридером. Т.е. избавьте юзеров от необходимости вникать в эти дебри - чтобы самому создавать батники, разбираться в них и т.п. Пусть некая программка выполняет работу батников. Она вряд ли будет слишком "тяжёлой".

Заодно такая программа может иметь некий тест пригодности Файнридера на выполнение такой операции.
Автор: Melirius
Дата сообщения: 11.11.2010 20:43
monday2000

"Так Вам шашечки или ехать?"

bat-файл + все необходимые компоненты для работы за вычетом FR

http://ifile.it/6zc8b7e/FR-auto.rar

Одно условие - распаковано оно должно быть на тот же диск, где лежит FR. Использование

FR-auto.bat название_djvu-файла

Создаёт название_djvu-файла.OCR.djvu

P.S. Звиняйте, отладочная версия сначала ушла, теперь правильная.
Автор: VidelSamogO
Дата сообщения: 11.11.2010 21:46
Выложите, пожалуйста ST Separator 1.0. Или лучше все предыдущие, для которых не нужен framework 3.
Автор: anagnost96
Дата сообщения: 12.11.2010 06:09
C0USIN


Цитата:
Не помогает.
Цитата:
JBIG2 compression has been requested, but the encoder is not available.


Это была бага в pdfbeads. Теперь исправлено.
Автор: StanFreeWare
Дата сообщения: 12.11.2010 07:20
VidelSamogO

Цитата:
предыдущие, для которых не нужен framework 3.


А разве последние версии с sourceforge его требуют? Должен максимум второй фреймворк требовать..
Автор: C0USIN
Дата сообщения: 12.11.2010 09:23
anagnost96

Цитата:
Это была бага в pdfbeads. Теперь исправлено.

Спасибо. Теперь кодирует в JBIG2. На удивление компактные файлы получаются. В разы меньше чем при кодировании акробатом.
Это общий словарь так влияет?
Проверить не смог - опция -p не работает.

Но самое неприятное - pdfbeads пропускает некоторые страницы. Не понимаю почему.
Автор: anagnost96
Дата сообщения: 12.11.2010 09:39
C0USIN

Цитата:
Но самое неприятное - pdfbeads пропускает некоторые страницы. Не понимаю почему.


А в именах файлов случайно нет точек? Если не в этом дело, то, может быть, выложите куда-нибудь минимальную подборку файлов, в которой пропускаются страницы?
Автор: C0USIN
Дата сообщения: 12.11.2010 10:08
anagnost96
От имен файлов не зависит. Вот десяток страниц http://rghost.ru/3228121
Игнорирует первую и девятую.

Разные книги попробовал. Везде попадаются страницы, которые он не замечает.

ЗЫ А почему мы тут оффтопим? Есть ведь тема профильная Электронные книги: сканирование, обработка, сборка - IV
Автор: monday2000
Дата сообщения: 12.11.2010 10:09
Melirius

Цитата:
bat-файл + все необходимые компоненты для работы за вычетом FR

http://ifile.it/6zc8b7e/FR-auto.rar

Спасибо, в ближайшее время опробую.
Автор: C0USIN
Дата сообщения: 12.11.2010 11:44
anagnost96
Все, разобрался в причине.
pdfbeads не понимает тифы к которых есть блок метаданных, которые добавил фотошоп.
Теперь бы научиться от них избавляться.
Автор: anagnost96
Дата сообщения: 12.11.2010 11:55
C0USIN

Цитата:
pdfbeads не понимает тифы к которых есть блок метаданных, которые добавил фотошоп.


Да, я уже понял. Это бага, ее легко исправить.


Цитата:
ЗЫ А почему мы тут оффтопим? Есть ведь тема профильная Электронные книги: сканирование, обработка, сборка - IV [?]


Согласен, давайте дальше там обсуждать.

Автор: pobat
Дата сообщения: 12.11.2010 22:39

Цитата:
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)

помойму ссылка через торрент нерабочая, или рабочая, но у меня не удается скачать. есть ли зеркало

так же видел видеоуроки http://vimeo.com/13246060 там речь идет о Scan Tailor 0.9.10pre
не подскажете где можно скачать эту сборку, я так понимаю она имеет похожие возможности =)


Автор: VidelSamogO
Дата сообщения: 12.11.2010 23:07
pobat

Цитата:
Scan Tailor 0.9.10pre


http://forum.ru-board.com/topic.cgi?forum=5&topic=32945&start=628&limit=1&m=1#1

Автор: StanFreeWare
Дата сообщения: 13.11.2010 07:07
VidelSamogO

Цитата:
никуда не годятся

Позвольте поинтересоваться, куда именно они не годятся. Может, проще поправить, ежели чего не нравится. Или пользуйтесь ST Split.
Автор: VidelSamogO
Дата сообщения: 13.11.2010 09:09
-=0=-
Автор: anagnost96
Дата сообщения: 13.11.2010 13:55
Обновил версию pdfbeads. Подробности в ветке Электронные книги: сканирование, обработка, сборка - IV
Автор: pobat
Дата сообщения: 13.11.2010 21:01
VidelSamogO
Спасибо

Еще есть вопрос Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob) и can Tailor 0.9.10pre это одно и тоже?
или там используются разные алгоритмы?
Автор: VidelSamogO
Дата сообщения: 14.11.2010 10:40
-=-
Автор: McAaron
Дата сообщения: 21.11.2010 18:04
При сборке программы не разрешиласьь ссылка на XRenderSetPictureFilter
$ make
[ 1%] Built target compile_translations
[ 4%] Built target toplevel_ui_sources
[ 17%] Built target output
[ 29%] Built target imageproc
[ 31%] Built target foundation
[ 34%] Built target interaction
[ 34%] Built target math
[ 39%] Built target zones
[ 43%] Built target fix_orientation
[ 48%] Built target page_split
[ 51%] Built target deskew
[ 56%] Built target select_content
[ 62%] Built target page_layout
Linking CXX executable scantailor
/usr/bin/ld: CMakeFiles/scantailor.dir/PixmapRenderer.cpp.o: undefined reference to symbol 'XRenderSetPictureFilter'
/usr/bin/ld: note: 'XRenderSetPictureFilter' is defined in DSO /usr/lib64/libXrender.so.1 so try adding it to the linker command line
/usr/lib64/libXrender.so.1: could not read symbols: Invalid operation
collect2: выполнение ld завершилось с кодом возврата 1
make[2]: *** [scantailor] Ошибка 1
make[1]: *** [CMakeFiles/scantailor.dir/all] Ошибка 2
make: *** [all] Ошибка 2
$ find -type f -exec grep -H "-lXrender" {} \;
$
Т.е. реально в сборке нет ссылки на libXrender.so, что странно, поскольку ссылка на . Xrender.h есть. Заглянул в make cmake, ничего не понял, поэтому просто дописал в строку линкера в файле /CMakeFiles/scantailor.dir/link.txt опцию -lXrender и все собралось.
Не мог бы Уважаемый Автор Программы исправить это в подобающем месте?



Автор: DikBSD
Дата сообщения: 27.11.2010 18:15
Хочу предложить свою сборку Скан Тэйлора на основе самого последнего кода из git.
Начал потихоньку вносить в код изменения и дополнения, которые, на мой взгляд полезные.

Изменения в коде Scan Tailor:
I. ОБЩЕЕ:
1. Устранена проблема переноса проекта с одного компьютера на другой (спасибо Tulon`у за подсказку, где что исправить).
Допустим, полностью прогнали вывод проекта на работе. Перенесли весь проекта и исходными сканами домой, чтобы подкорректировать толщину букв и убрать грязь и т.д. на некоторых выведенных сканах На Шаге ВЫВОД. Исправили пути к сканам в файле проекта. Запускаем СТ - и все картинки на ленкте на этапе ВЫВОД помечены знаком ?, как требующие полного вывода. Ждать опять часа 3-4 - утомительно.
Теперь перенос проекта с любой машины и системы на любую машину и систему не требует повторного полного вывода всего проекта.
II. Стадия ВЫВОД:
2. Увеличение порога бинаризации до +-50 (толщина букв)
Много книг требуют порога более, чем +-30, как сделано в официальной версии ST. Мне часто требовалось (-50) для сканов с книг, напечатанных некачественно на очень тонкой бумаге.
3. При изменении порога бинаризации: через ползунок, через нажатие на метки Тоньше или Жирнее, через нажатие на кнопку В Ноль (между метками Тоньше или Жирнее) текущая картинка помечается, как требующая полного вывода (знак ?).
В официальной версии ST это не происходит, хотя вывод скана при изменении уровня бинаризации проходит полный.
Данное изменение полезно в случае, когда поменял порог бинаризации, а потом случайно перешел на другой скан по Ленте или W. Теперь стало видно, что тот скан инадо заново выводить. Удобно.
4. Введена метка-индикатор, отображающая порог бинаризации текущего скана (расположена выше ползунка порога). Все изменения порога отображаются на ней.
Полезно, когда корректируешь порог отдельных сканов - не надо всякий раз смотреть всплывающие подсказку уровня порога на ползунке по наведению мышки. По метке сразу видищь, какой порог сейчас стоит и все изменения.

P.S. Огромная благодарность U235 за предоставленную скомпилированную статично библиотеку Qt 4.5.3 и библиотеки для СТ - более новые версии Qt у меня никак не хотели компилироваться.

Скачать программу: http://www.onlinedisk.ru/file/561058/
Скачать исходных код с изменениями: http://www.onlinedisk.ru/file/561062/

Файлы будут доступны до 2011-01-26
Автор: LonerDergunov
Дата сообщения: 27.11.2010 19:01
DikBSD
Интересно, актуальные нововведения.
Данный вариант будет продолжаться и дальше? Очень хотелось бы видеть выделение рисунков рамочкой (как во всех графических редакторах).
Автор: DikBSD
Дата сообщения: 27.11.2010 19:22
Планирую потихоньку вводить дополнения в код, но по мере умения и способностей - с графикой я на Вы - только сейчас практически стал заниматься ей - до этого писал базы данных да конверторы в fb2., Крутым спецом в программировании себя не считаю. Более того - надо еще изучить архитектуру программы, а Tulon - мастер программирования - код на профессиональном уровне. Так что по мере постижения кода и способностей.
Хочу заняться следующим:
1. Выставление в 0 угла разворота всех сканов
2. Выделение ВСЕГО контента полезной области для всех сканов - т.е. полезная область = всей площади скана - и так для всех сканов.
Это реализовано в утилите ST Skipper 0.3 , но хотелось бы внедрить этот процесс в сам СТ. Это все нужно для разрезки сканов без последующей их обработки...
3. Мечта - ввести в код СТ раздельный вывод - текст - в одну папку, а картинки - в другую, для последующей сборки в djvu через djvu Imsger или FSD. Сейчас это делает прекрасная сборка СТ - STA (правда - версия устарела) и утилита ST Separator 2.7.
4. Отключение выравнивания освещенности в смешанном режиме вывода сканов - портятся многие картинки
Может что еще...
Конечно - лучше Tulona - автора СканТэйлора - врядли (имхо) кто сможет расширить возможности программы.
На всякий случай - ничего обещать не буду - если что смогу - выложу.
P.S. Если бы дополнения к СТ сделал бы anagnost96 - автор сборки STA - это было бы чудно - он - спец в программировании и имеет опыт "общения" с кодом Скан Тэйлора...
Кстати, если бы еще кто-нибудь включился в программирование дополнительных возможностей СТ - было бы замечательно.
Автор: monday2000
Дата сообщения: 29.11.2010 09:34
DikBSD

Цитата:
Планирую потихоньку вводить дополнения в код

Замечательно!

Цитата:
На всякий случай - ничего обещать не буду - если что смогу - выложу.

В случае затруднений обращайтесь к Тулону по е-mail - наверняка подскажет.


Добавлено:
А есть где-нибудь пошаговая инструкция по сборке СТ под виндой? Наличие такой инструкции могло бы помочь привлечению желающих модифицировать СТ.
Автор: denver 22
Дата сообщения: 29.11.2010 12:55
monday2000
Инструкция вроде как всегда лежала в самих исходниках. Но вот насколько она сейчас актуальна - не знаю.
Автор: monday2000
Дата сообщения: 29.11.2010 14:02
DikBSD

Цитата:
Хочу заняться следующим:

Очень хорошие, нужные и правильные изменения.

Добавлено:

Цитата:
Конечно - лучше Tulona - автора СканТэйлора - врядли (имхо) кто сможет расширить возможности программы.

В любом деле - главное начать. Потом всё постепенно наладится.
Автор: woodyfon
Дата сообщения: 29.11.2010 18:51
Я думаю, не надо сейчас кричать что нужно, а что нет. Дайте время человеку - и, возможно, программа будет и дальше развиваться.
Автор: DikBSD
Дата сообщения: 29.11.2010 19:11

Цитата:
Инструкция вроде как всегда лежала в самих исходниках. Но вот насколько она сейчас актуальна - не знаю.

Инструкция актуальна - я по ней собирал. Только в CMakeList закомментировал несколько строк о выдачи фатальной ошибки если нет Nsys инсталятора.
Автор: iit512
Дата сообщения: 30.11.2010 21:18

Цитата:
Планирую потихоньку вводить дополнения в код

Великолепно! Это будет форк или продолжение основной ветки?


Цитата:
1. Выставление в 0 угла разворота всех сканов
2. Выделение ВСЕГО контента полезной области для всех сканов - т.е. полезная область = всей площади скана - и так для всех сканов.


Отлично, давно нужно, причем выставление в 0 нужно и для выбранных страниц тоже (у меня систематическая проблем с поворотом таблиц иллюстраций, чередующихся с обычными страницами).


Цитата:
3. Мечта - ввести в код СТ раздельный вывод - текст - в одну папку, а картинки - в другую, для последующей сборки в djvu через djvu Imsger или FSD. Сейчас это делает прекрасная сборка СТ - STA (правда - версия устарела) и утилита ST Separator 2.7.


img2djvu избавляет от необходимости раздельного вывода. Сам себя не похвалишь Нет, и вправду очень хорошо работает


Цитата:
4. Отключение выравнивания освещенности в смешанном режиме вывода сканов - портятся многие картинки


Очень нужно! Как бы еще подрегулировать выравнивание освещенности там, где например, большая темная область и немного текста? Текст чрезмерно осветляется.


Цитата:
Может что еще...


-- Прежде всего -- угол для группы (см. выше).

-- Автосохранение. Сколько бы не старался Tulon минимизировать вылетания, одного "случайного" невопроизводимого вылетания будет достаточно, чтобы испортить многочасовую работу.

-- Еще такая проблема -- если не заметил, что страница перевернута и полезная область уже определена, то смена ориентации область не меняет. Приходится извращаться по-всякому.

-- Я бы ввел еще возможность делать области с разным порогом бинаризации (то есть в добавление к вкладкам областей заливки и картинок еще одну). Или (может, даже лучше), специальную область заливки со свойствами повышения-понижения порога.

Автор: DikBSD
Дата сообщения: 30.11.2010 21:44

Цитата:
Великолепно! Это будет форк или продолжение основной ветки?

Основная ветка - у Tulona, он автор СТ и ведет ее. В этой версии СТ хочется ввести те фичи, которые Tulon не вводит в основную ветку.

Цитата:
Отлично, давно нужно, причем выставление в 0 нужно и для выбранных страниц тоже (у меня систематическая проблем с поворотом таблиц иллюстраций, чередующихся с обычными страницами).

Именно так и планируется - применение - либо ко всем, либо к выделенным сканам, либо от текущей и ниже - в принципе, как это сделано на других Этапах обработки через кнопку Применить...[

Цитата:
Очень нужно! Как бы еще подрегулировать выравнивание освещенности там, где например, большая темная область и немного текста? Текст чрезмерно осветляется.

В настоящий момент как раз разбираюсь с освещенностью - на мой взгляд это - наиболее важная вещь из списка - качество картинок очень важно.
Насчет подрегулирования освещенности - не знаю - я только начал изучать код программы, Надо будет спросить у Tulona...

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061

Предыдущая тема: CmCkA v4


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.