Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor

Автор: ndch
Дата сообщения: 25.02.2009 18:21
denver 22
МОЖНО поинтересоватся дальнейшей судьбой таких сканов ?
Этот скан изначально биколор был ?
Автор: denver 22
Дата сообщения: 25.02.2009 20:57
ndch
Да, к сожалению приходится переделывать чужие уродливые книги. Так что в большинстве случаев - битональные. Именно поэтому мне так важна функция despeckling. Понятное дело, что в ST с серыми сканами дела идут отлично. И чистка нужна только грубая - в фотошопе и ему подобных, без despeckling.
А дальнейшая судьба - книги оседают в моей библиотеке и на моем сайте для бесплатного скачивания.
Автор: ndch
Дата сообщения: 28.02.2009 08:13
Вот еще чего захотелось!

Инвертирование цветов (как вариант - в контекстном меню: запуск определённой программы)

ИМХО - не очень сложно, но иногда было бы очень кстати !
Автор: Tulon
Дата сообщения: 28.02.2009 14:49

Цитата:
Инвертирование цветов (как вариант - в контекстном меню: запуск определённой программы)

В концепцию работы ST это никак не вписывается. Такие вещи нужно отдельными программами делать. А по хорошему, такой необходимости вообще не должно возникать.
Автор: ndch
Дата сообщения: 28.02.2009 17:33
Еще очень хочется максимального выделения, с минимальным урезанием (но без белых полей),с учетом поворота.

Опять же - для однодневных журналов.

Для чего это нужно?
Не могу читать (может и только меня касается-но голова сильно кружится от чтения перекошенных страниц). Ну не 'реальный сибирский мужик' я!
Автор: denver 22
Дата сообщения: 02.03.2009 05:19
U235, что-то сборки перестали обновляться. Вы можете проверить ситуацию?
Автор: denver 22
Дата сообщения: 02.03.2009 10:08
Tulon
Горизонтально расположенные точки (например в содержаниях и некоторых таблицах) все равно нещадно удаляются. Остаются только по 1-2 с обоих концов.
Автор: Tulon
Дата сообщения: 02.03.2009 22:40
denver 22
Дайте на всякий случай пример. Может там все-таки баг а не фича. Скажем если расстояние от крайних точек до других объектов не меньше, чем до соседних точек, то тогда это возможно баг, а если нет - фича. В таких случаях советую совсем отключать despeckle. Почему пока не ввожу регулировку уровня очистки - уже писал.

Добавлено:

Цитата:
что-то сборки перестали обновляться. Вы можете проверить ситуацию?

Последняя сборка - сегодняшний день. А до этого действительно был перерыв. Просто на работу вышел - времени мало стало.
Автор: denver 22
Дата сообщения: 03.03.2009 08:48
Вот примеры сканов (точнее декодированный материал), где вычищается львиная доля точек.
Автор: ndch
Дата сообщения: 03.03.2009 17:06
Трудно представить как ЭТО можно облагородить даже вручную, без распознавания символов.
Распознавание символов, из исходного рисунка, высотой 9 пикселей тоже сложно представить. УЖОС!!!

Добавлено:
Ещё очень хочется удаление растра оффсетной печати на автомате (при неухудшении черного текста)
Интересно услышать мнение автора, модет ли это являться частью программы или нет.
Я к тому что бинаризация - по сути тоже граф. обработка.
Автор: denver 22
Дата сообщения: 04.03.2009 09:05
Tulon
Просто интересно, работа над появлением зон началась? В ближайшей перспективе стоит ждать? А то книг накопилось, где только с такими зонами есть смысл работать. Вот и интересны перспективы...
Автор: Tulon
Дата сообщения: 04.03.2009 23:52
ndch

Цитата:
Ещё очень хочется удаление растра оффсетной печати на автомате (при неухудшении черного текста)

А зачем его удалять? Это ведь полезный контент.

denver 22

Цитата:
Просто интересно, работа над появлением зон началась? В ближайшей перспективе стоит ждать? А то книг накопилось, где только с такими зонами есть смысл работать. Вот и интересны перспективы...

Не начинал еще. По рабочим дням времени совсем мало - только до работы больше часа в один конец добираюсь. А на работе все то же самое - C++, Qt, графика, многопоточность. Это как геймера посадить играть в любимые игры на весь рабочий день - врядли он еще и дома будет в них играть.
Пока занимаюсь всякими мелочами - сделал ассоциацию с файлами .ScanTailor, добавил иконку в исполнительный файл, запоминаю размер главного окна при выходе.
Жалко, что так никто из прграммистов не присоединилcя к проекту. Оно конечно понятно - хороших программистов вообще мало. Из них тех, кто готов работать за бесплатно и у кого есть на это время - еще меньше, а из них интересуются книгосканированием - единицы. И мало кто из них знает про ST - например англоязычных связыавалось со мной всего три человека.
Автор: ndch
Дата сообщения: 05.03.2009 06:08
Ещё очень хочется удаление растра оффсетной печати на автомате (при неухудшении черного текста)
В смысле descreening!!!
Автор: denver 22
Дата сообщения: 05.03.2009 08:25

Цитата:
сделал ассоциацию с файлами .ScanTailor, добавил иконку в исполнительный файл

Ассоциацию я уже оценил. Наконец-то! . Никаких иконок не разглядел. Может что-то не так понял.

Цитата:
Жалко, что так никто из программистов не присоединилcя к проекту.

Может со временем и присоединятся. Сейчас проект в значительной степени готовый к применению. Авось и заинтересуются его расширением...
Автор: Arcand
Дата сообщения: 05.03.2009 11:22
Tulon
Цитата:
Цитата:Ещё очень хочется удаление растра оффсетной печати на автомате (при неухудшении черного текста)

А зачем его удалять? Это ведь полезный контент.
Кажется я понял о чем речь. Во как замутили, что сразу и не поймешь о чем речь .
Как я понял, имеется ввиду удаление растра (в смысле размытия) на картинках. Я обычно удаляю растр медианой.
Автор: denver 22
Дата сообщения: 05.03.2009 14:06
Tulon
Можете реализовать Drag-and-drop для внесения файлов в окно "Файлы в проекте" на этапе формирования Нового проекта?

Добавлено:
Tulon
Вот ТАКОЕ получилось у меня в режиме Смешанный.
Автор: ndch
Дата сообщения: 05.03.2009 18:18
Arcand, извиняюсь за трудную формулировку, есть у меня с этим сложности.

Хочется удаления полиграфического растра из сканированных печатных изображений!
http://www.sattva.ru/soft/descreen/descreen.htm

Хотя об этом уже писали.
Автор: Tulon
Дата сообщения: 05.03.2009 23:55

Цитата:
Ассоциацию я уже оценил. Наконец-то! . Никаких иконок не разглядел. Может что-то не так понял.

Я вслепую делал, винды до сих пор нету. Может кто из программеров разберется, в чем там дело.


Цитата:
Как я понял, имеется ввиду удаление растра (в смысле размытия) на картинках. Я обычно удаляю растр медианой.

А надо ли его вообще удалять? В просмоторщиках есть антиалиазинг, который маскирует растр, да и кодирование в DJVU должно по идее уменьшать этот самый растр.


Цитата:
Вот ТАКОЕ получилось у меня в режиме Смешанный.

Пока нет ручного выделения картинок, такие случаи надо выводить в режиме Серый / Цветной. Кстати светло-голубой фон картинки стал черным, потому что ничего темнее за пределами определившейся зоны картинки - не было. А почему фон картинки не определился как ее часть - потому что это сложный случай. Не надо ждать чудес от алгоритмов компьютерного зрения, к тому же реализованных не экспертами в этой области.

Добавлено:

Цитата:
Можете реализовать Drag-and-drop для внесения файлов в окно "Файлы в проекте" на этапе формирования Нового проекта?

С точки зрения реализации это должно быть несложно. Такие задачи хорошо подходят для желающих присоединиться к проекту - это намек. От меня в ближайшее время этого ждать не стоит.
Автор: denver 22
Дата сообщения: 06.03.2009 05:17

Цитата:
вслепую делал, винды до сих пор нету. Может кто из программеров разберется, в чем там дело.

Если речь идет о какой-то "оригинальной" иконке, то её точно нет. А иконкой сейчас служит прямоугольник с белой заливкой. Он вроде и раньше был... только у программы. А теперь и у файлов проектов.
Иконка программы, конечно, вещь приятная, но ИМХО не горит.
Автор: U235
Дата сообщения: 06.03.2009 11:57
denver 22

Цитата:
Вот ТАКОЕ получилось у меня в режиме Смешанный.

Это произошло, из-за того, что ST в большей степени рассчитан на исходные сканы, а не на пережатые djvu.
Если бы использовались исходные сканы, то думаю , такое не случилось бы из-за наличия растра на фоне.
Автор: denver 22
Дата сообщения: 06.03.2009 13:42
U235
Об исходных сканах не спорю. Надеюсь фраза "ST в большей степени рассчитан" работает дополнительно с "пока".
Потому как облагораживание существующих djvu-книг - явление не редкое. Мне даже не по профессии попадаются часто книги, которые и отсканированы как попало, и так же закодированы. И что мне? Мириться с этим?
Собственно, приоритетные планы развития ST во многом дадут в этом плане дополнительную гибкость.
Автор: dma200899
Дата сообщения: 06.03.2009 22:01
В последней сборке
когда иду на самую высокую/широкую страницу лента на нее не переходит,
вне зависмости от того в каком положении кнопка сверху ленты.
Автор: Tulon
Дата сообщения: 06.03.2009 22:12
Изначально я вообще не думал, что ST будут использовать для облагораживания плохо сделанных книг. С ними как раз больше всего проблем. Хотя в данном конкретном случае исходный растр мог и не помочь - слишком светлый там фон у картинки.

Насчет иконки - предполагалась именно особая иконка. Гляну еще раз, и если в глаза проблема не броситься, то придется ждать, пока либо я новый ноут не куплю, либо кто другой найдет проблему.
Автор: ndch
Дата сообщения: 07.03.2009 00:05
Еще вишес! для режима смешаный
В этом режиме по сути формируется 2 изображения
1. 1bit bw
2. gray/color

ООООчень хочется получить два файла:
1. 1bit bw
2. gray/color

Для чего ?
ООООчень хочется попробывать сделать двухслойный pdf
1слой. 1bit bw-jbig2
2слой. gray/color-jpeg2000

Может и ошибаюсь, но искал-читал и сделал вывод что Акробат просто не умеет делить на два таких слоя. Если подсунуть вручную - вероятно получится.

Очень надеюсь...
Автор: Tulon
Дата сообщения: 07.03.2009 16:58
ndch

Цитата:
ООООчень хочется попробывать сделать двухслойный pdf
1слой. 1bit bw-jbig2
2слой. gray/color-jpeg2000

Это можно было бы сделать для экспериментов, но не более того. Даже если эксперименты покажут хорошие результаты, сборку pdf я реализовывать не собираюсь (сложно), а добавлять опцию вывода двух файлов вместо одного - тут нужны веские причины. Вообще для каждой новой опции нужны веские причины, и чем менее очевидно предназначение опции, тем более веские причины нужны для ее введения.

А для экспериментов можете сами внести изменения в код ST (вы же вроде немного программист?):
В файле filters/output/OutputGenerator.cpp находите интересующие вас объекты, и добавляете их сохранение:
image.save("filename.png"); // Это для объектов QImage
или
image.toQImage().save("filename.png"); // Это для объектов BinaryImage

А еще SK по моему умеет выводить по две картинки.
Автор: ndch
Дата сообщения: 07.03.2009 19:11
Если интересно и есть время:
jpeg 2 pdf 11.0 KB
http://surfnet.dl.sourceforge.net/sourceforge/jpgtopdf/j2p.c

http://sourceforge.net/projects/jpgtopdf/
http://sourceforge.net/project/showfiles.php?group_id=221784&package_id=268403

license.txt
---
This program and source code are absolutely free.
Author is not responsible for nothing.
---
Автор: Tulon
Дата сообщения: 09.03.2009 23:54
Если бы все было так просто ... (это по поводу вывода в PDF). Основная сложность - как в уже собранном PDF заменить одну страницу на другую. СТ ведь позволяет в любое время подправить и перегенерировать любую из страниц. В общем вопрос с выводом PDF, DJVU, многостраничных TIFF - закрыт. Не будет этого.
Автор: cuneiform
Дата сообщения: 10.03.2009 02:28
Когда речь о сканах не одной, а сотен и тысяч книг, то только опыт указывает путь. Мой опыт сканирования - чуть больше 100 000 стр. - Немного.

ПДФ и дежавю - вовсе не идеальны для сканирования и издания книг.
ПДФ создавался как формат документов, а не книг. Не задумывались?

ПДФ требует преобразования сканов, а дежавю - формат закрытый и патентованный. ВСЕ БИБЛИОТЕКИ МИРА ОТ НЕГО ОТКАЗАЛИСь. И вовсе не из-за качества или технических проблем, а из-за недоступности прав на этот формат. - Нет в библиотеках файлов этого формата. - Хотя дигитализация идет на миллионы томов в Европе и США.

А наши энтузиасты используют давно устаревший стандарт дежавю. Не уверен, что даже устаревший, он - Public Domain. То, что его (устаревший стандарт) юзают разработчики Линукса - смешной аргумент, если зайти на сайт Lizard.

Кроме того, разделение слоев и негативно: Ваше лого можно удалить и присвоить ваши труды. Вы с в о и собственные труды издавали? - А то бы задумались!

ИМХО, я для себя остановился на формате tiff compressed group4 (факсовый). - Кста, это к тому же - внутренний формат FineReader'a.

При просмотре во вьюере (ч./б.) цвет легко восстанавливается через 8-12-бит серое (XnView), стабильное лого, малый размер файлов - почти как дежавю. Легкая пакетная обработка. Public domain.

Мнение свое не навязываю. - Во время массового психоза разум слабо работает, факт.
========================
Some of the first cuneiform tablets were financial reports.
Автор: denver 22
Дата сообщения: 10.03.2009 11:15
cuneiform
Вам бы этот пост на соответствующий топик продублировать. Там и обсуждение будет активное.

Касательно ST, поддерживаю вывод только в одностраничные tiff (пока ничего лУчшего не придумают). Существует достаточно софта, в т.ч. открытого или просто бесплатного, чтобы кодировать в любой любимый формат.
Автор: cuneiform
Дата сообщения: 10.03.2009 12:00
denver 22

А я не знаю, где есть такой топик, сорри. ... Но я готов сеять...

После 100 000 сканов я просто не могу слышать ничего про "многостраничные файлы"...

Вот сканируешь словарь/энцицлопедию... Потом идут приложения, карты, рисунки... Все в динамике создается при дигитализации... В ТоталКоммандер есть чудесная возможность разом переименовать потом все 10 000 ф а й л о в автоматом как надо... Упорядочить. И что делать, если только 1 многостраничный фаил?!

Потом, я свои книги читаю комфортно в XnView с восстановлением 12-16 бит из 2 битного изобр. Он не показывает многостраничные файлы... И не надо!

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172

Предыдущая тема: Невозможно установить Acronis True Image Home v10.0.4940


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.