Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor

Автор: Tulon
Дата сообщения: 12.01.2009 12:12

Цитата:
Поправь, если ошибаюсь. Вроде все сжатые методы tiff в PhotoShop-е открываются криво. А постОчистка необходима. поэтому я все это время был сторонником несжатого tiff

Впервые такое слышу, хотя фотошоп не юзаю, поэтому не знаю. Кто-то еще может это подтвердить или опровергнуть?


Цитата:
Есть шансы отговорить тебя в сторону Q-W? По-моему, эргономически, с учетом долгой работы в программе, это более оптимальный выбор (ладонь на клаву опирается). Или ты его игнорируешь только из-за подобия с SK?

Я вообще не знал, что в кромсаторе эта комбинация используется. А кроме СК эта комбинация где-нибудь используется? W-S хотя бы геймерам будет понятна. А эргономически - да, Q-W конечно лучше.
Автор: Olive77
Дата сообщения: 12.01.2009 12:50
Tulon
категорично заявлять не буду, но я у себя такой проблемы не замечал.
Сжатые тиффы создавались в IrfanView.
Обрабатывал их в PS CS2.

denver 22

Цитата:
После обработки в режиме "Смешанный" (как и после использования "Picture zone" с SK), какой режим для кодирования выбрать в DjVu Small? Я определил опытным путем наиболее подходящие: Scanned и Drawn.

я некоторое время тоже пользовался DjVu Small, но потом как-то надо было перегнать в djvu кнужку со многими картинками и я от нее отказался в пользу DEE.

Размер книгу созданный с помощью DjVu Small был 9 МБ, а DEE сжал до 5 МБ, при этом с заметно лучшим качеством картинок.

P.S.: ghosty выкладывал профиль для DDE в топике по сканирoванию.
Автор: denver 22
Дата сообщения: 12.01.2009 20:15
Olive77
Про tiff ты меня заинтриговал. Как же так? Столько лет мучаюсь после декодирования ДеЖаВюшек прогами DjVu Small и DjvuOCR. Поэтому и шум тут поднял. Мне приходилось из сжатого в несжатое переводить, чтобы в PhotoShop-е их чистить.
Вот бы monday2000 здесь появился. Мне кажется он поддержал бы меня. А скорее всего разъяснил бы ситуацию.

Блин, немного оффтоп, хотя он как следствие использования ST, так что сойдет:
Tulon, ты чем тогда чистишь сканы на постобработке? Если Gimp-ом, то он с tiff плохо дружит. Хотя вроде можно приноровиться.

Olive77
DEE - это Document Express Enterprise? Я от него уходил из-за огромного размера при инсталляции.
В последнее время кодирую в DjVu Small и Document Express Editor. И смотрю где лучше. Тот и оставляю.
Для Document Express Enterprise я в свое время (года 3 назад) делал профили, когда учился у monday2000 книгопроизводству.
Топик по сканированию - ссылочку дашь?
Автор: vitaly1
Дата сообщения: 12.01.2009 21:15
denver 22

Цитата:
DEE - это Document Express Enterprise? Я от него уходил из-за огромного размера при инсталляции.

Есть урезанная версия, весом 17 Мб (выброшено все лишнее, функционал не пострадал).

Цитата:
Топик по сканированию - ссылочку дашь?

Электронные книги: сканирование, обработка, сборка - III
Автор: denver 22
Дата сообщения: 12.01.2009 21:38
Tulon
Глянь личку. На п.9 компиляции - облом.

Добавлено:
Tulon
Ситуация: хочу перенести все программы для компиляции на другой комп. Копирую папки:
c:\build\
c:\MinGW\
c:\Qt\
на другой комп. Устанавливаю CMake. А вот дальше... Скорее всего начинать с п.6?
Автор: Tulon
Дата сообщения: 13.01.2009 01:07

Цитата:
Tulon, ты чем тогда чистишь сканы на постобработке? Если Gimp-ом, то он с tiff плохо дружит. Хотя вроде можно приноровиться.

Реально я всего две книги сделал. Там был хороший исходный материал, и чистить сверх того, что делает СТ не пришлось. А кстати, что именно вы собираетесь делать со сканами в Gimp'е? Мои TIFF'ы Gimp берет без проблем. Вообще TIFF - это контейнерный формат с огромным количеством методов сжатия и всяких других опций. Думаю можно для каждой программы найти такой TIFF файл, который она не возьмет. Это теоретически. На практике в области книгосканирования с такими экзотическими TIFFами вы не встрететись.


Цитата:
Глянь личку. На п.9 компиляции - облом.

Выходит что при смене директории исходников без смены директории сборки одним Delete Cache не отделаешся. Придется вручную очищать директорию сборки.


Цитата:
Ситуация: хочу перенести все программы для компиляции на другой комп. Копирую папки:
c:\build\
c:\MinGW\
c:\Qt\
на другой комп. Устанавливаю CMake. А вот дальше... Скорее всего начинать с п.6?

Видимо так.
Автор: denver 22
Дата сообщения: 13.01.2009 05:15
Директория сборки - это c:\build\scantailor-build\? Если да, то в прошлый раз её-то я и очищал

Вот про TIFF я этого не знал. Значит работа со сжатым TIFF не подразумевает ещё бОльших потерь на выходе? Это хорошо. Буду пробовать.

Добавлено:
Olive77
По-быстрому не удалось найти профиль для DEE от ghosty. Можешь слить на файлообменник и дать ссылку? (лучше на iFolder или Narod)
Автор: Arcand
Дата сообщения: 13.01.2009 06:15
denver 22

Цитата:
Значит работа со сжатым TIFF не подразумевает ещё бОльших потерь на выходе? Это хорошо. Буду пробовать.
tif LZW вообще без потерь. Лучший вариант для хранения серых и цветных сканов. Для bw - G4Fax. Если возникают проблемы чтения tif LZW с прогами, их нужно перекодировать. Например в Ирфане - он все тифы открывает, а его тифы все проги понимают. Для перекодирования создать и запустить батник
Код: @echo off

REM Перекодирование в tif LZW в IrfanView
REM    
REM Обычное расположение IrfanView
REM C:\Program Files\IrfanView\i_view32.exe
REM Если у вас Ирфан расположен по другому адресу, то
REM следует указать этот адрес в команде ниже.

@echo on

@for %%a in (*.tif) do "C:\Program Files\IrfanView\i_view32.exe" %%a /tifc=1 /convert=%%a

@echo.
@echo.

@pause
Автор: monday2000
Дата сообщения: 13.01.2009 09:02
denver 22

Цитата:
какой режим для кодирования выбрать в DjVu Small?

Я не знаю. DjVu Small ничем не отличается от DEE - за исключением отсутствия редактора профилей. И DjVu Small, и DEE - это просто надстройка-GUI над documenttodjvu.
С опциями кодирования documenttodjvu ИМХО ещё нужно экспериментировать долго и нудно. Причём сначала надо наклепать побольше алгоритмов сканобработки - а уже обработанные ими сканы использовать для экспериментов.

Обратитесь ещё сюда: http://natahaus.info/forums/showthread.php?t=5520

Добавлено:
Tulon

Цитата:
А эргономически - да, Q-W конечно лучше.

В СканКромсаторе помимо Q-W есть ещё [-] - которые делают то же самое - листают страницы.
Автор: denver 22
Дата сообщения: 13.01.2009 18:28
Новая сборка Scan Tailor 0.9.1 - 20090112 - http://narod.ru/disk/4948479000/scantailor-20090112.7z.html + Зеркало.
Вывод в заданном dpi исправлен.
Но сразу появился новый баг: выводит tiff в красно-белом. Причем в Смешанном режиме - с оттенками, т.е. как надо .
Так что снова жду исправлений. Книгу по-прежнему не могу доделать .

P.S.: выкладываю сборку с этим багом только, ориентируясь на других бета-тестеров. Авось и ещё что всплывёт.
Кстати, долго мучался с переносом программ для компиляции программы на другой комп. Но, набив шишки, теперь вроде почти во всем разобрался. Так что и на работе смогу новые сборки собирать

Добавлено:
А теперь по всему остальному:
1. Начал впервые обработывать серые сканы с проге. Стадия "Полезная область" действительно ещё требует доработок. Довольно часто область больше области текста. Причем визуально почти на одинаковых по ситуации сканах получаются идеальный и негодный результаты. Может только на этой книге, но в 100%-х случаев ошибка выявлялась на левой стороне разворота.
Достаточно редко точно на таких же сканах обратная ситуация: срезался текст всё в том же месте (ближе к сгибу).
В обоих случаях при этой ошибке большая область добавлялась также сверху и снизу.
Примеры скидывать не буду. На момент обработки я их не отбирал.

2. Пока выяснял в чем у меня проблемы со сжатыми tiff, мне тут уже полезную инфу скинули . Arcand, спасибо большое. И всё же отрапортую.
Проблема в Photoshop появляется только при сжатии в CCITT Group4 (G4Fax). При открытии пишет такое сообщение:
"Коррекция попиксельной пропорции включена только для просмотра. Чтобы добиться максимального качества изображения, отключите её".
Кто-нибудь подскажет как её отключить? Не нашел. С CCITT RLE и LZW - проблема не наблюдается. Но программы DjvuOCR, DjVu Small и SK (в последней это сжатие выводится даже если выбрать другое в настройках) декодируют именно в CCITT Group4. А теперь и Scan Tailor дает его на выходе.
Отсюда вопрос: перекодирование tiff из G4Fax в несжатый или другие типы сжатия ведет к потере качества?
Автор: rrr777
Дата сообщения: 13.01.2009 18:54

Цитата:
Новая сборка Scan Tailor 0.9.1 - 20090112

Переложите плиз на др. обменник
Автор: denver 22
Дата сообщения: 13.01.2009 19:12
Tulon

Цитата:
Да, действительно неудобно. Наверное сделаю W и S и за одно статус бар с подсказками сделаю - а то кто же догадается что страницы можно и так перелистывать.


Цитата:
А эргономически - да, Q-W конечно лучше.

Ну раз ты согласился с эргономичностью Q-W, то теперь буду более упорно настаивать на применении этой комбинации, т.к., повторюсь, при долгой работе со сканами важнее эргономика, чем привычки гамеров.
А по поводу "кто догадается", это не проблема. Узнают, уверяю тебя . И с этого форума, и из будущей справки .

P.S. Вот и я ощутил какое качество получается на выходе из серых сканов .

Добавлено:
rrr777
Другие обменники у меня глючат. Может кто другой поможет человеку?
Хотя нет, получилось. Смотри пост со ссылкой.
Автор: rrr777
Дата сообщения: 13.01.2009 20:11
denver 22
спс.
Автор: denver 22
Дата сообщения: 13.01.2009 21:00
Во, забыл сказать.
Tulon, я очень надеюсь, что ты всё таки вернешь очистку (Despeckle) в программу. Конечно в более лучшем виде, раз даже тебе не нравился.
А то я сейчас переделываю кучу книг. Большинство из них в ч/б. И требуют очистки. А без Despeckle чистить все эти точки в Photoshop-е... лучше сразу застрелиться.
Поэтому не могу полномасштабно тестировать твою программу. Приходится пользоваться SK. Благо он все таки продолжил развиваться и новые версии очень радуют... но только потому, что я уже знаком в ним.
А пользоваться хочу твоей программой . Так что желаю удачи и дальнейших успехов!

Добавлено:
Кстати, по ссылке в шапке есть Gimp Despeckle Plug-In (плагин для Gimp, с исходниками)... Может подойдет? Если прикрутить.
Автор: Tulon
Дата сообщения: 13.01.2009 22:45

Цитата:
Но сразу появился новый баг: выводит tiff в красно-белом.

Не получается воспроизвести - выложите пример.


Цитата:
1. Начал впервые обработывать серые сканы с проге. Стадия "Полезная область" действительно ещё требует доработок. Довольно часто область больше области текста.

В последнее время как раз над этим и работаю. Уже много всяких идей перепробовал - результаты так себе, но прогресс есть.


Цитата:
Проблема в Photoshop появляется только при сжатии в CCITT Group4 (G4Fax)

Хм, для меня не проблема переключиться на LZW и для черно-белых картинок тоже. Если общественность попросит, так и сделаю. Но вообще, попиксельная пропорция, на которую ворчит фотошоп, не должна по идее зависеть от метода сжатия. Кстати, а у вас горизонтальные и вертикальные DPI на выводе одинаковые? Это бы как раз объяснило такое сообщение от фотошопа. Вообще я собираюсь убрать возможность вывода с несимметричными DPI. На входе пускай будут, а на выводе от них только проблемы.


Цитата:
Отсюда вопрос: перекодирование tiff из G4Fax в несжатый или другие типы сжатия ведет к потере качества?

Нет, если конечно целевой метод сжатия тоже без потерь (а это все кроме jpeg сжатия).

Добавлено:

Цитата:
Ну раз ты согласился с эргономичностью Q-W, то теперь буду более упорно настаивать на применении этой комбинации, т.к., повторюсь, при долгой работе со сканами важнее эргономика, чем привычки гамеров.

Ну ладно, пускай будет Q-W, мне не принципиально. А чтобы юзеры это нашли, придется все-таки делать статусбар с подсказками.


Цитата:
Переложите плиз на др. обменник

Следующий билд (как пофиксим баг с цветами в TIFFах) отзеркалирую куда-нибудь. Куда вам удобнее?


Цитата:
Tulon, я очень надеюсь, что ты всё таки вернешь очистку (Despeckle) в программу. Конечно в более лучшем виде, раз даже тебе не нравился.

Верну конечно, наверное даже в следующем оффициальном релизе. Просто не хотелось задерживать предыдущий релиз из-за кривого Despeckle.


Цитата:
Кстати, по ссылке в шапке есть Gimp Despeckle Plug-In (плагин для Gimp, с исходниками)... Может подойдет? Если прикрутить.

Посмотрю.
Автор: Olive77
Дата сообщения: 13.01.2009 23:01
denver 22

Цитата:
По-быстрому не удалось найти профиль для DEE от ghosty. Можешь слить на файлообменник и дать ссылку? (лучше на iFolder или Narod)

сорри, напутал.
было в топике по СК.
http://forum.ru-board.com/topic.cgi?forum=5&bm=1&topic=24351&start=1260#15

Добавлено:

Цитата:
Проблема в Photoshop появляется только при сжатии в CCITT Group4 (G4Fax)

понятно, а я всегда в LZW жал.
Автор: denver 22
Дата сообщения: 14.01.2009 00:23

Цитата:
Не получается воспроизвести - выложите пример.

Вот те раз... Ну хорошо. Только сканы на работе. там Инета нет. Значит принесу только завтра вечером домой.

Цитата:
Хм, для меня не проблема переключиться на LZW и для черно-белых картинок тоже. Если общественность попросит, так и сделаю.

Я за 2 дня уже во многих местах читал рекомендации делать именно так, как реализовано у тебя. Так что я пролсить не буду, ибо сам начал только сейчас изучать эти форматы. Посмотрим что общественность скажет.

Цитата:
Нет, если конечно целевой метод сжатия тоже без потерь (а это все кроме jpeg сжатия).

Хорошая новость для меня на данным момент (учитывая имеющийся у меня инструментарий и знания). Значит попробую конвертнуть файлы батником от Arcand.

Цитата:
Кстати, а у вас горизонтальные и вертикальные DPI на выводе одинаковые?

Проверю. А это разве не должно зависеть от программы-декодировщика? Точнее от алгоритма. Ведь все перечисленные мной программы вроде являются только ГУЯ-ми к одному алгоритму.

Цитата:
Ну ладно, пускай будет Q-W

Тихо и без истерик - УРА!!!!

Цитата:
Переложите плиз на др. обменник

Это он мне. Я уже отзеркалировал в том же сообщении.
Olive77
Спасибо.
Автор: monday2000
Дата сообщения: 14.01.2009 08:11
Despeckle есть у меня:

http://www.djvu-soft.narod.ru/bookscanlib/010.htm

И ещё тут я видел:

http://gamera.sourceforge.net/doc/html/morphology.html#despeckle

Добавлено:
http://sourceforge.net/projects/dustcleaner/

http://www.easysw.com/~mike/gimp/despeckle.html

Да и в исходниках GIMP есть файл despeckle.c.
Автор: nursus
Дата сообщения: 14.01.2009 12:10
У меня тоже проблема с открытием в Photoshop'е G4Fax: Pixel Aspect Ratio - 0,5 (в других редакторах все нормально).
Отключить-то легко:
Image -> Pixel Aspect Ratio -> Square (или 1 в Custom)
Как избавиться от таких манипуляций?
Автор: denver 22
Дата сообщения: 14.01.2009 21:21
Tulon
В личку скинул исходники и результаты с багом вывода в красном цвете. Ещё раз пробелал - получил то же самое. Будет интересно услышать комментарии. Хотя одна догадка уже есть.
Но на данный момент очень хочется узнать, смогу ли довести работу в Scan Tailor, т.к. немало сил потратил, чтобы Полезную область вручную расставить
Автор: Tulon
Дата сообщения: 15.01.2009 00:15
Ну на этот раз надеюсь все проблемы с записью TIFF'ов поправил (сжатие CCITT Group4 пока не менял). Можете собирать новую версию.
Автор: denver 22
Дата сообщения: 15.01.2009 00:54
Так это был баг? Мне просто интересно.

Добавлено:
Исходники качаю. Сборка будет наверное к вечеру
Автор: Tulon
Дата сообщения: 15.01.2009 01:26

Цитата:
Так это был баг? Мне просто интересно.

Два отдельных бага. В случае с черно-белыми картинками, оказывается LibTIFF по дефолту считает, что точкам слева направа соответствуют биты от старшего к младшему. Я сначала считал, что это зависит от порядка байтов в системе (little endian vs big endian). Потом решил, что дефолт соответствует константе HOST_FILLORDER, но и тут ошибся.
Второй баг связан с порядком цветовых компонентов в (A)RGB картинках. Я опять же думал, что это зависит от порядка байтов в системе. Оказывается не зависит (хотя например палитра - зависит). LibTIFF хочет порядок RR GG BB (AA) - нестандартный, ну да ладно.

А почему эти баги были мне не заметны, так это потому, что мой iBook G4 - Big Endian система, в отличии от всех Intel-совместимых систем. Был бы у меня обычный комп - скорее всего подобные баги все равно были бы допущены, только наоборот - все работало бы на Little Endian но не на Big Endian. В общем LibTIFF - редкостная гадость, а за концепцию "родного" порядка битов - отдельный незачет.
Автор: denver 22
Дата сообщения: 15.01.2009 05:10
Новая сборка Scan Tailor 0.9.1 от 20090115 - http://narod.ru/disk/4981740000/scantailor20090115.7z.html
Зеркало сделать не смог. Сайт iFolder ошибку выдавал. Может кто другой в этот раз отзеркалирует.

Добавлено:
Tulon
Сегодня буду проверять на своем проекте. Надеюсь закончить его наконец .
Можешь сказать, те сканы, что я тебе скинул - это серые или опять "псевдо"?
Автор: Tulon
Дата сообщения: 15.01.2009 10:31

Цитата:
Можешь сказать, те сканы, что я тебе скинул - это серые или опять "псевдо"?

Эти конечно лучше тех, что были раньше, но все равно не оригинал. По ним прошелся DJVU, и если внимательно присмотреться к буквам на картинках, то кое где видно, что DJVU не распознал их как буквы, и соответственно размазал. А после СТ и последующей сборки в DJVU он их размажет еще сильнее.
Автор: Mikhaluch
Дата сообщения: 15.01.2009 16:37
А программа выводит только в формате png , то боролись за tiff , а теперь что-то поменялось? или есть в настройках где-то.

А вообще есть описание програмы, вроде quick start или faq?
Автор: denver 22
Дата сообщения: 15.01.2009 19:32

Цитата:
По ним прошелся DJVU, и если внимательно присмотреться к буквам на картинках, то кое где видно, что DJVU не распознал их как буквы, и соответственно размазал. А после СТ и последующей сборки в DJVU он их размажет еще сильнее.

Да, проблема "инь" здесь во всей красе. Ну а по качеству - у меня выбора нет. Результат может и будет похуже оригинала по четкости, но на 2 головы удобнее для чтения (я уж постараюсь).

Новая сборка программы удалась. Tulon, спасибо за быстрое реагирование на найденные баги. При таком режиме приятно программу тестировать
Кстати, в Смешанном режиме вывода - ну очень долго всё обрабатывалось даже на "хорошей" рабочей машине. Что было бы на моей домашней "тележке", страшно подумать.
Автор: Tulon
Дата сообщения: 15.01.2009 23:05

Цитата:
А программа выводит только в формате png , то боролись за tiff , а теперь что-то поменялось? или есть в настройках где-то.

Последний оффициальный релил выводит только в PNG. Текущие беты (ссылки есть в этом топике) - только в TIFF. Последующие оффициальные релизы тоже будут только в TIFF выводить.


Цитата:
А вообще есть описание програмы, вроде quick start или faq?

Как такового нет, но в этом топике я пару раз давал примерную схему действий.


Цитата:
Кстати, в Смешанном режиме вывода - ну очень долго всё обрабатывалось даже на "хорошей" рабочей машине. Что было бы на моей домашней "тележке", страшно подумать.

Там все в быстродействие памяти упирается, насколько я понимаю. Так что может не так уж и медленнее будет.
Автор: denver 22
Дата сообщения: 16.01.2009 05:40
Tulon
Режим "Смешанный" вроде работает как надо.
Вот почитал статьи о sep-файлах и альтернативном способе изготовления книги с полутоновыми картинками. Отсюда вопрос: будет ли в будущем реализован способ сохранения отдельно картинок и битональных сканов на выходе с этими sep-файлами? Чтобы потом можно было их отдельно собирать, например программой DjVu Sep.
Автор: Tulon
Дата сообщения: 16.01.2009 11:16

Цитата:
Вот почитал статьи о sep-файлах и альтернативном способе изготовления книги с полутоновыми картинками. Отсюда вопрос: будет ли в будущем реализован способ сохранения отдельно картинок и битональных сканов на выходе с этими sep-файлами?

Пока такое не планируется. Этой фичей будут пользоваться только единицы, и к тому же я не уверен, а стоит ли ей вообще пользоваться. Бинаризованные области DJVU вряд-ли перепутает c картинками, а вот на картинках он может найти буквы, и соответственно не станет их размазывать. А с sep файлами он ничего искать не будет и размажет все, что СТ посчитал за картинку.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172

Предыдущая тема: Невозможно установить Acronis True Image Home v10.0.4940


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.