Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor

Автор: ndch
Дата сообщения: 17.10.2009 09:54

Цитата:
друг индейцев

Угу, я тоже rусский. Тролль ДЕТЕКТЕД.
Автор: monday2000
Дата сообщения: 17.10.2009 11:59

Цитата:
Очередная минута мудрости от нашего архитектора:

Замечательные слова! Лучше просто не скажешь!


Добавлено:
Я решил выложить письмо от китайца Jian Ma , который делает всякие электронно-книжные свои программы. Вот его сайт http://www.comicer.com/stronghorse/software/ :

Цитата:
My name is Jian Ma and I'm from P.R.China.
DjVu is also popular in China now, many people release their self-scanned ebook in DjVu format. But I'm afraid DjVuToy is the only open-released DjVu related software from China.
PDG is a private format for scanned ebooks. Now it is owned by a Chinese company named ChaoXing, which is also the biggest e-content owner in China. On Chinese internet, many popular scanned Chinese ebooks are in fact 'stolen' from Chaoxing's library. So I'm afraid I can't provide you a sample of PDG.
In fact, PDG use CCITT G4 and DjVu for B/W picture.



Цитата:
http://210.32.137.91/softdown/rjxz.htm
This is the software download page for CADAL (China-America Digital Academic Library) project, which is managered by Chinese, Indian and American universities to scan and share books in their libraries. Scanned books are saved as single-page DjVu. This is the reason why "Merger" is the 1st page in DjVuToy: we "stolen" too much books from them. Before 2008, Chinese CADAL books' quality was quite good, but now is poor because water-mark is added.

http://210.32.137.91/softdown/PageFilterSetup060101.exe
A software made by CADAL to crop images in batch.

http://210.32.137.91/softdown/ImageProcess.rar
Clean, descrew and center images.

http://210.32.137.91/softdown/scanfix.rar
An image process software just like above, but provided by Indian.

http://210.32.137.91/softdown/2004-06-08.rar
CADAL book maker package, including 6 parts: work directory creation, image process, OCR and DjVu maker, meta-data input, bookmark creation and page bundler.

http://210.32.137.91/softdown/TIFFtoDjVuInstall.exe
B/W TIFF -> DjVu. I think Small DjVu is better than this.

http://210.32.137.91/softdown/DjVuMergeInstall.exe
Single-page DjVu -> bundled DjVu

http://210.32.137.91/softdown/titledjvu.txt
Config the environment of CADAL reader.

Since this website is from Chinese CADAL, all softwares are in Chinese. English websites:
http://www.archive.org/details/millionbooks
http://www.ulib.org/

http://www.djvu-soft.narod.ru/scan/scan_and_share_1_07_eng.rar
This paper is also popular in China. I think the main meanings are:
a. Scan paper in 300 DPI, then enlarge it to 600 DPI by software.
b. Decrease BPP to b/w.
c. Save as DjVu to get smallest file size.

ScanKromsator is in Russion or English so most Chinese don't like it. Now my freeware ComicEnhancer Pro is also popular among Chinese book scanning communities. The original purpose of this software is to process scanned comics (I love Japanese comics very much several years ago), but now we find it's suitable to process images scanned or download from ChaoXing or Google. You can get English version of it from here:
http://www.comicer.com/stronghorse/software/exe/ComicEnhancerPro_eng.zip

It provides these functions in "what you see is what you get" way: Brightness, contrast, highlight, gamma and curve adjustment; scale, crop, sharpen, soften and decrease BPP of image.

You see, we almost do the same thing in China and Russia. But I personally don't like DjVu. This is the reason why I add DjVu->PDF function in DjVuToy: I want to proof that PDF can get as high as DjVu's compress ratio.
Автор: ndch
Дата сообщения: 17.10.2009 12:18
Ну всё, понеслось.
Напоминаю всем: фильтровать юзеров движком форума нельзя (администрация против), а для тех что хочет скрыть сообщения некоторых юзером можно использовать локальный фильтрующий прокси-сервер. например proxomitron

Автор: Tulon
Дата сообщения: 17.10.2009 12:36
ndch

Цитата:
Ну всё, понеслось.
Напоминаю всем: фильтровать юзеров движком форума нельзя (администрация против), а для тех что хочет скрыть сообщения некоторых юзером можно использовать локальный фильтрующий прокси-сервер. например proxomitron

Речь идет не о фильтрации постов, а о их запрете для конкретного пользователя.
Если не удастся разрулить этот вопрос с администрацией форума, то решение я вижу в закрытии этого топика и переносе обсуждения сюда.
Автор: ndch
Дата сообщения: 17.10.2009 12:45
Tulon
Зачем так сурово ? Самое полезное - воспитать в себе стойкость к раздражителям.
Автор: Tulon
Дата сообщения: 17.10.2009 12:59
Это по вашему сурово? Человек в течении двух недель, ежедневно (с небольшими перевывами) поливает меня грязью на SourceForge, причем это не просто критика, а именно поливание грязью, которое портит мне репутацию и может даже повредить карьере. По вашему бан с форума для такого человека - слишком сурово?
Автор: monday2000
Дата сообщения: 17.10.2009 20:13
Tulon

Цитата:
Если не удастся разрулить этот вопрос с администрацией форума, то решение я вижу в закрытии этого топика и переносе обсуждения сюда.

По-моему, не лучшее решение. Туда мало кто будет ходить - там более тормознутый сервак форума, и меньше удобств.

Цитата:
причем это не просто критика, а именно поливание грязью, которое портит мне репутацию и может даже повредить карьере.

Попробуйте на это просто плюнуть. Так всегда и бывает - чем более публичен человек, тем больше найдётся желающих просто его облить грязью, а то и просто оскорбить и т.п. Вряд ли этому можно помешать. Ну забаните Вы его везде и всюду - и что? А он сделает себе сайтик и там Вас грязью обольёт, и через гугл всё это будет видно - и что Вы сделаете? Как говорится, на чужой роток не накинешь платок.

Просто делайте свои программы лучше всех - и тогда любой и всякий вменяемый человек воочию увидит нелепость грязеполивателя.
Вы допустили ошибку изначально, начав общаться с ним по скайпу - не надо было этого делать, тем самым Вы как бы вступили в близкий контакт, вот он и решил, что ему всё можно - он же теперь "близкий товарищ".
Тут же сразу понятно - раз человек захотел говорить по скайпу (без реальной объективной необходимости) - значит он, мягко говоря, неадекватен (иного быть просто не может) - и с ним нужно немедленно рвать.

А Руборд и Натахаус-форум - ИМХО действительно не идеальное место для обсуждения технологий книгосканирования. Потому что у этих форумов немного иные цели. Руборд - это по большей части Большой Варезник, и больше его мало что волнует, а Натахаус-форум - лишь инструмент поддержки Инфаната-форума.
Автор: Tulon
Дата сообщения: 17.10.2009 21:44

Цитата:
По-моему, не лучшее решение. Туда мало кто будет ходить - там более тормознутый сервак форума, и меньше удобств.

Ну, кому надо - ходить будут. А главное там удобство - мой статус модератора


Цитата:
Ну забаните Вы его везде и всюду - и что? А он сделает себе сайтик и там Вас грязью обольёт, и через гугл всё это будет видно - и что Вы сделаете? Как говорится, на чужой роток не накинешь платок.

Сайтик пускай себе делает. Где он высокий Page Rank возьмет? Google на мое имя возвращает 3650 результатов - это если в кавычках, а без - 7670.

А репутация в Англии очень важна. Всяко важнее, чем в России, и даже важнее, чем в большинстве других европейских стран. Вот вам пара примеров:
1. Устраиваешся на работу. Перспективный работодатель звонит двум твоим предыдущим работодателям, чтобы узнать, что они о тебе думают.
2. Ищешь квартиру для съема. Как договоришся о цене, тебя попросят дать контактную информацию одного-двух предыдущих квартировладельцев, у которых ты снимал квартиры. Опять же звонят им, чтобы узнать, что они о тебе думают. И на работу тоже звонят, ну и гуглят естественно. Кстати просто дать телефоны своих знакомых не получится - проверкой занимаются специальные агенства, которые их проверят по базе данных владельцев недвижимости. А владельцев недвижимости тут крайне мало - либо снимают квартиры, либо берут ипотеку. А обычная ипотека не позволяет сдавать квартиру - в контракте это написано, и надо полагать в базе данных отражено. У нас даже основатель фирмы со своей ипотекой до сих пор не расплатился.

Вот так-то. А вы думали Березовский от нечего делать с газетами судился?


Цитата:
Вы допустили ошибку изначально, начав общаться с ним по скайпу

Это точно - больше никакого скайпа.

Автор: chotarajkumar
Дата сообщения: 18.10.2009 01:36


Автор: monday2000
Дата сообщения: 18.10.2009 09:32
Ой, ну я сейчас умру от смеха...
Автор: Tulon
Дата сообщения: 18.10.2009 10:48
So long, chotarajkumar. I hope not to hear from you again.
Автор: ndch
Дата сообщения: 19.10.2009 00:31
Надеюсь бардак на этом прекратиться.

Tulon
Каковы краткосрочные планы ?
Автор: Tulon
Дата сообщения: 19.10.2009 01:00
ndch

Цитата:
Каковы краткосрочные планы ?

Довожу до конца переделку архитектуры интерактивности. Все стадии кроме вывода уже переделал, вывод переделал где-то на половину. За следующую неделю всяко закончу. После этого выпущу очередную сборку.
Потом уменьшу чувствительность детектора линии сгиба, либо запрещу ему искать линии у самого края.
Если будет не сложно сделать - сделаю скроллбары в основной зоне, после чего выпущу релиз 0.9.7
В общем 2-3 недели до релиза, и меньше недели до нормальной сборки с зонами и работающим драгом.
Автор: domo22
Дата сообщения: 19.10.2009 09:58
Подскажите, как сделать, чтобы Scan Tailor не обрабатывал изображения на странице, а только их обрезал и добавлял нужные поля?
И второй вопрос, как вызвать список файлов в проекте, чтобы в разных режимах обработать не все, а только некоторые страницы? В режиме обрезки - только вот эти страницы, в режиме поворота - только вот те, но другие чем в обрезке и т.д.?
Автор: ndch
Дата сообщения: 19.10.2009 13:29
domo22

Цитата:
не обрабатывал изображения на странице, а только их обрезал и добавлял нужные поля

Не могли бы Вы перефразировать, а то не очень понятно что хочется ?
Обрезка/добавление полей - частный случай обработки изображения.


Цитата:
второй вопрос

вручную, насколько понял Ваш вопрос.
Автор: are
Дата сообщения: 19.10.2009 17:13
продолжаю работать с 0.9.7pre.

понял, что если делать color upsample (а не ч-б), то появляется галка "White margins", и если её нажать, то весь мусор обрезается. (Раньше я жаловался, что он не обрезался.)

(А почему этого нет в режиме black-white?)

далее, вопрос: что такое "equalize illumination"?


cпасибо!
Автор: domo22
Дата сообщения: 19.10.2009 18:23
ndch

Цитата:
Не могли бы Вы перефразировать, а то не очень понятно что хочется

Есть картинки-сканы. Поля у всех разные, размеры у всех страниц разные. Качество сканов хорошее. Хочется не трогая саму полезную картинку - строчки текста, рисунки, т.п. сделать либо поля одинаковыми, либо (что лучше) - поля пусть слегка отличаются, но размер страниц по ширине будет одинаков (можно и по длине тоже одинаковые, но тогда полезную картинку, надо не поцентру или вверх, а вниз). Саму полезную картинку трогать нельзя - удалять мусор и т.п. - она хорошая.


Цитата:
вручную, насколько понял Ваш вопрос.

В такой мощной программе и нельзя выбрать какие файлы в каком режиме обработать, а какие нет?
Автор: U235
Дата сообщения: 19.10.2009 18:31
domo22
Можно сделать несколько проектов с разными настройками обработки.
Автор: dma200899
Дата сообщения: 19.10.2009 20:04

Цитата:
но тогда полезную картинку, надо не поцентру или вверх, а вниз).

нажмитие на стрелочку вниз и выберите "применить ко всем"
Автор: Tulon
Дата сообщения: 19.10.2009 21:59
are

Цитата:
понял, что если делать color upsample (а не ч-б), то появляется галка "White margins", и если её нажать, то весь мусор обрезается. (Раньше я жаловался, что он не обрезался.)

Я кстати сейчас попробовал, и не смог воспроизвести прерывистые черные линии по границе изображения.


Цитата:
(А почему этого нет в режиме black-white?)

Потому-что в черно-белом, как и в смешанном режиме, поля всегда заливаются белым. В режиме "серый/цветной" это не всегда желательно, потому что во многих случаях будет хорошо виден переход между естественным фоном бумаги и искусственными полями.


Цитата:
далее, вопрос: что такое "equalize illumination"?

Выравнивание освещения. Пытается удалить / минимизировать тень от корешка и другие неравномерности освещения. Как побочный эффект - забеляет фон.
В черно-белом и смешанных режимах выполняется всегда, так как это нужно для качественной бинаризации.

domo22
У Scan Tailor'а другая философия. Вот вам аналогия:
ST это завод - подаете на вход исходный материал, он проходит различные стадии обработки, и на выходе получаете готовое изделие.
То, что вам в данном случае нужно - это мастерская по ремонту данного изделия. Не занимаются ремонтом на заводах, и все тут. Заводской конвейер для этого не предназначен.
Можно попробовать загрузить ваши уже обработанные сканы как исходный материал, и пройти все стадии конвейера. Не гарантирую хорошего результата, но может и неплохо выйдет.


Цитата:
И второй вопрос, как вызвать список файлов в проекте, чтобы в разных режимах обработать не все, а только некоторые страницы? В режиме обрезки - только вот эти страницы, в режиме поворота - только вот те, но другие чем в обрезке и т.д.?

Раз уж у нас конвейер, то всем страницам так или иначе придется пройти все его стадтии. Список файлов после создания проекта недоступен, впрочем можно добавлять и удалять файлы в проект / из проекта через контекстное меню на ленте предпросмотра. Это работает только на первых двух стадиях, впрочем никто не мешает в любой момент переходить между ними туда сюда. Хоть все стадии придется пройти, на многих можно задать результаты вручную. Например на стадии разрезки страниц можно указать тип разреза "страница целиком", и применить его ко всем страницам.
А вообще, надо конечно документацию читать - вопросов стало бы гораздо меньше.
Автор: domo22
Дата сообщения: 19.10.2009 22:13
U235
dma200899
Спасибо, но ничего не понятно. Я не знаю как работать со Scan Tailor. Повторяю, мне нужно не трогать полезную картинку (а в моем случае это весь скан целиком, ВЕСЬ, вся страница. Вся потому, что Scan Tailor не в состоянии автоматом определить полезную область, а вручную мне не надо). Поэтому мне нужно объяснить Scan Tailor, что я хочу сделать все страницы вот такой ширины (скажем 1600 пиксел) и вот такой высоты, скажем 3000 пиксел (высоты даже не обязательно, она может варьировать, но если ее задавать, то прижимать оригинальную страницу вниз). После этого Scan Tailor должен перебрать все мои сканы и если какой шире чем 1600, обрезать его, если какой меньше, - добавить поля до 1600. Если менять высоту, то также и по высоте, только поля добавлять сверху, чтобы исходную страницу прижимать вниз. И НЕ ТРОГАТЬ саму страницу, не делать с ней ничего, она качественная.

Может Scan Tailor не в состоянии выполнить такую работу, так подскажите, чтоб не мучиться зря. Может это надо только в Кромсаторе? Но там беда, - он почему-то "чистит" сканы всегда, при любых опциях. Или всё только вручную?

А файлы, я так понимаю, только все вручную в другой программе пересмотреть и сбросить нужные в другой каталог?

Tulon
Спасибо за объяснение. Из него следует, что Scan Tailor не в состоянии выполнить эту работу, т.к. он делает только масштабные работы, а у меня мелочь по исправлению полей. Жаль, ведь вручную придется очень долго. Но все равно спасибо.

PS. Документацию читать не было времени, извините. Думалось, раз такая простая операция, то и Scan Tailor выполнит ее просто.
Автор: Tulon
Дата сообщения: 19.10.2009 22:23

Цитата:
Может Scan Tailor не в состоянии выполнить такую работу, так подскажите, чтоб не мучиться зря.

Такого ST действительно не делает.
Автор: Tulon
Дата сообщения: 20.10.2009 02:08
Хорошие новости.
Один зарубежный товарищ написал алгоритм коррекции геометрических искажений, и собирается встраивать его в ST.
Автор: U235
Дата сообщения: 20.10.2009 07:00
domo22
Если Вам нужно только привести картинки к одному фиксированому размеру (за счет полей), вообще без обработки, то есть смысл воспользоваться Irfan/XnView.
Tulon

Цитата:
алгоритм коррекции

Ждем...
Автор: monday2000
Дата сообщения: 20.10.2009 09:16
Tulon

Цитата:
Один зарубежный товарищ написал алгоритм коррекции геометрических искажений, и собирается встраивать его в ST.

А он не мог бы просто дать исходники?
Автор: Tulon
Дата сообщения: 20.10.2009 09:51

Цитата:
А он не мог бы просто дать исходники?

Не спрашивал, но ведет он себя не подозрительно, в отличии от сами знаете кого, так что я думаю - шансы на успех тут хорошие.
Автор: Widok
Дата сообщения: 20.10.2009 15:07
chotarajkumar
Флуд.
Переход на личности.

После очередного напушения - БАН.
Автор: monday2000
Дата сообщения: 20.10.2009 23:05
Tulon
Ну что же Вы этак скромно умалчиваете о существовании англоязычного топика по Scan Tailor?

http://diybookscanner.org/forum/viewtopic.php?f=3&t=110
Автор: Tulon
Дата сообщения: 20.10.2009 23:17
monday2000
Bolega своим последним постом отбил охоту делиться подобной информацией.
Автор: monday2000
Дата сообщения: 21.10.2009 08:09
Tulon
Я думаю, это из-за того, что монополия СК разрушена.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172

Предыдущая тема: Невозможно установить Acronis True Image Home v10.0.4940


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.