Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор

Автор: shch_vg
Дата сообщения: 19.12.2006 10:00
bolega
На необработанном развороте делаю обработку одной страницы, но в редакторе постобработки она не появится, пока не будет обработана вторая страница этого разворота. Нельзя ли все-таки сделать, чтобы сразу появлялась?
Автор: bolega
Дата сообщения: 19.12.2006 10:41
shch_vg
Нет, нельзя. К тому же рано или поздно все-равно придется делать и 2-ю половинку.
Автор: shch_vg
Дата сообщения: 19.12.2006 15:19
bolega

Цитата:
Нет, нельзя. К тому же рано или поздно все-равно придется делать и 2-ю половинку

Я догадывался, что нельзя .
А насчет рано или поздно скажу, что поздно.
Я перед обработкой просматриваю все развороты, а отдельные страницы обрабатываю, чтобы подобрать нужные параметры. Таких отдельных может набираться 10-15.
Т.к. страница обрабатывается вдвое быстрее разворота, приходится подсовывать в выходную директорию какой-нибудь подходящий тиф с нужным именем, чтобы обмануть программу .
Автор: Kiljes
Дата сообщения: 19.12.2006 16:21
bolega когда приблизительно будет новая версия?
Автор: bolega
Дата сообщения: 19.12.2006 17:36
Kiljes
Мне сейчас приходиться работать по 12 часов в сутки, времени на ск вообще нет.
Как только высвобожусь (надеюсь к январю, но пугают загрузкой аж до февраля, вплоть до того, что и НГ и рождеств. праздники мне не светят ), так закончу

Автор: Behdin
Дата сообщения: 19.12.2006 22:18
2 bolega

Здравствуйте. Такой вопрос возник. Я получил набор bw и gray файлов, но они не синхронизированы с исходными сканами в Кромсаторе.

Стоит задача привести их единому размеру. Задача осложняется тем, что есть некоторые страницы, на которых текст занимает лишь часть (верхню страницы). Соответственно, когда я кромсал это впервый раз получились укороченные версии страницы. При кодировании в djvu они так же выглядят укороченными, а я хотел бы, чтобы они выглядели как в оригинале, т.е. их размер совпадал бы с полноразмерными страницами. Пример проблемы здесь:

http://forum.dinfo.ru/gallery/albums/userpics/DJVU2.JPG

Ещё одна проблема - картинки. Файлы с картинками у меня gray, с текстом bw. В формате tiff размер файлов в пикселях примерно совпадает. Однако при кодировании в DJVU результирующий размер текстовой страницы и страницы с картинкой сильно отличаются. Как например здесь:

http://forum.dinfo.ru/gallery/albums/userpics/DJVU1.JPG
Автор: bolega
Дата сообщения: 19.12.2006 23:20
Behdin

Цитата:
Соответственно, когда я кромсал это впервый раз получились укороченные версии страницы.

На выходе, после полного окончания обработки, кромсатор делает все страницы одинакового размера (в пикселях или в мм, как зададите, причем пиксели можно использовать при условии, что все сканы в задании - одного dpi). После обработки получившиеся размеры СК подставляет в опции Page width/height, однако при этом он не переключает сам опцию Page width/height с Auto на Fixed. Вы обязательно должны сделать это сами, до того, как будете переделывать отдельные страницы. В этом случае при переделке страницы СК будет выдерживать ее размеры равными размеру всех остальных страниц, т.е. книги, независимо от того, много текста на странице или мало. По всей видимости Вы этого не сделали и при переделке этой страницы ее выходные размеры изменились (кстати, в новой версии СК упомянутое переключение будет делать автоматически).

По 2-й проблеме: равенство размеров тифов еще ни о чем не говорит, ведь у них могут отличаться dpi. Из-за этого файлы и могут выглядеть по-разному. Проверьте. Это кстати может быть еще одной причиной и 1-й проблемы.

Автор: kimserge
Дата сообщения: 20.12.2006 01:46
bolega
В связи с вопросом о размерах скромсанных страниц.
Если у меня в ряду одинаковых по размеру сканов попадается один, который такой же по разрешению, но больший (или меньший) по реальному размеру (имею в виду те цифры, которые кромсатор показывает - 2301 х 1900, например), как подогнать этот один файл под размер остальных, сохраняя порпорции?
Спасибо
Автор: bolega
Дата сообщения: 20.12.2006 09:07
kimserge
Интересно, а почему же он все-таки больше/меньше. Ведь в книгах как правило все страницы одинакового размера. На Ваших jpg видно, что страница не просто меньше/больше, но и масштаб у нее другой, как будто с другим dpi сделана.
Если зададите fixed-значение вых. размера, равное размеру остальных страниц, и после обработки увидите, что ее вид все-равно отличается от них, то однозначно, у нее другой dpi. Тогда единственный способ уравнять ее с остальными - уравнять dpi либо fixed-размер задать в мм, а не в точках, т.к. уравнивать пиксели для разных dpi некорректно и неправильно (размер будет конечно одинаковым, но буквы на одной странице будут выглядеть больше, чем на другой).


Автор: kimserge
Дата сообщения: 20.12.2006 13:06
bolega
Это бывает, когда фотографируешь. Иногда приходится обрабатывать чужие фотографии, и там человек, который снимал, вдруг на одной странице, скажем, решал поэксперементировать с другим dpi, подальше фотоаппарат относил или еще чего-нибудь. Со сканами в прямом смысле слова проблем нет (хотя несколько раз была подобная ситуация - половина сканов в 300 dpi, а другая - в 400).
Не выходят махинации с мм. Жалко. А не добавите инструмент для растягивания или сжимания по опр. формату? Или это слишком?
Автор: bolega
Дата сообщения: 20.12.2006 13:45
kimserge
Что же сразу не сказали, что это фото? В них вообще не поймешь, какой dpi. А я голову зря ломаю, как же такое-то получилось.
Один из выходов может быть такой: нужно отобразить разные сканы под одним мастабом и замерить (можно и линейкой на мониторе при большом zoom) высоту букв на одном и втором, поделить и получим как бы разницу в dpi. Затем ту, что меньше нужно ресэмплировать в такое же кол-во раз (напр. в 1,2). Кромсатор такое не поддерживает. Ресэмплирование на произвольный коэффициент можно сделать во многих графич. программах, каких точно, не скажу, так как делать не приходилось, но думаю Photoshop, rasterId, corel, irfan подойдут.
Автор: kimserge
Дата сообщения: 20.12.2006 15:26
bolega
Нет, слишком много хлопот получается ради отдельных файликов. Придется оставлять как есть, ставить None в размерах, все равно в джвю-просматривалках Fit to width все выровняет визуально. Спасибо за совет, может, и решусь когда..
Автор: Alexx S
Дата сообщения: 20.12.2006 16:19
kimserge

В Irfan View:
Меню Файл->Пакетное преобразование/перемещение
Добавляем файлы для обработки, указываем результирующую папку (лучше не ту, откуда брали) и включаем дополнительные парметры.
Настраиваем дополнительные параметры:
- галка сохранять пропорции
- новый размер (можно взять, к примеру, самый большой файл) - только один, либо ширина, либо высота.

В результате получим все файлы одной ширины. Делать лучше после обрезки кромсания, чтобы расстояние до текста было одинаковое.
Автор: bolega
Дата сообщения: 20.12.2006 16:55
Alexx S

Цитата:
новый размер (можно взять, к примеру, самый большой файл) - только один, либо ширина, либо высота.

Нет, тут так не пройдет (это и кромсатор сможет). В том-то и дело, что сканы имеют почти одинаковые размеры в пикселях, но поскольку сделаны с разными dpi (причем оно неизвестно), выглядят на экране по-разному: одни больше, другие меньше. Т.к. кол-во реальных мм книги, "загнанных" камерой в эти пиксели - разное:
размер в пикселях = dpi*размер в мм (без учета 2.54 - кол-ва мм в дюйме)
К примеру, сняли книгу с расстояния 10 см и в ПЗС камеры уместилась только одна половинка разворота, сняли с расстояния 15 см - на ту же пиксельную площадь уже влез весь разворот. Величина в пикселях - постоянная, а dpi, и соответственно масштаб текста, - разное.
Автор: Alexx S
Дата сообщения: 20.12.2006 17:46
bolega
Так я это и имел в виду. Кромсаем изображения так, чтобы полей практически не осталось. Получаем страницы с разным размером в пикселях и одинаковым физическим размером. Потом приводим это к в ирфане или кромсатореодному значению.
Автор: kimserge
Дата сообщения: 20.12.2006 20:16
Alexx S
bolega
То есть алгоритм такой -
1. кромсаю все файлы без полей,
2. ресемплирую их все в ирфане,
3. кромсаю с полями.
Щас испробую.
Спасибо
Автор: K V K
Дата сообщения: 21.12.2006 12:59
bolega
Не то чтоб строчно, ам 30 стр я уже резаки расставил, но при случае гляньте, как образец. Билеты МФТИ 2004 года, драфт на них совсем с катушек слетел. Может из-за черного фона вокруг (кто то область сканирования не выставлял). Ну в общем думаю такие сканы нонче редки, но если не сложно учесть.
Спасибо!
Удачи
ps могу выложить если У Вас нет
Автор: shch_vg
Дата сообщения: 21.12.2006 15:29
bolega
Нельзя ли сделать, чтобы работало MOVE в редакторе постобработки в режиме Compare?
Автор: bolega
Дата сообщения: 21.12.2006 16:48
shch_vg
Уже работает
Автор: darkseed
Дата сообщения: 22.12.2006 15:09
bolega

Esli uzh ne hochesh vikladivat novuyu versiu, obyasni kakie parametri luchshe vsego primenat pri chorno-belih fotografiah (shahmatnie knigi: foto i tekst na odnoy stranitse, t. e. foto ne otdelno!)!
Автор: Varjag2
Дата сообщения: 23.12.2006 10:21
Уважаемый bolega! Можно ли с помощью сканкромсатора исправить искажение строк, которое получается на сгибе при сканировании толстых книг?
В Файнридере 8.0 появилась возможность такой коррекции, но работает она отвратительно, впрочем, как и его же Deskew.
С уважением, Евгений.

Автор: bolega
Дата сообщения: 23.12.2006 16:53
darkseed
Все равно времни нет до конца доделать, поэтому выложу на следующей неделе что есть.

Varjag2
Кромсатор не умеет исправлять загибы строк. Это делает только BookRestorer
Автор: ghosty
Дата сообщения: 23.12.2006 18:18
bolega

Цитата:
Все равно времни нет до конца доделать, поэтому выложу на следующей неделе что есть.
Не поддавайтесь, пожалуйста, на провокации По себе знаю, что всегда лучше завершить "гештальт", чтобы потом не было повода для расстройств.
Автор: Alexx S
Дата сообщения: 23.12.2006 18:31
bolega

Цитата:
Все равно времни нет до конца доделать, поэтому выложу на следующей неделе что есть.

Все правильно, выкладывайте, пожалуйста. У меня как раз три книжки лежат - ждут новую версию. А что глюки и недоработки будут - ничего страшного, заодно и потестим.
Автор: shch_vg
Дата сообщения: 24.12.2006 12:26
bolega

Цитата:
Все равно времни нет до конца доделать, поэтому выложу на следующей неделе что есть.

Совершенству нет предела , поэтому может ли у этой работы быть конец?
Я за выкладывание, только бы были включены все основные возможности, случайно отключенные в версии ДЕБАГ.
Автор: Kiljes
Дата сообщения: 25.12.2006 00:23
А нельзя ли как-то сделать, чтобы СК мог обрабатывать цветные сканы? Или эта миссия невыполнима?
Автор: bolega
Дата сообщения: 25.12.2006 08:01
Kiljes
А что Вы понимаете под обработкой? Что-то специфическое? Он и сейчас их обрабатывает.
Автор: Kiljes
Дата сообщения: 25.12.2006 08:18
bolega чтобы обрабатывал цветные сканы как и чёрно-белые. Все сканы делал под один размер и одни границы, а то получается, что одна страница выше, а другая ниже. Вроде бы хорошо обьяснился.
Автор: bolega
Дата сообщения: 25.12.2006 09:09
Kiljes
Если под цветными сканами понимается страница, где основной контент - картинки (или вообще цветной фон), а текста практически нет (напр., детские книги), то СК во многих случаях бессилен, используется только как режущий инструмент. Причина в том, что определить полезный контур в этом случае чрезвычайно трудно, а иногда и невозможно, а иногда из-за сплошных фоновых картинок его и нет вовсе (картинки часто градиентные, с границами, плавно переходящими в фон, с просвечивающимся цветным контентом обратной стороны и т.д.).
Возможно, что новая версия обработает такие сканы гораздо лучше (именно обработка, а не draft), т.к. умеет неплохо чистить цветной фон. Вообщем, нужно пробовать.
Автор: Kiljes
Дата сообщения: 25.12.2006 09:25

Цитата:
что определить полезный контур в этом случае чрезвычайно трудно, а иногда и невозможно,
а вы случайно в новой версии не реализовали, чтобы ручками эти границы выставлять?
А как насчёт варианта, что есть на странице и текст и цветной рисунок, т.е. 50 на 50?

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667

Предыдущая тема: MSN Search Toolbar with Windows Desktop Search


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.