Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор

Автор: monday2000
Дата сообщения: 19.08.2005 10:37
bolega
В кромсаторе 5.51 beta не работает загрузка файлов под Windows 98 (а только под Win 2000)

Не работают:

1. Пункт меню "Open"
2. Кнопка "Открыть"
Оба объекта видны на картинке:



Этой проблемы нет в Кромсаторе 5.07.
Автор: bolega
Дата сообщения: 19.08.2005 14:57
Arcand
И еще на другой стороне клавы "[" и "]" выполняют те же действия.



Добавлено:
monday2000
Мда, я думал, что кромсальщики уже не юзают 98.
Даже и не знаю, как это отлавливать. 98 у меня нет.
Автор: monday2000
Дата сообщения: 19.08.2005 15:28
bolega

Цитата:
Мда, я думал, что кромсальщики уже не юзают 98.

Да вообще-то у меня 2 операционки стоят - 98 и 2000, просто 98 дружественнее к пльзователю, чем 2000, а XP поставить - там мин. требование монитор 800х600 . 98 ещё не умерла ИМХО - она шустрая, простая, удобная. Загружается быстро .

Цитата:
Даже и не знаю, как это отлавливать.

Наверное, перекомпилировать под 98.

Цитата:
98 у меня нет.

Не слишком удобно, но можно сделать виртуальный комп с 98 виндой и там всё сделать. WM Ware, Virtual PC - я пользуюсь иногда, нормально работает всё это.
Автор: Arcand
Дата сообщения: 20.08.2005 06:37
bolega

Хочу обратить внимание еще раз на редкую, но досадную проблемку: при кромсании единичные страницы (было на 2-х книгах) оказываются пустыми. Это случилось и на B/W и на цветных сканах. На черно-белых сканах делал кромсание по полной программе, не воходя из Кромсатора. Попытки перекромсать эти страницы давали неизменный результат – белые страницы. После перезапуска Кромсатора, повторное кромсание этих страниц ОК.
Такое ощущение, что положение резаков считывается в нескольких местах программы: при сохранении задания (без ошибок) и во внутренние структуры программы, данные из которых используются при кромсании (случаются ошибки).
На цветной книге в 350 стр. пустых страниц было около 5 не подряд. Делал только одну обрезку. Здесь я забыл после сохранения задания перезапустить Кромсатор. После перезапуска, кромсание этих страниц ОК. Версия Кромсатора - последняя, система - русская WinXP SP2.

Есть у меня еще некоторые пожелания:

1. Не помешала бы предобработка, лучше в отдельном окне. С возможностями подобными тем, что имеются в постобработке. Здесь можно было поправить/почистить исходные сканы. Исправленые сканы сохранялись бы в другой папке отдельно от оригинальных, чтобы можно было сделать откат.
В предобработке я бы делал, например, удаление фона с цветных сканов. Фон все равно удалять, лучше это сделать раньше, тогда Кромсатору было бы легче обрезать и выровнять страницы! Вот здесь бы не помешал пакетный режим. Запустил и все. А отдельные сканы после отката можно поправить индивидуально.

2. Очень жажду чистку цветного мусора (достаточно в постобработке)! Мне кажется, что добавить ее в принципе не очень сложно, с учетом того, что фон уже удален.
Автор: bolega
Дата сообщения: 20.08.2005 09:50
Arcand

Цитата:
при кромсании единичные страницы (было на 2-х книгах) оказываются пустыми.

Очевидно, это из-за того, что какой-то из резаков наклонен (случайно), причем на очень малый угол, буквально на 1-2 пиксела. Если сможете, проверьте. Наклонный резак перемещается мышкой гораздо медленнее.
Честно говоря, я пока не представляю, что такое чистка цветного мусора, т.е. что на входе и что должно получиться.
Спасибо.
Автор: Arcand
Дата сообщения: 20.08.2005 11:16
bolega
Цитата:
Очевидно, это из-за того, что какой-то из резаков наклонен (случайно)
Наклоном резаков на своих сканах не пользуюсь - нет надобности. Я не ленюсь и книги на сканер ложу ровно. Подчеркиваю, проблема снимается после перезапуска Кромсатра. НИКАКИХ изменений я не произвожу, просто повторно кромсаю пустые страницы.
Цитата:
Честно говоря, я пока не представляю, что такое чистка цветного мусора, т.е. что на входе и что должно получиться.
С точки зрения дилетанта в этой области чистка цветного мусора могла бы быть такой.
На входе цветной скан без фона (чисто белый фон). Выделенная область (или скан) для чистки копируется и преобразуется в Gray. Далее серая копия чистится. Потом в выделенной области цвет пикселей устанавливается на белый, если он белый на (серой) копии и не меняется в противном случае.
Автор: monday2000
Дата сообщения: 22.08.2005 11:27
bolega
Пожелание: когда загружается множество tif-файлов для обработки, то по ним можно перемещаться стрелками вверх-вниз. После draft kromsate нужно пройтись и подправить резаки - так вот, если при этом случайно кликаешь на картинку (когда хочешь резак мышкой ухватить) - то похищается фокус со списка файлов в окошке слева и, как результат, уже стрелками вверх-вниз не поперемещаешься по файлам. Для этого нужно опять кликнуть на файл в списке в в окошке слева (вернуть туда похищенный фокус) - а так всё время кликать лень .

Добавлено:
Arcand

Цитата:
при кромсании единичные страницы (было на 2-х книгах) оказываются пустыми.

Вот видите - и у Вас то же самое получилось. Только у меня тогда так вся книга пустыми белыми листами нарезалась .

Добавлено:
bolega
Будете перезаливать "dlls-rename-to-zip.jpg" как "dlls.zip" - снимите атрибуты "только для чтения".

Добавлено:
bolega
Уж на что у меня на работе 17-дюймовый монитор, так и всё равно на экран не влезают все элементы управления, см.:



А нельзя ли разместить все элементы управления как-то попросторнее? Сделайте tab-вкладки так, чтобы они больше места на экране занимали при переключениях по ним - тогда туда всё поместится (как в DEE 5.1). Зачем всё так теснить?
Автор: vitaly1
Дата сообщения: 22.08.2005 12:20
monday2000

Цитата:
похищается фокус со списка файлов


Цитата:
кликать лень

Вот тут и тут написано, как перемещаться по списку с помощью клавиатуры.
Автор: monday2000
Дата сообщения: 23.08.2005 09:07
Вчера я понаделал немного скриншотов интерфейса Кромсатора (пока что без загруженных сканов, правда) - 45 скриншотов на 60 метров в цветном tif, залил сюда:

http://rapidshare.de/files/4243248/Kromsator_screenshots.rar.html (306 КБ)

А сегодня я их же порезал на соответствующие кусочки и залил всё это сюда:

http://rapidshare.de/files/4273925/Kromsator_pics.rar.html (458 КБ)

Здесь они уже и в tif, и в jpg. А сделал я это для того, чтобы облегчить создание хелпа по Кромсатору. Пусть bolega или кто-то ещё (кто разбирается в Кромсаторе) берёт в день по одному скриншоту и объясняет "вот эта галочка - для того-то, а вот этот чекбокс - для этого". Так заготовка для хелпа и составится постепенно.

Добавлено:
vitaly1

Цитата:
Вот тут и тут написано, как перемещаться по списку с помощью клавиатуры.

Спасибо! Я не заметил 2 вариант, когда тот текст читал . Итак, повторяю узнанное:

Перемещение по списку файлов в окошке слева при помощи клавиатуры (2 варианта):

Цитата:
Клавиши q и w.


Цитата:
И еще на другой стороне клавы "[" и "]" выполняют те же действия.



Добавлено:
Выкладываю теперь все скриншоты, которые есть в формате jpg в http://rapidshare.de/files/4273925/Kromsator_pics.rar.html , отдельно (первые 2 цифры имени файла совпадают с именем файла в папке "jpg" в http://rapidshare.de/files/4273925/Kromsator_pics.rar.html ):

http://img396.imageshack.us/img396/1708/014nl.jpg

http://img383.imageshack.us/img383/6797/026le.jpg

http://img380.imageshack.us/img380/1063/037tt.jpg

http://img377.imageshack.us/img377/6695/046fv.jpg

http://img372.imageshack.us/img372/4206/052iz.jpg

http://img369.imageshack.us/img369/9311/069ib.jpg

http://img354.imageshack.us/img354/7462/070rv.jpg

http://img397.imageshack.us/img397/3741/081xw.jpg

http://img394.imageshack.us/img394/9114/093pw.jpg

http://img392.imageshack.us/img392/456/100nq.jpg

http://img383.imageshack.us/img383/4100/117zr.jpg

http://img380.imageshack.us/img380/7234/129fv.jpg

http://img390.imageshack.us/img390/1936/139mh.jpg

http://img381.imageshack.us/img381/3040/144tq.jpg

http://img379.imageshack.us/img379/7306/150qg.jpg

http://img375.imageshack.us/img375/7592/166df.jpg

http://img373.imageshack.us/img373/6029/173yp.jpg

http://img367.imageshack.us/img367/8733/182jm.jpg

http://img398.imageshack.us/img398/2219/191ea.jpg

http://img395.imageshack.us/img395/6540/207zn.jpg

http://img393.imageshack.us/img393/4091/217lh.jpg

http://img390.imageshack.us/img390/8466/222sd.jpg

http://img381.imageshack.us/img381/2428/239pc.jpg

http://img379.imageshack.us/img379/3228/249rn.jpg

http://img375.imageshack.us/img375/4820/257iq.jpg

http://img373.imageshack.us/img373/9712/269hu.jpg

http://img370.imageshack.us/img370/2637/276mr.jpg

http://img392.imageshack.us/img392/7716/281wo.jpg

http://img388.imageshack.us/img388/2762/292kd.jpg

http://img380.imageshack.us/img380/1622/301uu.jpg

http://img377.imageshack.us/img377/8853/312tv.jpg

http://img373.imageshack.us/img373/4677/327ua.jpg

http://img370.imageshack.us/img370/7444/330tc.jpg

Добавлено:
И только что сделал ещё скриншоты, обрисовывающие процесс "draft kromsate" - 10 штук, в формате tif на 13,2 МБ, но сжались до 126 КБ:

http://rapidshare.de/files/4274930/draft_kromsate_screenshots.rar.html (126 КБ)

Скорее всего завтра порежу на маленькие скриншотики, сделаю ещё и в jpg, и залью.

Добавлено:
Жду чьих-либо описательных рассказов по выложенным скриншотам.
Автор: monday2000
Дата сообщения: 24.08.2005 08:56
Порезал на кусочки http://rapidshare.de/files/4274930/draft_kromsate_screenshots.rar.html и залил сюда:

http://rapidshare.de/files/4310389/draft_kromsate_pics.rar.html (174 КБ)

Всё оформлено опять в 2 форматах - tif и jpg.

Добавлено:
Выкладываю jpg-файлы оттуда отдельно сюда (принцип имён тот же):

http://img376.imageshack.us/img376/6792/019vu.jpg

http://img367.imageshack.us/img367/1157/028pa.jpg

http://img400.imageshack.us/img400/5834/034lm.jpg

http://img398.imageshack.us/img398/7131/042wb.jpg

http://img395.imageshack.us/img395/1773/054le.jpg

http://img391.imageshack.us/img391/3695/063bq.jpg

http://img383.imageshack.us/img383/1097/071wt.jpg

http://img381.imageshack.us/img381/2132/083to.jpg

http://img379.imageshack.us/img379/3366/096pi.jpg

http://img375.imageshack.us/img375/5645/105ww.jpg
Автор: monday2000
Дата сообщения: 25.08.2005 09:50
Сделал ещё немного скиншотов. Положил сюда:

http://rapidshare.de/files/4343885/Kromsator_screenshots_2.rar.html (88 КБ)

Скриншотированы окна:

Exclusive page options
Gray image enhance
Автор: Vouk1
Дата сообщения: 25.08.2005 11:34
Чета не слыхать, чтоб кто-то кинулся писать "описательные рассказы" по рисункам.
Хотя да, неплохо было б.
Автор: Arcand
Дата сообщения: 26.08.2005 11:25
bolega
У меня вопрос. Работаю с серыми сканами. На выходе B/W. Такое впечатление, что Despeckle не работает - остается много мусора, непривычно. Галка стоит. Что можно сделать?
Автор: bolega
Дата сообщения: 26.08.2005 12:12
Arcand
Используется Fine despeckle?
Может размер мусора слишком большой? (despeckle не трогает мусор сравнимый с размером знаков препинания). DPI в файлах правильное?
Автор: Arcand
Дата сообщения: 26.08.2005 12:34
bolega

Цитата:
Используется Fine despeckle?
Да. Выходной DPI был и оригинальным (400) и с ресемплингом (300). Вручную в постобработке чистится с размерами по умолчанию. Мусор мелкий, есть и крупный. На B/W сканах такой мусор чистится при кромсании.

Добавлено
Входной тиф многостраничный - такой получается на выходе РастерИД. Кромсаю только первую страницу.
Что интересно. Это же скан как bmp чистится нормально.
Уточняюю при входном разрешении скана 300 - нормально, при 400 - чистится плохо.
Автор: bolega
Дата сообщения: 26.08.2005 13:35
Arcand
Посмотрите все-таки, правильно ли в тифе прописан dpi после растерид (т.е. что показывает кромсатор в свойствах данной картинки multi-tif файла)
Автор: Arcand
Дата сообщения: 26.08.2005 13:50
bolega
Ифран первую страницу мультитифа определяет как 400 дпи, Кромсатор после кромсания тоже 400 (не нашел, как посмотреть инфо скана в задании). Теперь я с bmp пробую. Тот же скан как 300 и 400. На 300 чистится на 400 плохо.
Я тут запутался с файлами, пробую. Сейчас сделал с серого тифа (400 дпи ) серый bmp 400 дпи и 300 дпи. Чистятся плохо. Хорошо чистился в 300 дпи немного другой скан, не из по РастерИД. А эти после контурной резкости, сделанной в РастерИД.

Вроде бы дошло. Если чистится серый скан, то все понятно - из-за острожности Кромсатора будет оставаться мусор. В этом случае дело не в Кромсаторе. РастерИД меняет скан - буквы становятся резче и толще, фон - зернистым.
Автор: bolega
Дата сообщения: 26.08.2005 14:11
Arcand

Цитата:
(не нашел, как посмотреть инфо скана в задании).

В самом нижнем левом углу программы (там размеры, компрессия, цветность и dpi)
Кое-что кажется нашел, в смысле баг.
Если чистится недостаточно (если совсем нет - то это баг, т.е. другая история), то можно увеличить размеры допустимых спеклов. Закладка Pages, кнопка special, в поле despeckle поставить например Fine+2 (+3). Здесь значения сделаны относительными от стандартных, а не абсолютными, чтобы не задумываться, при каком dpi что задавать.
Еще можно на закладке Options включить Strong connected speckles. Но будьте осторожны - лучше недочистить, чем перечистить. А то будет как сканы bugatti.
Автор: Arcand
Дата сообщения: 26.08.2005 14:18
bolega
Я чуть выше свои соображения изложил. Все-таки мусор чистится на серых сканах, потом преобразование в B/W? Если так, то вопрос снимается.
Автор: bolega
Дата сообщения: 26.08.2005 14:24
Нет, кромсатор чистит только bw, т.е. сначала GREY->BW, потом уже despeckle.
Я кое-какой баг кажется нашел, сейчас выложу исправленную версию (5.52), попробуйте.
http://rapidshare.de/files/4384990/sk-5.52beta.zip.html
Автор: Arcand
Дата сообщения: 26.08.2005 14:35
bolega
Спасибо! Теперь чистится прекрасно.
Автор: bolega
Дата сообщения: 26.08.2005 14:38
Arcand
Вас спасибо за найденный баг!
Автор: sizop
Дата сообщения: 26.08.2005 18:22
Я уже задавал такой вопрос, только видимо не в том топе, в котором надо.
Вопрос в следующем, при сканировании картинок (например я сканировал карту из атласа) кромсатор не может выравнивать страницу? Галочки Art и Ortho выставлял.
Автор: bolega
Дата сообщения: 26.08.2005 19:07
sizop
И не сможет. И вряд ли какая программа сможет на полном автомате.
Дело в том, что в любом из существующих методов определения перекоса сканов, на изображении ищется доминирующее направление элементов (в данном случае строк текста). На карте таких доминирующих элементов не может быть в принципе. Там ведь одни черт-те как направленные линии (реки, дороги, границы берегов и областей и т.д.), и даже если и есть текст, то он тоже располагается часто под разными углами. Имеются методы, которые позволяют вычленять из цветных изображений только текст, Но и в этом случае для определения наклона нужно, чтобы этот текст был всегда вертикальным или горизонтальным (на оригинале). Если на Ваших картах так и есть, и цвет текста отличается от всего остального, то я мог бы быстро что-нибудь сварганить.
Другой быстрый метод - ручное указание на изображении области (например, прямоугольным выделением), где есть только текст, и тогда можно тоже быстро определить его наклон автоматом.




Автор: sizop
Дата сообщения: 27.08.2005 13:23
bolega
А по пунктам можно? Как указать

Цитата:
ручное указание на изображении области (например, прямоугольным выделением), где есть только текст

и что делать дальше. Спасибо.
Автор: Arcand
Дата сообщения: 28.08.2005 07:45
sizop
По Вашему вопросу. В постобработке выделяете мышкой прямоугольную область делаете правый клик и берете в меню Rotate selection. Что там делать в общем ясно или можно разобраться методом проб.

bolega
Все присматриваюсь к закладке Quality. Хотелось бы разобраться в ее функциональности применительно к исходным серым сканам (на выходе B/W). Исходные B/W сканы меня не очень интересуют - кардинальное улучшение этих сканов ИМХО вряд ли возможно.
Автор: bolega
Дата сообщения: 28.08.2005 11:40
Arcand

Цитата:
По Вашему вопросу. В постобработке выделяете мышкой прямоугольную область

Нет, это не то. Это нужно бы делать в предобработке, т.е. чтобы таким способом заносить фиксированные углы в поля Fixed deskew angle (Pages->кнопка special)
sizop Но этого пока еще нет. Думаю, что такая фича не помешала бы.
Сейчас же могу вот что предложить, при условии, что на сканах карт присутствуют горизонтальные линии (в оригинале горизонтальные конечно). Например, прямоугольная рамка, ограничивающую карту. Если так, то можно включить режим измерения углов (меню Ruler), щелкнуть на первой точке этой линии и не отпуская кнопку мышки, подвести ее курсор к другой точке этой же линии. За мышкой будет следовать "резиновая" линия, рядом с которой будет выводиться угол наклона линии. Если затем отпустить кнопку мыши и при этом держать нажатым Ctrl, то измеренный угол занесется в поле Fixed deskew angle. На этот жестко заданный угол кромсатор и будет поворачивать скан при обработке. При повороте grey и цветных сканов рекомендую на закладке Options задать Deskew method=interpolate.
Arcand

Цитата:
Хотелось бы разобраться в ее функциональности

Да там собственно ничего такого умного и нет. Стандартный простенький набор фич. Разве что только возможность убирать фон с серых сканов, особенно тени в развороте (некоторые называют это выравниванием освещенности, наверно так точнее). Улучшение качества не-B/W сканов может быть настолько разнообразным и богатым, что я даже и не стал с этим связываться. Это прекрасно делают специализированные программы (фотошоп, растерид и т.д.). Кроме того, не думаю, что это будет подходить к пакетной обработке.
Автор: monday2000
Дата сообщения: 29.08.2005 08:14
bolega
За выходные попробовал покромсать целую книгу Кромсатором, у меня возникли такие пожелания к Кромсатору:

1. Перезалить "dlls-rename-to-zip.jpg" как "dlls.zip".

2. Убрать функцию "Clear shadow" и ей аналогичные - она только портит сканы, а то, что она призвана делать, делается руками ничуть не медленнее.

3. Уменьшить шаг изменения пикселей повсюду в Кромсаторе с 8-10 пикселей до 1 - 8-10 пикселей - это слишком грубо.

4. Сделать назначение полей сверху и снизу раздельно - чтобы можно было назначить сверху одно поле, снизу другое.

5. Сделать автозапоминание в файл позиций резаков.

По редактору постообработки:

1. Сделать перемещение обрезанной картинки ("Shift image") 4 стрелками клавиатуры.

2. Увеличить точность вставки из буфера (прыгает на 1-2 пикселя вверх при вставке).

3. Выделить редактор постообработки в отдельную программу, или добавить туда возможность самостоятельного запуска его и загрузки туда совершенно сторонних tif'ов - для обработки через "Auto Save" и "Auto Clear" (блестящая вещь ).

4. Сделать более простое переключение с редактора постообработки в главное окно и наоборот.

Добавлено:
bolega
А вообще общее впечатление по Кромсатору такое: всё-таки не дотягивает он до желаемого уровня. Я решил всё-таки не использовать Кромсатор для КРОМСАНИЯ. Т.е. буду его использовать для всего остального (тут он хорош), а вот качество и уровень кромсания меня не устраивает - точность не та. Не идёт ни в какое сравнение с ручной нарезкой сканов - там я прекрасно вижу, что у меня получается, делаю именно то, что мне хочется. Кромсатор даёт лишь некоторое приближение к такому уровню, которое лично меня, увы, не удовлетворяет. Поэтому буду "кромсать" руками впредь.

Я думаю, bolega, что эта задача (кромсание) слишком сложна для решения её одним человеком - тут нужен целый коллектив квалифицированных специалистов. Это напоминает попытку создать в одиночку ABBYY FineReader - это просто не в физических силах одного человека, или же займёт десятилетия. А ведь для кромсания нужны именно такие (как в ABBYY FineReader) технологии. Да и вообще - в такой программе НЕ должно быть никаких резаков вообще - она должна уметь РАСПОЗНАВАТЬ мусор, а не я ей должен указывать, где мусор, а где голый текст. Но даже и сейчас - Ваш Кромсатор неудовлетворительно определяет точное положение контура голого текста - иначе почему приходится в постообработке то и дело двигать текст по картинке влево-вправо (вверх-вниз) на 8-16 пикселей? Если бы контур голого текста находился бы верно, то вот так двигать текст не надо было бы.

А вот эта проблема - нераспознавание мелких деталей (номеров страниц и т.п.), отстоящих на расстоянии от основного текста - это очень серьёзная проблема, она практически сводит на нет смысл существования Кромсатора (в плане кромсания).

Я думаю, что для кромсания следует использовать технологии ABBYY FineReader'а - распознавание образов, нейросети, генетические алгоритмы, библиотеки распознаваемых образов и т.п. - к сожалению, я в этом совершенно не разбираюсь, но всё равно мне ясно, что именно на таких технологиях и надо строить хороший Кромсатор.

И ещё я бы на Вашем месте не распылялся - к чёрту воплощение despeckle, deskew и т.п. - это и другие программы умеют делать, Вы бы лучше били только в одну точку - кромсание, и не отвлекались на всё малосущественное.

Так что у меня совершенно пропало желание написать какую-то доку по Кромсатору - толку с этого, если я решил им не пользоваться да и другим буду не советовать. Не стану же я на своём сайте вводить своих посетителей в заблуждение - нет, я предлагаю людям лишь то, в чём я полностью уверен. А хелп надо писать лично Вам, как автору, и странно, что Вы до сих пор это не сделали - тут работы на 3-4 вечера всего лишь.

Добавлено:
Кромсатор, по-моему, следует использовать для despeckle, deskew, для финальной чистки сканов через "Auto Save" и "Auto Clear", для отрезания паразитной полосы сбоку от 1 страницы на 1 скане (вот FR7 с нею не может сделать deskew, воспринимая её как основной текст и делая deskew, ориентируясь на неё ). А само "кромсание", на мой взгляд, лучше делать вручную - так точнее и ощутимо качественнее, пусть и дольше. Главное, что получается в итоге вещь, а не какая-то сомнительная поделка.
Автор: Arcand
Дата сообщения: 29.08.2005 09:35
По 3 и 4 пунктам обеими руками ЗА . Автономный редактор был бы полезен для предобработки сканов.
Цитата:
Убрать функцию "Clear shadow"
Здесь Вы, monday2000, промахнулись! В случае B/W сканов от этой функции толку действительно не много (здесь ее, как я понял, bolega рекомендует отключать). А вот в случае серых сканов песня совсем другая. Когда я сканировал в B/W я мучился со сгибами - пересканировал, чтобы чернота не налезала на текст. При сером сканировании с функцией "Clear shadow" эта проблема снимается - нет необходимости тщательно прижимать сгиб книги к стеклу сканера. Мой совет (для Вас запоздалый ), сканируйте в Gray!
bolega

Цитата:
возможность убирать фон с серых сканов
Как это делать?
Автор: bolega
Дата сообщения: 29.08.2005 09:41
monday2000
Я понял Ваше мнение.


Цитата:
она должна уметь РАСПОЗНАВАТЬ мусор, а не я ей должен указывать, где мусор, а где голый текст

Идеальная программа - да. Но ABBY тоже не умеет распознавать мусор - он распознает ТЕКСТ, точнее, относит его к нетекстовым элементам. Для него мусор - это все, что НЕ текст. В этом большая разница.

Цитата:
иначе почему приходится в постообработке то и дело двигать текст по картинке влево-вправо (вверх-вниз) на 8-16 пикселей

Хе-хе. Определяет то он неплохо. А вот располагает потом на странице именно с такой точностью. Абсолютно не вижу никакого смысла в пиксельной точности.

Цитата:
Увеличить точность вставки из буфера (прыгает на 1-2 пикселя вверх при вставке).

Хе-хе. Уберите фильтр. И будет вам точность. То, что вы видите на экране - облагороженное фильтром изображение, обработанное фильтром с окном 1-3 пикселя.
Кроме того, погоня за пиксельной точностью абсолютна бессмысленна на мониторах с размерами 640 - 1200 пикселей. Сами посчитайте, сколько точек изображения помещается в одну точку на экране. И тогда наконец-то поймете, что указывая какую-либо точку на экране, вы на самом деле тыкаете в интервал от 1 до 10 пикселей, соответствующий реальному изображению.

Цитата:
Не стану же я на своём сайте вводить своих посетителей в заблуждение - нет, я предлагаю людям лишь то, в чём я полностью уверен.

После всех Ваших вопросов на форуме (не только по кромсатору, но и по другим программам, которые вы перечисляете на своем сайте), я понял, что все, что вы предлагаете на сайте, вы НИЧЕРТА САМИ НЕ ЗНАЕТЕ. Так что от ваших слов про заблуждение мне просто смешно стало. Ответы на многие ваши вопросы содержатся аж в 1-й доке к кромсатору. Из чего я заключаю, что вы даже ее не читали. А еще требуете новую.
Если Вы сделаете антирекламу (именно антирекламу, а не просто игнорирование)кромсатора на своем сайте (а Ваш сайт всегда и везде упоминается в связи djvu), я буду вынужден навсегда прекратить его публикацию, буду развивать и использовать только для себя. Как говорится, не будет предмета разбирательства, не нужна и антиреклама будет. Какой мне смысл выкладывать программу, против которой настроены тысячи.
Ну и напоследок, почему бы вам не обратиться в Abby с предложениями, что еще должен делать FR? Будет тогда вам счастье.
Прощайте.


Добавлено:
Arcand

Цитата:
Как это делать?

На закладке Quality кнопка enhance.
Задать там Cleaner passes=1. Лучше убрать галку с Protect black pixels.
Если на скане есть иллюстрации, залитые серым или градиентным цветом, то их нужно заключить в exclude-зону, чтобы не повредить. Если тень наползает на текст и очень темна (текст на фоне ее плохо различим), то можно включить галку на Correct low contrast и поиграться значением Sensitivity (5 - 30). Результат можно наблюдать если нажимать на закладке Quality кнопку Preview или Preview with resample (в последнем случае будет выполнено изменение dpi, если задано. В первом же случае оно будет игнорироваться). Если там же взвести Don't change out color, то при preview не будет проводиться и изменение цветности (т.е. grey->bw не будет). Это влияет только на preview.



Добавлено:
monday2000
Еще одно интересное наблюдение.
Я перечитал сотни статей по image-processing и document-layout из зарубежных журналов. И во всех статьях есть одно общее - все они заканчиваются выводом, насколько после обработки алгоритмом автора статьи улучшается качество последующего OCR. Никто не ставил своей задачей обработку сканов ради сканов. Именно поэтому на рынке существует практически только одна программа, которая улучшает сканы и оставляет их сканами. Я имею ввиду BookRestorer за 6000 евро.
А вы мне про пиксельную точность талдычете, т.е. про точность, соизмеримую с самой точностью сканера.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667

Предыдущая тема: MSN Search Toolbar with Windows Desktop Search


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.