Ru-Board.club
← Вернуться в раздел «Программы»

» Сканирование и оцифровка текста *.txt, *doc, *.pdf, *.djvu

Автор: dmitin
Дата сообщения: 19.12.2004 19:09
Astra55

Цитата:
Но можно вот так - http://www.feith.com/DjVuer/djvuerproin.exe

У Вас точно получается качать по этому линку? А то у меня:

Цитата:
Sun Dec 19 18:08:48 2004 Соединение с www.feith.com:80
Sun Dec 19 18:08:48 2004 Соединяемся с www.feith.com [IP=192.251.93.71:80]
Sun Dec 19 18:08:48 2004 Соединение установлено
Sun Dec 19 18:08:48 2004 GET /DjVuer/djvuerproin.exe HTTP/1.1
Sun Dec 19 18:08:48 2004 Host: www.feith.com
Sun Dec 19 18:08:48 2004 Accept: */*
Sun Dec 19 18:08:48 2004 Referer: http://www.feith.com/DjVuer
Sun Dec 19 18:08:48 2004 User-Agent: Mozilla/4.0 (compatible; MSIE 5.00; Windows 98)
Sun Dec 19 18:08:48 2004 Pragma: no-cache
Sun Dec 19 18:08:48 2004 Cache-Control: no-cache
Sun Dec 19 18:08:48 2004 Connection: close
Sun Dec 19 18:08:49 2004 HTTP/1.1 404 Not Found
Sun Dec 19 18:08:49 2004 Date: Sun, 19 Dec 2004 16:08:46 GMT
Sun Dec 19 18:08:49 2004 Server: Apache
Sun Dec 19 18:08:49 2004 Content-Length: 283
Sun Dec 19 18:08:49 2004 Connection: close
Sun Dec 19 18:08:49 2004 Content-Type: text/html; charset=iso-8859-1
Sun Dec 19 18:08:49 2004 Ошибка!
Автор: Astra55
Дата сообщения: 19.12.2004 21:32
Мда, похоже DjVuer скончался . На сайте еще остались ссылки, но там 404. Могу закинуть на какой-нибудь сайт, если есть желание. У меня остался архив их софта, включая "лекарства".
Автор: dmitin
Дата сообщения: 19.12.2004 22:22
Astra55
Будьте любезны.
Автор: ZZmiy
Дата сообщения: 20.12.2004 01:15
dmitin

Цитата:
где сейчас обитает DjVuer Pro

Ваш файл djvuerpro17.rar (размер 2297 кбайт) доступен по адресу: webfile.ru/129474 в течение 7 дней до 01:10 27.12.2004.

DjVuer Pro многостраничные не делает, но bundled можно сделать при помощи Solo или DocumentExpress DjVu Editor из одностраничных файлов, закодированных в DjVuer, т.к. перекодировки исходных djvu в них при этом не происходит.
Автор: dmitin
Дата сообщения: 20.12.2004 02:31
ZZmiy
Большое спасибо!

Astra55
А версия 2 beta 1 ничем принципиально от 1.7 не отличается?

P.S. Конечно, перегонять тиффы в дежавю по одному - то еще удовольствие.
Автор: Astra55
Дата сообщения: 20.12.2004 08:38
Я сильно не разбирался в отличиях. Закину, сами поглядите. Что до удовольствия, то там батч задания, поэтому особых проблем нет.
Автор: EL
Дата сообщения: 20.12.2004 15:52
Один человек по имени Игорь и адресом в виде радиолюбительского позывного написал мне письмо по поводу AutoScan, я ему ответил, но мое письмо вернулось, поэтому я решил повторить ответ здесь. Уж извините за такой способ контакта. Просто не хочется, чтобы тот человек подумал, что я ему вообще не ответил.


Цитата:
Приветствую, Евгений!

А Вы не думали о том, можно ли прикрутить AutoScan к другим софтам?
Особенно интересует DjVu Editor PRO 4.1. Народ сильно
мается со сканированием в djvu, приходится сканить в других софтах, а
только потом конвертить полученные файлы.

С уважением,
Игорь


Т.е. чтобы после сканирования файлы сразу сохранялись в формате djvu?
Такая цель имеется ввиду?
Если да - то такое можно релизовать. Все, что нужно - это энкодер в djvu,
умеющий работать из командной строки (или имеющий API). Только вот
использовать один словарь на несколько страниц (как умеют делать DjVu Solo,
Editor) - наверное не получится при работе в таком режиме (сосканировал -
сохранил в djvu, постранично). А ведь именно это позволяет достигать
значительного выигрыша по сравнению с AT&T-утилитами 2-й версии.

А что-то другое имелось ввиду? Как тогда должен выглядеть процесс
работы?
Автор: Astra55
Дата сообщения: 20.12.2004 20:59
В принципе я уже прикрутил AutoRecorder старой версии 2.5 к DjVu Editor 4.1, сканируется на автомате, как в ФайнРидере. Это не лучший способ для создания файлов djvu, но для журналов формата А4 пойдет. Разумеется лучше будет сначала отсканить, обработать, очистить, а только потом конвертить в djvu.

Но имелось в виду автоматизация сканирования, как это сделано в Ирфане с AutoScan-ом. Эдитор в отличие от Соло может добавлять сканы в список. Может быть у Вас получится проще, чем с отдельной программой?

P.S. Почему письмо не дошло до меня, не знаю, все работает.

Добавлено
Файл с DjVuer PRO 2.0b1 (размер 2296 кбайт)
доступен по адресу: webfile.ru/130571 в течение 7 дней до 22:26 27.12.2004.
Пароль - djvu
Автор: dmitin
Дата сообщения: 20.12.2004 23:23
Astra55
Большое спасибо.

Цитата:
Пароль - djvu

Вы решили изменить старой традиции делать все пароли ru-board.

Жаль только, что Вы пароль установили не для самого архива в WinRAR, а на Webfile -это не позволяет пользоваться даунлоадерами.


Цитата:
Почему письмо не дошло до меня, не знаю

Ответ здесь. (это - шутка)
Автор: EL
Дата сообщения: 21.12.2004 01:35
Astra55
Ага, теперь понятно, кто мне написал. Приятно познакомиться
Честно сказать, я вообще не работал с DjVu Editor 4.1, но постараюсь на днях попробовать. Пока я буду это делать, можно объяснить, что такое "может добавлять сканы в список" и как внешне должен выглядеть процесс работы? Сразу скажу, что по поводу интеграции с DjVu Editor у меня сомнения, ведь управление IrfanView основано на том, что он поддерживает опции командной строки...

Кстати, не имею ничего против общения на "ты".

Почему не дошло письмо. Вот, какой ответ я получил:
----- Transcript of session follows -----
451 4.4.1 reply: read error from relay.nursat.net.
<****email*here***>... Deferred: Connection reset by relay.nursat.net.
Message could not be delivered for 1 hour
Message will be deleted from queue
Автор: estimated
Дата сообщения: 21.12.2004 01:45
dmitin
Попробуй так (download-менеджером):
url: http://files5.webfile.ru/get/121843781/DVP20b1.zip
referer: http://www.webfile.ru/130571
Автор: dmitin
Дата сообщения: 21.12.2004 02:20
estimated
Большое спасибо!
Автор: Astra55
Дата сообщения: 21.12.2004 08:07
У меня тоже большие сомнения. Внешние приложения не могут передать файл в Эдитор, он ругается. Когда через его интерфейс, тогда все работает.
Автор: Xeonc_II
Дата сообщения: 28.12.2004 17:08
Пожалуйста, посоветуйте, как можно распознать книгу 1917 года ( ять, твёрдый знак и прочее)?
Может, у кого-то есть сконфигурированный язык для FineReader? Или как его сделать?
Довольно интересная книга, а 350 страниц в сканах многовато

Спасибо.
Автор: dmitin
Дата сообщения: 28.12.2004 18:41
Xeonc_II
В ABBYY FineReader 7.0 среди дополнительных языков распознавания есть и "русский (старая орфография)".
Автор: Xeonc_II
Дата сообщения: 29.12.2004 14:32
dmitin

Спасибо большое. Как обычно, под носом не видел

Его можно выковырять из пакета остальных дополнительных языков (OtherLang.exe).
Также для редактирования поставил два шрифта Royal (можно скачать отсюда _http://rus-sky.com/history/font.htm)
Надеюсь, теперь получится

Спасибо ещё раз.
Автор: bdfy
Дата сообщения: 01.01.2005 04:46
Господа, а какие операции принято проводить надо зашумленным источником чтобы убрать грязь , шумы и пр. и улучшить качество сканирования? Использую фотошоп например? я Magic tool пытался приспособить серую грязь чистить, но выделяет он цвет что-то не на всем рисунке Еще кривые помогают, но текст бледнеет при этом и иногда теряет читабельность
Еще способы ? ( ластик не предлагать )
Автор: cornborer
Дата сообщения: 02.01.2005 03:35
bdfy
FineReader. Команда "Очистить изображение от мусора"
Автор: bdfy
Дата сообщения: 02.01.2005 05:38
cornborer
хреновенько чистит этот despekle ... даже явные кляксы не убрал и черноту между страницами , серый фон и подавно. фотошоп 7 про , если что.
Автор: cornborer
Дата сообщения: 02.01.2005 06:29
Да нет, если шум мелкозерный, то FR7 справляется неплохо. Если крупный, то да, было дело использовал Фотошоп CS + плагин от AlienSkin Image Doctor.
Автор: dmitin
Дата сообщения: 02.01.2005 06:43
bdfy
По поводу чистки сканов: как насчет ScanKromsator (от bolega)?
Автор: Arcand
Дата сообщения: 02.01.2005 06:44
bdfy
Для этих целей я пользую ScanKromsator (см. шапку).
Еще вариант (пока не освоил) - BookRestorer. Инфа была на 11 странице.
Автор: Astra55
Дата сообщения: 02.01.2005 08:18
2 cornborer

Откуда возьмутся большие пятна, если оригинал в норме и сканер исправный? Если есть, то на автомате ни одна софтина этого не сделает, у ей мозгов нетути .
Когда задаешь слишком большие размеры мусора, то начинает сильно искажаться текст. Очевидно, что нижним порогом автомата будут точки, запятые и хвостик в букве "й". Дальше все ручками чистить придется.
А что может этот плагин от AlienSkin Image Doctor?
Автор: cornborer
Дата сообщения: 02.01.2005 13:07
Astra55

Цитата:
Откуда возьмутся большие пятна, если оригинал в норме и сканер исправный? Если есть, то на автомате ни одна софтина этого не сделает, у ей мозгов нетути

конечно

Цитата:
А что может этот плагин от AlienSkin Image Doctor?

Много чего. Весьма полезный плагин. Если есть выход на Взор, поищи Alien Skin Eye Candy 5: Nature. Не пожалеешь.
Автор: bdfy
Дата сообщения: 02.01.2005 19:16
все скачал , вечером буду мучать
cornborer
Зачем Взор ( мне например с динамическим АйПи афаик не светит)? я в яндексе минут за пять нашел( правда только ссылка пятая рабочей оказалась ) , вот только там 7 метров - ночью стяну. Ссылку кидаю в варезник, в плагины шоповские.
К слову Eye Candy 4000 у меня есть , огонь прикольно малюет , только вот его разрешение маловато , а насройки я не вижу

добавлено:
А вот AlienSkin Image Doctor только на оф. сайте нашел киньте кто кейген в варезник, заценить охота.
Автор: cornborer
Дата сообщения: 02.01.2005 20:36
bdfy

Цитата:
я в яндексе минут за пять нашел

Ну и отлично.
Автор: Astra55
Дата сообщения: 02.01.2005 22:29
Скачал я этот 5-й Эдитор, поставил, скоренько попробовал. Мда, видел много муд...рецов, но Лизард похоже решил всех опередить. Этим долбо...носам не хватило нескольких лет, чтобы сделать хоть мало-мальски приличный софт. Резюме: что есть поле для серийника - обнадеживает, это лучше, чем их долбаные картриджи, сломать должно быть легче. OCR в русском варианте - ацтой! Генчо со своей примочкой к ФР опережает на две головы ихний Ирис, который был, есть и будет барахлом, несмотря на размер в 50 с хвостом мегов. Ладно, пойдет, пока что номер в розыске . Отвинтить от Ириса будет несложно, размер дистрибута получится небольшой.
Автор: Arcand
Дата сообщения: 03.01.2005 06:36
Astra55
Это надо бы в варезник (сами знаете куда). Похоже промазали .
Автор: Astra55
Дата сообщения: 03.01.2005 08:58
Мда, бывает . Последствия встречи Нового года...
Автор: Cheburashka
Дата сообщения: 03.01.2005 10:19

Цитата:
Господа, а какие операции принято проводить надо зашумленным источником чтобы убрать грязь , шумы и пр. и улучшить качество сканирования? Использую фотошоп например? я Magic tool пытался приспособить серую грязь чистить, но выделяет он цвет что-то не на всем рисунке Еще кривые помогают, но текст бледнеет при этом и иногда теряет читабельность
Еще способы ? ( ластик не предлагать )
А ты выложи картинку народ попробует почистить и выложит обратно с рекомендациями. А то на пальцах объснять как то не очень

Страницы: 12345678910111213

Предыдущая тема: Sockscap


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.