Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: Shangry
Дата сообщения: 17.05.2011 14:18

Цитата:
раздербанить djvu

Программка DjVuToy вроде бы умеет разбирать DjVu на отдельные страницы.
Автор: Astra55
Дата сообщения: 17.05.2011 16:05
Shangry

Цитата:
Программка DjVuToy вроде бы умеет разбирать DjVu на отдельные страницы.

Она умеет, но на кой это нужно в данном случае? Для более быстрого OCR нужны растровые tif/jpg, а не одностраничные djvu, поэтому применяется не разборка, а конвертирование.
Автор: v kornev
Дата сообщения: 18.05.2011 08:25
Установил 10-ю версию, и она почему-то не работает с моим сканером Mustek 1200UB.
Выдает ошибку - Timeout starting and initializing server. - Неустранимая ошибка сканера.
Установил рядом сней 7-ю версию, всё работает.
Может кто подскажет чем 10-ке мой сканер не нравится?
Автор: Sish
Дата сообщения: 18.05.2011 10:21
v kornev
А в настройках 10-го сабжа стоит использование фейса сканера или сабжа?
Автор: Shangry
Дата сообщения: 18.05.2011 11:27
Astra55

Цитата:
Для более быстрого OCR нужны растровые tif/jpg, а не одностраничные djvu, поэтому применяется не разборка, а конвертирование.

Сам еще с ней не работал, но в ТТД у нее прописано знание всех основных форматов, так что должна и в TIFF уметь сбрасывать.
Автор: v kornev
Дата сообщения: 18.05.2011 20:15
Sish
В настройках 10-го сабжа стоит использование фейса сабжа, но сканер там прописан. При попытке переключения на фейс сканера пропадает и то и другое. Распознавание из файлов работает.
Автор: SupAvt
Дата сообщения: 20.05.2011 06:24
Здравствуйте! Существует такая потребность: необходимо из отсканированного файла распознавать email и отправлять на него этот же файл. Есть решения?
Автор: Astra55
Дата сообщения: 20.05.2011 06:44
SupAvt
Вы путаете ФР с программами обработки полученных файлов с текстом, в том или ином формате. Поэтому в рамках ФР никаких решений нет и быть не может. В принципе.
Автор: SupAvt
Дата сообщения: 20.05.2011 06:47
Astra55
Возможно я путаю, подскажите пожалуйста софт который возможно умеет это делать
Автор: Astra55
Дата сообщения: 20.05.2011 06:59
SupAvt
Без понятия, поскольку никогда не было нужды. Поищите среди разного рода грабберов мыла, их очень много, а какой именно подойдет, Вам виднее.
Автор: Shangry
Дата сообщения: 20.05.2011 13:26
SupAvt

Цитата:
необходимо из отсканированного файла распознавать email и отправлять на него этот же файл

Полностью на автомате задача вряд ли решаема - ошибки разметки на блоки, ошибки распознавания.
А значит даже если найти софт, который будет посылать файл по распознанному адресу, всегда будет какой процент "не то и не туда послали". И совсем не факт, что это будет _небольшой_ процент.
Автор: oldos
Дата сообщения: 28.05.2011 13:18
Имеется книжка. Часть представляет собой отфотографированные развороты, а часть изображения страниц по отдельности. Соответственно они разнятся между собой по разрешению.
После распознавания передаю получившийся файл в Word, в котором получается, что те страницы, которые изначально были в виде разворотов имеют формат А5, а те которые были отдельными страницами - А4.
Что можно сделать для того, чтобы весть документ был единообразным без того, чтобы в Word полностью, вручную переделывать каждую страницу?
Автор: bolvanchik
Дата сообщения: 28.05.2011 19:56
oldos

удалите разделы страниц (поиск и замена). затем выберите необходимый размер страницы
Автор: Alatena
Дата сообщения: 28.05.2011 21:28
oldos
Если нумерация страниц не важна, в "Опции-> Сохранить-> Doc" снять галку с "Сохранить деление на страницы".

А иногда (когда doc сохранился с оригинальной нумерацией страниц и разнообразными полями) легче вообще удалить все разрывы, а потом "выделить всё" и скопировать в новый документ.
Автор: PGreen
Дата сообщения: 29.05.2011 08:48
v kornev
Фирменную прогу для сканирования – ту, что идёт со сканером – лучше вообще не ставить, если планируется работа с Fine Reader'ом. У меня были глюки в случае со сканером от Canon.
Просто поставить родной драйвер сканера, и выбрать его в настройках FR – как сказал Sish – если дрова автоматом не подхватились...
Автор: mihbelov
Дата сообщения: 29.05.2011 23:57
Есть ли в этой программе функция не отмены,а приостановки выполнения таких действий,как открытие файла(документа) и распознавание текста. Дело в том,что во время этих действий процессор загружается на 100% и сильно нагревается и с компьютера подается понятный звуковой сигнал,что надо на время приостановить указанные действия. Ну а потом естественно их продолжить
Автор: KChernov
Дата сообщения: 30.05.2011 10:32
mihbelov
Попробуйте приоритет процесса, который грузит на 100%, понизить на ступень.
А вообще надо разобраться в аппаратной причине и устранить.
Автор: vkramnik
Дата сообщения: 31.05.2011 21:14
2 All
Коллеги, подскажите, пожалуйста - может ли Файнридер распознать отсканированную
таблицу "японского кроссворда" - т.е., пустая сетка, слева и сверху от которой
расположены наборы чисел...
Нужно распознать, сохранить в формат, скажем, XLS или CSV, чтобы потом обработать
в своей программе. А то руками забивать такие сетки в большом количестве влом...
Или, может, какая-нибудь другая программа есть ? В рабочем состоянии, ес-сно...
Почитал про Формридер - но непонятно, распознает ли он такие сетки...
Автор: KChernov
Дата сообщения: 31.05.2011 22:15
vkramnik
Ну если вы ему это всё как таблицу зададите и сохраните в XLS, то почему нет?..
Ещё и язык распознавания можно указать Цифры - тогда и ошибок быть не должно (если скан хороший).
Автор: Shangry
Дата сообщения: 01.06.2011 14:24
vkramnik

Цитата:
пустая сетка, слева

Если у сетки один и тот же вид для разных кроссвордов, то может проще ее вручную сделать?
А задача "распознать наборы чисел" для FineReader вполне штатная, проблем не должно быть.
Автор: GoodShiva
Дата сообщения: 10.06.2011 09:38
Доброго времени суток! Впервые установил FinerReader 10 Professional Edition в связке
с Windows7 (32).
Возникает проблема(наверное по неопытности и отсутствию навыков работы с
данной программой)
    При запуске программы > файл новое > задание > выбор сценария > сканировать в
Word(2003) > просмотр(или сканировать) в окне отображается документ( но разделенный
по длине на две части то есть две половинки страницы. После сканирования и распознания
отображаются два столбца справа страницы тот что с лева по ходу чтения ,а с лева тот
столбец что с права,по ходу чтения.
    Вот такая у меня проблемка. Буду очень признателен за помощь.
Ну уж очень хочется(да и надо),чтобы страничка сканировалась в полном
обьеме без разбивки
Автор: ALEX666999
Дата сообщения: 10.06.2011 13:58

Цитата:
GoodShiva: Ну уж очень хочется(да и надо),чтобы страничка сканировалась в полном обьеме без разбивки

Удаляете области (зелёненьким должны быть выделны).
Самостоятельно выделяете текст на изображении мышкой, присваиваете области тип "текст", жмакаете "Распознать".
Автор: GoodShiva
Дата сообщения: 10.06.2011 18:01
Как же я его выделю если он, текст на стандартной странице изначально разорван и перемещен.
Автор: Alatena
Дата сообщения: 10.06.2011 18:16
GoodShiva

Цитата:
отображается документ( но разделенный
по длине на две части то есть две половинки страницы. После сканирования и распознания
отображаются два столбца справа страницы тот что с лева по ходу чтения ,а с лева тот
столбец что с права,по ходу чтения.
Честно говоря, не очень Вас поняла. Речь ведь идёт НЕ о двух страницах одного разворота?
Попробуйте убрать галочку с "Сервис -> Опции -> Сканировать/Открыть -> Делить разворот книги".
Автор: GoodShiva
Дата сообщения: 10.06.2011 18:25
К сожалению речь идет о стандартной странице формата А4
Если нет секретности фото могу отправить на мыло
Автор: ALEX666999
Дата сообщения: 10.06.2011 18:27

Цитата:
GoodShiva: Как же я его выделю если он, текст на стандартной странице изначально разорван и перемещен.

Тогда попробуйте совет от Alatena. Вижу, не помогло.
Я, просто, всегда с готовыми изображениями работаю, а с ними проблем не было.
Кривая разбивка на блоки только иногда.

Цитата:
GoodShiva: Если нет секретности фото могу отправить на мыло

На обменник rghost.ru выложите. Под паролями, если необходимо.
Автор: Alatena
Дата сообщения: 10.06.2011 18:32

Цитата:
он, текст на стандартной странице изначально разорван и перемещен.

вы про эти страницы говорите?


Добавлено:
GoodShiva
Если FR некорректно разбивает страницу сразу после сканирования, можно отсканировать другой прогой (например, VueScan), а потом готовые картинки скормить FR.
Автор: GoodShiva
Дата сообщения: 10.06.2011 18:40
Речь идет об одном развороте. "Делить разворот" убран. При сканировании автоматически страница вертикально делится на пополам, и левая часть текста располагается справа, а правая слева.
Автор: Alatena
Дата сообщения: 10.06.2011 18:52
GoodShiva
Так на самой картинке (что у меня выше на скриншоте срелочками отмечена) A4 целиком? Если да, то как писал ALEX666999

Цитата:
Удаляете области (зелёненьким должны быть выделны).
Самостоятельно выделяете текст на изображении мышкой, присваиваете области тип "текст", жмакаете "Распознать".


Пляшет порядок страниц (получается нумерация 5 4 7 6 9 8) или блоки одной страницы?

Со скриншотом было бы намного понятнее.
Автор: GoodShiva
Дата сообщения: 10.06.2011 20:58
Знал бы как вставить скрин проблем бы не было ( мое мыло mhv@ukr.net ) отправлю скрин

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.