» ABBYY FineReader

Автор: vasevase
Дата сообщения: 19.01.2016 21:35

Цитата:

terryient: в каком-то непонятном расширении FCH

Это кеш шрифтов, его открывать не нужно.

Цитата:

текст не сохраняется, не распознаётся

Мало данных. Корпоративка, например, вовсе не даёт даже возможность тестового юзания -
- только после активации. Если Pro - может уже срок ознакомления истёк.
7-ка поддерживается, это не должно влиять. Может ещё кривой/крякнутый попался вариант.
Можно попробовать вот тут в шапке выбрать другую версию (новее/портабельную):
http://forum.ru-board.com/topic.cgi?forum=35&topic=46259&limit=2

Автор: Petrik_Pjatochkin
Дата сообщения: 22.01.2016 16:50

Можно ли сделать так, чтобы FR только распознавал и добавлял слой OCR без какого-либо редактирования/пережимания исходной картинки. Поснимал в настройках все возможные "галки", везде где только можно поставил "исходное изображение" и все равно FR меняет исходное изображение, шрифт текста получается тоньше, да и размер файла часто меньше.

Можно как-то решить эту проблему?

Автор: corrector
Дата сообщения: 22.01.2016 18:58

Petrik_Pjatochkin
В рамках FR - проблема не решается. Требуются дополнительные программы и телодвижения.
Я в подобной ситуации поступаю так:
пусть есть pdf-файл orig.pdf (c качественной графикой), который нужно распознать;
1) распознаю orig.pdf с помощью FR, правлю (если нужно) распознанный текст в FR;
2) сохраняю распознанные страницы (все) в pdf с параметрами: Сохранять размер оригинала + Формат сохранения: Текст под изображением страницы + Качество (картинки и шрифты): Высокое (для печати) + Шрифт: Использовать системные шрифты и Встраивать шрифт; пусть сохранил результат по именем OCR.pdf;
3) с помощью Callas PDF Toolbox выделяю текстовый слой из OCR.pdf в файл txt.pdf;
4) с помощью PDF-Tools подклеиваю orig.pdf как видимый слой к txt.pdf, результат сохраняю как new.pdf.
new.pdf и будет требуемым результатом.

Автор: Petrik_Pjatochkin
Дата сообщения: 22.01.2016 22:19

corrector
Спасибо, попробую.

P.S.

Цитата:

2) сохраняю распознанные страницы (все) в pdf с параметрами: Сохранять размер оригинала + Формат сохранения: Текст под изображением страницы + Качество (картинки и шрифты): Высокое (для печати) + Шрифт: Использовать системные шрифты и Встраивать шрифт; пусть сохранил результат по именем OCR.pdf;

У вас какая версия FR? У меня версия 12 и параметры сохранения немного другие. Я сохранил с такими: качество изображения - высокое (разрешение исходного изображения); шрифты - использовать шрифты Window$ (чтобы можно было встроить шрифт, выбрал опцию "Текст поверх изображения страницы", иначе опция "Встраивать шрифт" недоступна)

Цитата:

3) с помощью Callas PDF Toolbox выделяю текстовый слой из OCR.pdf в файл txt.pdf;

Попробовал такое провернуть, но ничего не вышло

В Callas PDF Toolbox открыл сохраненный в FR pdf-файл, выбрал Tools -> Explore Layers, но программа сообщает: "No layers present. This PDF document does not contain any layer."
Может я что-то не так делаю?

Цитата:

4) с помощью PDF-Tools подклеиваю orig.pdf как видимый слой к txt.pdf, результат сохраняю как new.pdf.

PDF-Tools это PDF-XChange который или другой?

Автор: corrector
Дата сообщения: 24.01.2016 10:47

Цитата:

У вас какая версия FR? У меня версия 12 и параметры сохранения немного другие. Я сохранил с такими: качество изображения - высокое (разрешение исходного изображения); шрифты - использовать шрифты Window$ (чтобы можно было встроить шрифт, выбрал опцию "Текст поверх изображения страницы", иначе опция "Встраивать шрифт" недоступна)

FR8. Но, полагаю, FR12 тоже годится. "Текст поверх изображения страницы" - выбирайте (встраивание шрифтов важно).

Цитата:

Попробовал такое провернуть, но ничего не вышло
В Callas PDF Toolbox открыл сохраненный в FR pdf-файл, выбрал Tools -> Explore Layers

Не так. Надо: Tools -> SwitchBoard -> Arrange -> Slice. Появится новая панель Slice.
В ней затем в поле Check выбрать (в раскрывающемся списке) Text objects и нажать Execute. Будет предложено выбрать имя для файла с графической частью файла OCR.pdf - назовем его, например, Im.pdf - и папку хранения этого файла (по умолчанию - папка, где лежит OCR.pdf). Im.pdf в дальнейшем не понадобится, но сохранять его надо - без этого программа не будет формировать текстовую часть. После сохранения Im.pdf тот появляется в главном окне программы (видна будет его первая страница) и запускается процесс формирования текстовой части. По завершении его (в окне панели Slice появится сообщение "Slice: processing complete") в главном окне программы появляется файл Im-2.pdf (тоже первая страница) - это и есть текстовый слой файла OCR.pdf. Нужно его сохранить: через меню File -> Save As - выбрать имя файла (назовем его txt.pdf) и папку сохранения этого файла. Все, текстовый слой отделен.
Влияние FR8 или FR12 здесь следующее: для FR8 файл txt.pdf будет выглядеть пустым, т.к. в OCR.pdf он был скрытным; для FR12 файл txt.pdf будет выглядеть обычным, т.к. в OCR.pdf он был видимым (судя по опциям сохранения в FR12). Но для финальной склейки видимость txt.pdf роли не играет

Цитата:

PDF-Tools это PDF-XChange который или другой?

Да - это он.

Автор: stok1
Дата сообщения: 10.02.2016 03:37

Подскажите в чем причина, при установке ABBYY_FineReader_12_Pro_38хl выскакивает сообщение: протекает наложенное событие ввода/вывода. После этого установка прерывается, система windows 10 x64

Автор: mahtanoronra
Дата сообщения: 10.02.2016 20:32

постоянно отваливаеться ScanTwain.exe с ошибкой при сканировании
принтер самсунг SCX-4100
кто нибудь сталкивалься с похожей проблемой с таким или другим сканером?
версия программы 12.0.101.382CE ОС 7sp1

причём в 11 версии хотя бы работает интерфейс сканера а не программы.

Автор: vasevase
Дата сообщения: 10.02.2016 20:36

Цитата:

stok1: windоws 10 x64

Нет в списке поддерживaемых.

mahtanoronra
Младше версию FineReader пробовали, либо портабельную (неофициальную)?
У вас — ломаная. Oпять же, надо пробовать и триальную (без модификаций),
чтобы наверняка понять, в патче ли дело, или и "родная" версия тоже глючит.

Корпоратив триалу, сразу говорю, не подлежит. Надо на Pro тестить.

Автор: mahtanoronra
Дата сообщения: 10.02.2016 20:41

vasevase
ломанная.
пробовал 10, пробовал вот 11 лайт портабл описал выше
пробовал 12 от elchupakabra и портабл и инстолировал

то есть триальную попробовать поставить?
уже качая..

при чём было дело программа работала но лет 5-3 назад.
сейчас уже не помню. вот решил поставить проверить и опять не пашет.

родная программа для сканирования работает.даже на win 10 кое как её смог прикрутить хотя нету офицальной поддержки принтера моего для win 8 и win 10

проверил триал 12... проблема в самой программе...

Автор: vasevase
Дата сообщения: 10.02.2016 20:46

mahtanoronra
Подчистив "хвосты", желательно. Да.
Обычную, с сайта.

Сейчас рипукеров развелось - вырезают по самое "не балуй", потом удивляются, что что-то не работает.
Ладно бы ещё когда с умом делают. А то "а вот это что за CAB/DLL ? можно я его удалю, чёт много весит".

Автор: mahtanoronra
Дата сообщения: 10.02.2016 21:34

vasevase
хвосты то....чем по чистить то) удалил штатно инстолированную до этого.
дак были у кого нибудь в ветке похожие траблы? или всегда сканер работал у всех?

Автор: vasevase
Дата сообщения: 11.02.2016 00:53

Цитата:

mahtanoronra: хвосты то....чем по чистить то)

Руками хотя бы:

Реестр:
HCKU\Software\ABBYY\FineReader
HKLM\SOFTWARE\Wow6432Node\ABBYY\FineReader
HKLM\SOFTWARE\ABBYY\FineReader

Папки:
%USERPROFILE%\appdata\Local\ABBYY\FineReader\
%USERPROFILE%\appdata\Roaming\ABBYY\FineReader\

И запретить выход в интернет (Bonus.ScreenshotReader.exe, FineReader.exe, NetworkLicenseServer.exe).

Цитата:

были у кого нибудь в ветке похожие траблы?

Бывают (как раз один из советов для кракнутых версий - чистить папки AppData\Local\ABBYY\FineReader\).
Только чтобы знать наверняка, надо и триал проверять. Потом уже дрова и т.д.

Автор: mahtanoronra
Дата сообщения: 11.02.2016 15:34

vasevase
не помогает и триал пробовал... а 9 верися дак вообще просто не сканирует..
жалко программа то очень удобная для таких целей...

Автор: Multimedia
Дата сообщения: 24.02.2016 17:11

Попался я на удочку от ABBYY с их кастрированной корпоративной версией Per Seat, до последнего момента думая, что покупаю Concurrent (я уже вообще понял о различиях только после приобретения).

Менеджер от поставщика софта вообще ни слова не объяснил, вероятно и сам не знал о всех подводных камнях, а найти о них информацию можно только очень глубоко на сайте ABBYY.

В итоге, так как была нужна только одна лицензия - получилось, что купил за 12 тыр то, что можно было купить и за 5400, только в более красивой обертке

Всё равно лицензия привязывается к железу, даже если я установлю 10 серверов лицензирования. Есть там пара плюшек, но не уверен, что будут использоваться.

Посему возник такой вопрос: если всё же есть иногда надобность работы не с одного рабочего места, то могу ли я её установить на Windows 2012 и дать пользователям подключение по RDP, или может даже создать пользователя домена специально для работы с программой? Может кто-нибудь уже выходил из положения чем-нибудь подобным? Хотелось бы и сохранить по возможности легальность, но и не сидеть у "одного разбитого корыта" с вечным гемором по переносу и отвязке лицензии...

А еще может не плохо было бы в шапку добавить, что бы меньше людей вступали в подобное гамно?

Автор: Koks1970
Дата сообщения: 09.03.2016 17:52

ABBYY FineReader 12
как установить время проверки HotFolder меньше минуты??

Автор: barulya
Дата сообщения: 17.03.2016 21:38

Доброго времени суток
Подскажите пожалуйста, как можно организовать автоматическое распознавание ответов в тесте, по типу ЕГЭ. Хочу детям в школе внедрить тестирование, чтоб к моменту сдачи настоящего ЕГЭ они четко знали что и как заполнять, но решения найти не могу.

Автор: RNBJ
Дата сообщения: 18.03.2016 07:03

Я занимаюсь переводом компьютерной литературы, и самые большие проблемы всегда с кодом.

Как его обучить распознавать << вместо «? Лигатуру создал, несколько раз прогнал, но все равно никого толку.
Как его обучить распознавать закрывающую фигурную скобку которая почти всегда стоит отдельно?
Пример:

...
bla bla bla
printf(%s, str);
} <-- Не распознается. Вообще.

Автор: Maikl65
Дата сообщения: 18.03.2016 09:47

RNBJ
Цитата:

Я занимаюсь переводом компьютерной литературы, и самые большие проблемы всегда с кодом.

В полном наборе языков для распознавания у FR имеется специальная группа Формальные языки, предназначенная для распознавания кодов популярных языков программирования, простых химических формул и цифр.

Автор: RNBJ
Дата сообщения: 21.03.2016 23:46

Цитата:

В полном наборе языков для распознавания у FR имеется специальная группа Формальные языки, предназначенная для распознавания кодов популярных языков программирования, простых химических формул и цифр.

Да я пробовал уже C словарь подключать, толку никакого.

Автор: ComboFZ
Дата сообщения: 22.03.2016 11:17

RNBJ

Цитата:

Как его обучить распознавать << вместо «? Лигатуру создал, несколько раз прогнал, но все равно никого толку. Как его обучить распознавать закрывающую фигурную скобку которая почти всегда стоит отдельно?

Пробовал на FR12, всё распознает.

FR чувствителен к DPI, может с ним что-то неладно в вашем растре?

Выложите пример документа, который нужно распознать.

Автор: alpopo
Дата сообщения: 17.04.2016 08:57

фр12 при загрузке нового документа сохраняет его во временный файл на диске С:.
Можно ли выбрать другое место его расположения. На С: не хватает места

Автор: nnedc
Дата сообщения: 16.05.2016 16:36

Добрый день. Интересует такой вопрос.
Использую FR 12 Pro. Сканирую книгу, текст на русском и английском языках. Некоторые слова выделены жирным. При распознавании FR эти слова не выделят жирным. В настройках пункта для таких целей не нашел. Такое в принципе возможно или нет?

Автор: Maikl65
Дата сообщения: 16.05.2016 19:55

nnedc
Распознавание зависит от нескольких причин: качества оригинала, оптического устройства для получения картинки, установленного разрешения для картинки, режима распознавания. Есть смысл попробовать увеличить разрешение при сканировании до 400-600 dpi. Так же в случае, если цвет не интересует, то можно уменьшить яркость при одновременном ручном увеличении контрастности картинки при сканировании, а так же выставить черно-белый режим преобразования цветного/серого изображения при сканировании/открытии.

Добавлено:
nnedc
Распознавание зависит от нескольких причин: качества оригинала, оптического устройства для получения картинки, установленного разрешения для картинки, режима распознавания. Есть смысл попробовать увеличить разрешение при сканировании до 400-600 dpi. Так же в случае, если цвет не интересует, то можно уменьшить яркость при одновременном ручном увеличении контрастности картинки при сканировании, а так же выставить черно-белый режим преобразования цветного/серого изображения при сканировании/открытии.

Автор: BKSRU
Дата сообщения: 21.05.2016 17:10

Подскажите. Есть лучший вариант подговки скана для распознавания чем средствами ABBYY FineReader 12? Подрезка страниц под один размер, чистка от мусора...
Или может дежурный набор средств?

Автор: corrector
Дата сообщения: 24.05.2016 19:36

Вы уже сами себе ответили: ScanKromsator или Scan Tailor.

Автор: BKSRU
Дата сообщения: 24.05.2016 20:01

corrector

Цитата:

Вы уже сами себе ответили: ScanKromsator или Scan Tailor.

Ну в общем так и есть

. Не могу же дожидаться неделю сложа руки. Внимательно почитал параллельные топики, более менее начинаю понимать. Все таки вопросы лишними не бываю. Как минимум сужают круг поиска для экспериментов. Как понял с ScanKromsator сложнее разобраться в функционале, но возможно избыточен. Scan Tailor более дружелюбен, вроде самодостаточен.

Вопросы такие: Реально ли Scan Tailor самодостаточен? Равны ли эти программы по качеству работ? Или стоит разобраться с ScanKromsator и это даст лучшие результаты?
Есть ли личный опыт сравнения: выравнивание страниц/подгонка под один размер/очистка от мусора... Если знать обе программы, где работа делается быстрее?

Автор: corrector
Дата сообщения: 24.05.2016 22:04

Цитата:

Вопросы такие: Реально ли Scan Tailor самодостаточен? Равны ли эти программы по качеству работ? Или стоит разобраться с ScanKromsator и это даст лучшие результаты?
Есть ли личный опыт сравнения: выравнивание страниц/подгонка под один размер/очистка от мусора... Если знать обе программы, где работа делается быстрее?

1. Самодостаточность.
Для 90% книг - да. Оставшиеся 10% - книги с цв. и полутоновыми иллюстрациями, которые требуют дополн. обработки (освещенность, резкость, очистка фона и пр.) + книги в град. серого с аналогичными дефектами. В ScanKromsator'е есть инструменты для этого (опять же, не полностью покрывающие потребности); в Scan Tailor'е - этого нет.
2. Если забыть про (или махнуть рукой на) иллюстрации - качество обработки примерно одинаково. Я предпочитаю работать в ST (оставляю обработку цв./серой графики - если это требуется - на последующие этапы; для этого в ST использую раздельный вывод).
3. Выравнивание страниц/подгонка под один размер/очистка от мусора - не вижу преимущества ни SK, ни ST.
4. В ST у меня процесс движется быстрее, нежели в SK.

Автор: Maister
Дата сообщения: 27.05.2016 23:01

Что-то последняя корпоративная версия при работе с HP 7612 при выборе любого интерфейса - падает!
Просмотр в интерфейсе отрабатывает нормально, а после сканирования - падает! И при этом не говорит ничего, ни на что не ругается...

Никто не сталкивался?

Автор: chatt
Дата сообщения: 28.05.2016 22:20

Цитата:

Влияние FR8 или FR12 здесь следующее: для FR8 файл txt.pdf будет выглядеть пустым, т.к. в OCR.pdf он был скрытным; для FR12 файл txt.pdf будет выглядеть обычным, т.к. в OCR.pdf он был видимым (судя по опциям сохранения в FR12). Но для финальной склейки видимость txt.pdf роли не играет

А можно сделать txt.pdf скрытым после FR12?
Тогда по идее, можно будет и склеивать в том же callas_pdfToolbox

открываем файл куда надо добавить текстовый слой
File-Open
в окне программы делаем активной вкладку с текстовым слоем
tools-switchboard-arrange-Sandwich
Execute
на выходе получаем нужный файл с текстовым слоем, сохраняем

Автор: corrector
Дата сообщения: 29.05.2016 01:13

chatt
Adobe Acrobat умеет работать со слоями, в частности, управлять их видимостью.

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104

Предыдущая тема: filesCatalog

Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.