Ru-Board.club
← Вернуться в раздел «Программы»

» CuneiForm v12

Автор: Crag Hack
Дата сообщения: 14.12.2007 10:06
Cuneiform


OCR CUNEIFORM - это система оптического распознавания ведущего российского разработчика программного обеспечения Cognitive Technologies. OCR CuneiForm обеспечивает быстрое и высококачественное преобразование бумажных документов и электронных графических файлов в редактируемый текст для последующей работы с ним.
OCR CuneiForm отличается от других программ этого класса высоким уровнем распознавания, особенно текстов низкого качества и наличием встроенных мастеров - помощников в работе; мощным встроенным текстовым редактором.
12 декабря 2007 г. Компания Cognitive Technologies объявляет о запуске программы "Распознавание должно быть на каждом компьютере", о выпуске free-ware версии OCR CuneiForm и об открытии исходных кодов OCR CuneiForm.
Домашняя страница
Прямая ссылка на загрузку
Прямая ссылка на загрузку - 2
Давайте обсудим работу данного пакета - как никак бесплатная альтернатива FineReader' у
Cuneiform-Qt - графический интерфейс для системы оптического распознавания символов для Linux
Автор: starichok
Дата сообщения: 14.12.2007 15:36
Скачал... Установил... Доволен.
Довольно неплохие результаты распознавания текста с файлов TIF и BMP.
Корректность работы со сканером еще не проверял - сканер пока не подключен...
Автор: osab
Дата сообщения: 14.12.2007 15:54
Не работает с сетевым сканером МФУ HP LJ3052. При сканировании возникает "Ошибка при передаче данных". Из 2-х драйверов TWAIN воспринимает только WIA-HP LaserJet 3052 (но на нем ошибка см. выше). При попытке выбрать HP LaserJet 3052 TWAIN зависает.
А так из файла распознает нормально. Ошибки в пределах нормы.
Автор: goldenman
Дата сообщения: 14.12.2007 16:09
У меня с BMP нормально а с TIF мертвый висюк. Правда у меня система была уже ушатана.
Буквы пропускал несколько раз. Пришлось ручками править. Интерфейс понравился.

Автор: sanb
Дата сообщения: 14.12.2007 17:08
тифы идущие в комплекте распознаются отлично, непонял только какие графические форматы еще поддерживаются, попробовал bmp, очень плохо получается и еще жалуется на неверное разрешение, с моим МФУ (Canon Pixma MP130) тоже не работает "ошибка драйвера"
PS справка в комплекте жутко неудобная или я просто привык с CHM
Автор: goldenman
Дата сообщения: 14.12.2007 20:37
sanb
Я пробовал TIF собственного изготовления. Скрин с открытой в текстовом редакторе страницей текста.
Автор: ShamaN
Дата сообщения: 24.12.2007 10:29
Аналогичная проблема со сканером HP - ошибка при передаче данных.
Кто-нибудь разобрался в чем причина?
Автор: Sorok
Дата сообщения: 24.12.2007 10:35
Если при сканирование появляется окно "Ошибка при передаче данных"
Необходимо отредактировать файл face.ini лежащий в директории windows. Находим в файле ключ TWAIN_TransferMode и делаем его равным memory-native
т.е. должно быть TWAIN_TransferMode=memory-native

Взял с другого сайта, если не подходит чур я не виноватый.
Автор: ShamaN
Дата сообщения: 24.12.2007 10:37
Нашлось решение:

Цитата:
Если при сканирование появляется окно "Ошибка при передаче данных", то необходимо отредактировать файл face.ini лежащий в директории windows. Находим в файле ключ TWAIN_TransferMode и делаем его равным memory-native
т.е. должно быть TWAIN_TransferMode=memory-native


Добавлено:

Цитата:
чур я не виноватый

это решение с FAQ.

Так что все притензии к автору
Автор: Crag Hack
Дата сообщения: 25.12.2007 09:11
никак не могу распознать файлы со скриншотами

Открываю файл со скриншотом в CuneiForm и получаю окно

Коррекция разрешения
Возможно, открытое изображение имеет неправильное разрешение.
Гор. [96] Вер. [96]
Исправьте его, пожалуйста (допускается разрешение от 200 до 600).
Гор. [200] Вер. [200]

Нажимаю ОК, пытаюсь распознать и....ничего не распознано - просто пусто. Понятно, что хочется от 200 dpi, но ведь и при 96 dpi текст четкий и без помех. Да и FR8 успешно справляется с подобными файлами

Вот пример что у меня получается:

1. Что пытаюсь распознать (вполне читабельно)


2. Как произведена разметка на автомате (подрезана область по краям)
Ссылка

3. Результат распознавания (удручает)
Ссылка


Может я что то не так делаю? Подскажите, пжл.
Автор: goldenman
Дата сообщения: 25.12.2007 18:03
Crag Hack

Цитата:
Может я что то не так делаю? Подскажите, пжл.

У меня та же история. Это грехи сырой версии - надо подождать.


Автор: Dementy
Дата сообщения: 25.12.2007 22:21
Сделать бы программу портабельной (чтоб не требовала установки и с флешки работала) и добавить поддержку пдф-дежавю.
Автор: ZEWS
Дата сообщения: 25.12.2007 22:59
Dementy

Цитата:
Сделать бы программу портабельной

http://depositfiles.com/en/files/2784677 или http://rapidshare.com/files/78060853/CuneiForm_v12.rar
Сам не качал, но говорят там портативный вариант...
Автор: Dementy
Дата сообщения: 25.12.2007 23:30
ZEWS
Это было пожелание разработчикам - чтобы они сами сделали портабельный вариант.
Автор: ZEWS
Дата сообщения: 26.12.2007 09:32
Dementy
А это так важно? Далеко не весь софт делается портабельным именно разработчиками. И думаю у них щас есть дела поважнее, чем делать портабл версию.
Значит так нужен портабельный вариант...
Автор: Dementy
Дата сообщения: 26.12.2007 17:26
ZEWS
Сейчас много развелось якобы портабельных программ от умельцев, которые при проверке оказываются непортабельными или вообще не работают толком. Скачивать десятки мегов и проверять - заморишься.
А разработчики шнягу вряд ли подсунут
Ну а полноценная работа с пдф-дежавю нужна многим.
Автор: slech
Дата сообщения: 02.01.2008 14:08
отскринил кусок текста с форума.
результат никакой , правда может что не так сделал.

Цитата:


Автор: PhoenixUA
Дата сообщения: 02.01.2008 14:11
У меня сабж вообще не захотел работать с МФУ Canon 3228.
Писал "ошибка передачи данных" или что-то в этом роде.
Поставил FineReader - запахало только так .
Сырой еще продукт...
Автор: Astra55
Дата сообщения: 03.01.2008 05:48
Давайте не ждать чуда от CF. Софт неплохой, среди фривари ему равных нет, но скажем честно - он никогда не блистал качеством распознавания и удобством использования. Судя по откликам, народ хочет чтобы было бесплатно, все как у ФР и еще куча вишесов встроена Такого в обозримом будущем не предвидится, пройдет еще немало времени, пока открытые исходники повлияют на CF и умельцы его допилят до приличной кондиции.
Автор: PhoenixUA
Дата сообщения: 03.01.2008 08:09
Astra55
Качество - дело наживное. Но он бы хоть как-то заработал...
Автор: Astra55
Дата сообщения: 03.01.2008 09:19
У меня тоже не работал, подправил инишку, как в FAQ и все пошло. Но батчскана нет и вообще, сканирование сделано откровенно плохо и неудобно. Поэтому пусть OCRит, а сканить проще в Ирфане с макросом. Будет быстро и качественно.
Автор: Widok
Дата сообщения: 04.01.2008 13:17
шапка включена
Автор: Astra55
Дата сообщения: 04.01.2008 16:07
Еще сильно напрягает отсутствие поддержки tif LZW, пожалуй, основного формата для цвета и серого. Приходится разжимать tif, а это место на винте и время на разжим. Опять таки, это длится с давних пор, будем надеяться на включение этого формата в будущий CF.
Автор: Victor_VG
Дата сообщения: 06.01.2008 06:12
Astra55

Кстати, я например убедился, что прекрасно сканирует и XnViewer, PhotoFiltre (сам правда пользуюсь PhotoFiltre Studio), PhotoLine 32, Paint Shop Pro, Paint.NET, ... Так, что выбор инструмента сканирования это по большому счёту дело вкуса и навыков пользователя. Имеется только одна разница - в редакторах есть возможность при необходимости осуществить предварительную обработку изображения до его распознавания. А вот её итог будет зависеть как от возможностей редактора, так и от умения пользователя с ним работать. Поэтому я бы не стал давать однозначных советов. Ведь на тебя, как и на любого опытного человека смотрят новички и часто пытаются повторить то, что мы делаем "на автомате" как шаблон на все случаи жизни. И у них естественно, возникают проблемы.

А вот что касается DjVu и поддержки TIFF/LZW, то тут я согласен полностью - по идее, такую поддержку, как и поддержку других возможных входных форматов стоит реализовать через механизм подключаемых фильтров импорта со стандартным API. Да и возможность вывода результата с использованием подобного механизма также прибавит программе гибкости в применении.


Наверное стоит сказать об этом на форуме программы. Хотя уверен, что разработчики и сами об этом знают - как никак, а модульный принцип построения систем из функциональных блоков давно стал самым удобным инструментом разработчиков. Ведь это значительно проще, чем делать систему-монолит: просто берём готовый блок ("чёрный ящик") из некоторого набора (библиотеки блоков) имеющий набор соответствий "поступило на вход - получили на выходе", стандартные подключения входа-выхода и управления, и не смотрим "А что внутри и как это сделано?". А просто соединяем "кубики" в необходимую нам логическую цепь обработки. Итоговая система будет иметь свойства, определяемые набором свойств использованных блоков. В цифровой схемотехнике впервые принцип модульных блоков был реализован ещё в начале 50-х годов прошлого века. И верой-правдой работает до сих пор. А уж о том, сколько тысячелетий он людям служит уже и вспоминать не приходиться... Просто иные "особо конгениальные" товарищи хотят всё сами "...от нуля времён.." сделать - "...До нас никто этого не делал, а если и делал то не так как надо! Мы единственные знаем истину ..."... Ну, флаг им в руки, барабан на шею и вперёд заново изобретать каменный топор... Дурак-то, он потому и дурак, что ничего не замечает, никого не слушает, и утверждает, что он всегда и во всём первый, и единственный умный во Вселенной...

Добавлено:
Astra55

А насчёт сбоя сканера, то есть такое явление. У меня сканер Visicom 4400 USB. Так вот, к нему даже дрова шли разные! На диске отличные: и сканирование в 42 бит (это предел матрицы), и разрешение (оптическое, равное физическому разрешению матрицы 600 x 1200 dpi) до 2400 dpi, и настройки, и прекрасная цветопередача. А те что идут в пакете 4400.exe не то что использовать, а "драйверами" назвать не возможно - предел глубины цвета 15 бит, реальное разрешение не выше 300 dpi (выставляется правда 24 бит цвет и до 600 dpi, но не работает - специально проверял когда то на приборах), а о цветопередаче лучше промолчать, одним слово не драйвера, а так, недоразумение... С FineReader что я только не делал - при сканировании ошибки вылетали сразу. С CF реже, и удаётся сканировать через драйвер.
Автор: Astra55
Дата сообщения: 06.01.2008 07:53

Цитата:
что касается DjVu и поддержки TIFF/LZW

Можно и помечтать в плане прикрутки движка OCR CF к djvu софтам, чтобы можно было несколько языков выбирать... А то этот ИРИС, который суют все, кому не лень и куда попало, не выдерживает никакой критики. Софт Генчо на базе ФР, конечно, хорошо, но необходимость в куче промежуточных операций отпугивает народ. Словом, пока придется ждать дальнейшего развития событий. Но заявка очень серьезная, я пробую все OCR софты, которые попадают в руки, аналогов среди фривари нет, поэтому следует ожидать большого интереса самых широких кругов к исходникам CF. Так ли это будет - поглядим, уже недолго осталось. А доработать движок сканирования не должно представлять проблемы, равно как и батчсканирование.
Автор: bredonosec
Дата сообщения: 14.01.2008 22:11
вопросик имеется:
1) по распознаванию эта прога как? лучше фр? Хуже? намного? По удобству раоты, скорости..
2) сколько весит? (дистр, раскрытая на винте, сколько кушает ресурсов при работе(
3) есть ли ограничения по ОСям - там, ХР и выше, и т.д.? На 98 встанет?
Автор: sanb
Дата сообщения: 14.01.2008 23:55
bredonosec
Программные и аппаратные требования.
При установке CuneiForm необходима следующая конфигурация:
ПК на базе Pentium и выше
MS Windows 2000/XP с не менее чем 64 MB (рекомендуется 128 MB) оперативной памяти и около 65 MB свободного дискового пространства
TWAIN совместимый сканер.
дистр 34мб
Автор: bredonosec
Дата сообщения: 15.01.2008 04:07
спасибо.
А по распознаванию?
Автор: Crag Hack
Дата сообщения: 15.01.2008 07:57

Цитата:
При установке CuneiForm необходима следующая конфигурация:
ПК на базе Pentium и выше
MS Windows 2000/XP


Поправлю и дополню
Для полноценного использования системы CuneiForm необходимо следующее оборудование и программное обеспечение:
· PC-совместимый компьютер с процессором не ниже Intel Pentium 133 МГц и 50 Мб свободного дискового пространства. При использовании системы CuneiForm в среде Windows 95/98 рекомендуемый объем оперативной памяти 64 Мб, минимальный — 32 Мб. При использовании в среде Windows NT рекомендуемый объем оперативной памяти 96 Мб, минимальный — 64 Мб. При использовании в среде Windows 2000 или XP требования к процессору и оперативной памяти не ниже чем необходимо для данной системы.
· Сканер: TWAIN-совместимый.
· Операционная система Windows 95, Windows 98, Windows NT 4.0, Windows 2000 или Windows XP.


Цитата:
раскрытая на винте

61 Мб


Цитата:
сколько кушает ресурсов при работе

16Мб если просто запущена, около 40 Мб при распознавании


Цитата:
по распознаванию эта прога как?

неудобство (по крайней мере для меня) - не распознает скриншоты, pdf, djvu

качество и скорость распознавания вполне приемлимые.
На обычном куске книги djvu и FR и CF распознали одинаково
Автор: Crag Hack
Дата сообщения: 01.02.2008 14:03
Программу кто-нибудь запускал с правами, отличными от "Администратор"?

При запуске с правами "Пользователь" появляется сообщение об ошибке
"Failed to update the system registry.
Please try using REGEDIT."
После чего вроде работать можно, но результат распознавания не отображается.

Кто нибудь поборол эту неприятность?

Добавлено:
На данный момент решилось добавлением прав пользователю на ветку реестра
HKLM\Software\Classes\
но что то как то некрасиво

Страницы: 12345

Предыдущая тема: Посоветуйте софт для работы с аудио коллекцией


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.