Ru-Board.club
← Вернуться в раздел «Прикладное программирование»

» Алгоритм распознавания текста

Автор: ZONE51
Дата сообщения: 13.07.2006 22:13
Товарищи, а реально написать прогу чтобы распознавала картинку с сайта YAHOO типа этого?


Автор: batva
Дата сообщения: 14.07.2006 00:21
ZONE51
Пока врядли реально.

Примеры картинок, которые уже легко распознаются можно посмотреть на сайтах соответствующих проектов.

Например,
http://www.cs.sfu.ca/~mori/research/gimpy/
http://sam.zoy.org/pwntcha/

+еще был один, не помню уже.
Гугл тебе поможет..

Автор: SlavaMSK
Дата сообщения: 14.07.2006 10:33
Нашёл русскоязычный сайт по теме http://www.captcha.ru/
Автор: Damn
Дата сообщения: 28.07.2006 19:50
а компоненты OCR не пробовали использовать? типа Lead Tools Imaging и т.д.?
Автор: Dimoniusis
Дата сообщения: 02.08.2006 22:01
Damn они во сновном все платные, и требуют достаточно качественного рисунка... А тут все в грязи и шуме... Чистка и чистка... и даже после этого компоненты нос крутят. А еще стоит учитывать, что найти их в полной версии весьма не просто
Автор: ivanmara
Дата сообщения: 02.08.2006 23:19
ZONE51

Боюсь что нет ... ничто не мешает разработчику выставить динамический алгоритм генерации картинки ... в этом случае любые парадигмы мдут лесом ...

Добавлено:
rapget

Последнее время лучшие программисты далеко не не русские ... индусы рулят ... наверно Oracle не зря черпает от туда ресурсы ... ))
Автор: Dimoniusis
Дата сообщения: 13.08.2006 21:54
ivanmara индусы банально дешевле. Качество у них на уровне русских, может чуток похуже, но цена дешевле раза в 1.5-2... Так что тут без вариантов. Но на самом деле нормальному программеру устроиться за границей или в оффшоре - не особо большая проблема. Я несколько раз получал предложения на работу ТАМ
Автор: superpalych
Дата сообщения: 14.09.2006 14:20
Необходимы мскодники на С++ для распознавание текста (обычного).
Автор: digger70
Дата сообщения: 21.09.2006 08:13

Цитата:
ZONE51
Пока врядли реально.


Рискну не согласится. Вполне реально. В исследовании Microsoft reserch данная капча распознавалась с вероятностью практический в 50% Ну а гуру Ле Кун, я думаю, процентов на 85-90 ее распознает.
Автор: svs123456789
Дата сообщения: 21.09.2006 13:50
digger70
а что там за 3ий справа символ?
Автор: digger70
Дата сообщения: 21.09.2006 14:25

Цитата:
а что там за 3ий справа символ?


Потому и не 100%
Автор: wd123
Дата сообщения: 26.10.2006 21:22
нужна любая инфа, примеры либо реализация (можно только dll, без исходников) для распознания хотя бы ОЧЕНЬ ПРОСТЫХ captcha типа этого - http://www.captcha.ru/ru/breakings/.
возможно вознаграждение XX-XXX WMZ (смотря от вашей помощи ) в ПМ.
Автор: U235
Дата сообщения: 01.11.2006 16:32

Цитата:
Товарищи, а реально написать прогу чтобы распознавала картинку с сайта YAHOO типа этого?

В принципе, я думаю, реально, правда применение классической корреляции вряд-ли возможно, зато структурные методы распознавания образов должны давать неплохие результаты (как и в случае рукописного текста), т.к. при искажениях сохраняются: последовательность символов, топологические характеристики, а также примерно сохраняются углы у символов.
Автор: digger70
Дата сообщения: 01.11.2006 16:45
U235

Да вот сомневаюсь на счет последывательности и углов. Это "ИМХО" или можно ссылки на конкретные труды зарубежных или российских авторов?
Автор: U235
Дата сообщения: 01.11.2006 17:25
digger70
Это "ИМХО", которое появилось после ознакомления с книжкой Фу К. "Структурные методы в распознавании образов" .
Насчет последовательности: имелось ввиду то, что символы должны читаться и вводиться слева-направо, поэтому, например, не может быть на картинке символов, расположенных друг над другом, это небольшая, но все-таки априорная информация, которую можно учитывать при распознавании. Топологические характеристики, тоже сохраняются при геометрических искажениях типа warping (у "восьмерки" как было два отверстия, так они и останутся, как картинку не искажай, если пока расматриваем чистое искажение без "шумов"). Под сохранением угла я подразумевал сохранение сингулярности кривизны контура символа в "угле", прошу прощения, если не так выразился, при искажениях "уголы", точнее их наличие и взаимное расположение сохраняется (как была буква O без углов, так она и останется при данных искажениях).
Автор: digger70
Дата сообщения: 01.11.2006 17:38
U235

Спасибо. Понятно и не интересно. А на счет углов у буквы о...

Страницы: 1234

Предыдущая тема: Delphi. Как расшарить папку?


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.