Ru-Board.club
← Вернуться в раздел «Прикладное программирование»

» Алгоритм распознавания текста

Автор: TheBlackAngel
Дата сообщения: 12.06.2006 22:50
Задача: распознать текст из трех символов. картинка цветная. кроме символов присутствует шум в виде векторной графики.
Пример картинки:


Результаты попытки очистки от мусора:


Начало обсуждения тут

Автор: cwll
Дата сообщения: 13.06.2006 01:00
Совершенно дилетантское мнение: а если анализировать RGB спектр каждого пикселя, потом считать количество пикселей одного цвета - возможно с неким % допуском , затем выкинуть все что меньше/больше мин/макс пикселей знака и дальше от этого плясать?
Возможно не пикселей как таковых, а группы одноцветных пикселей, скажем 3х3.

Например так: считаем, что минимальная толщина символа Х пикселей, максимальное У.
Все что больше У*У можно сразу исключить, то бишь закрасить.
Ищем максимальное количество _одноцветных_ пятен Х*Х - это и будут наши базовые цвета. Если получили ХХХ пикселей Х+Z*Х+Z добавляем погрешность N%. То есть если база 100*100*100, а допуск 5%, получим базу+допуск 95-105*95*105*95-105 как вариации базового цвета. Тут надо подумать, у всех ли цветов должен быть одинаковый допуск...

Далее так: если квадрат 2*2 не содержит цветов базы+допуск, то он должен стать белым. Если содержит одна грань, проверяем что за гранью, и если не содержит - тоже белый. Содержит - на пиксель в сторону, опять проверяем и закрашиваем. Затем обрабатываем одиночные пиксели по тому же алгоритму.

Надеюсь, мой поток сознания хоть частично можно понять...
Автор: ns56
Дата сообщения: 13.06.2006 02:46
Выделять символы на основе суммы пикселов бессмысленно, так как все символы, квадратики и розочки рисуются с прозрачностью.

Поэтому первоночально надо очистить от мусора...но самое убийственное это розочки.
Автор: cwll
Дата сообщения: 13.06.2006 03:57
ns56
Вряд ли получится очистить от мусора, не вычислив базовые цвета символов. Думаю, базы найти реально. Из-за прозрачности и предлагается задавать допуски на базовые цвета, как вариант. Дальше можно построить прямоугольник с символом, повернуть его вертикально и уже как-то анализировать.

Вообще идея была - отбросить максимум левой информации на первом этапе, при этом гарантированно не тронуть полезную.

Слышал другое предложение: использовать нейронные алгоритмы. Тут ничего сказать не могу, бо совсем профан.

Есть еще момент: толщина линии в символе всегда одинакова, это тоже можно использовать. Правда не факт, что завтра они не применят другой шрифт.


Автор: alexpin
Дата сообщения: 13.06.2006 08:54
а нельзя ли все это добро перевести в градацию серого и сравнивать с шрифтом
Автор: WiseAlex
Дата сообщения: 13.06.2006 09:43
TheBlackAngel
вот цитата с http://filepost.ru/?act=news

Цитата:

Недавно измененный алгоритм работы хостинга Rapidshare привел в негодность написанный нами ранее плагин. Теперь это исправлено и вы снова можете скачивать с Rapidshare.de, не ожидая 45 секунд и не вводя никакого кода с картинки!

может вы пошли не по тому пути?
Автор: rapget
Дата сообщения: 13.06.2006 10:05
WiseAlex


Цитата:
может вы пошли не по тому пути?



Или они стали использовать премиум аккаунт, ведь у них тоже платные услуги - расходы у них окупятся
Автор: SlavaMSK
Дата сообщения: 13.06.2006 10:48
WiseAlex

Цитата:
может вы пошли не по тому пути?


Причём здесь filepost.ru? Ветка иначе называется. Какие дела у filepost.ru уже в прошлом. Рапидовскую закачку всё равно они теперь на халяву не отдадут (в техже новостях написано почему). Пусть ребята обсуждают как рапиду обмануть, всё таки две проги простаивают.
Автор: Dimoniusis
Дата сообщения: 13.06.2006 11:39
WiseAlex пока я у них вижу "Закачка файлов с сайта rapidshare.de временно отключена. Администрация приносит свои извинения за предоставленные неудобства. Включение закачки ожидается сегодня ближе к вечеру."

Насчет вечера - не знаю...
Автор: XDiaBLo
Дата сообщения: 13.06.2006 11:46
Тут без нейронных нереально
Автор: cwll
Дата сообщения: 13.06.2006 12:02
alexpin
Смысл выкидывать дополнительную информацию? Это только затруднит распознавание.
Автор: AndreySh
Дата сообщения: 13.06.2006 12:31
WiseAlex
Эта новость от 2005-12-07!
На дворе 2006!!! И новые выбрыки рапиde.
Я понимаю, что хочется поучавствовать в их партнерской программе.
Автор: terminat0r
Дата сообщения: 13.06.2006 12:50
еще одно мнение неспециалиста по ОЦР

Если хорошо настроить тресхолд, то можно попробовать разбивать картинку на слои по цветам- это реализовано неплохо например в BookRestorer, или RasterID (не помню уже точно), думаю это не сложно реализовать.
Потом по геометрическим признакам выделить слои с текстовыми символами, или точнее говоря- отбросить явно не текстовые.- те, которые занимают больше половины картинки, очень тонкие линии и т.д
Остальные - сделать Smooth, поднять контраст, в чб, и распознавать посимвольно! потом сформировать код в соответсвии с расположением символов от левого края картинки
Автор: Dimoniusis
Дата сообщения: 13.06.2006 13:08
terminat0r а что за проги? ссылку можно ?
Автор: cwll
Дата сообщения: 13.06.2006 13:38
Dimoniusis
BookRestorer = xttp://doronin.nnov.ru/djvu/BR41en.rar
(xttp://dstu2204.narod.ru/djvu/index.htm)
Не качал не юзал, слышал, что стоит она 6000 евриков!

Автор: Dimoniusis
Дата сообщения: 13.06.2006 16:03
Кстати, пообщался с ребятами из файлпоста.... у них идей нет, они сейчас делают полуавтоматический режим... то есть как и у меня сейчас работает - спрашивать будут у пользователя код при добавлении ссылки
Автор: SlavaMSK
Дата сообщения: 13.06.2006 17:05
Dimoniusis если не секрет, кто на кого вышел?
Автор: Dimoniusis
Дата сообщения: 13.06.2006 17:07
SlavaMSK я у них спросил Еще интересно как там у рапгета дела... Все таки пярмой конкурент (пока местами выигрывающий)

На меня тоже выходили некотрые люди котрые разные проги делают... Тоже думают все
Автор: SlavaMSK
Дата сообщения: 13.06.2006 17:12
А ты разве не в курсе? Он 12 июня здесь прописался. Подымись до моего сообщения где я упрекаю народ что не туда влез, и прям надомной его пост. Кстати попасть в эту ветку можно только с твоей ветки.
Автор: AndreySh
Дата сообщения: 13.06.2006 17:14
Пока никто ни у кого не выигрывает. Есть определенные опережения но в угоду стабильности! А это тоже очень важно, я из-за ошибок в РапГете потерял много КилоМетров и времени
Кстати сегодня вечером Александр обещал обновление.
Автор: SlavaMSK
Дата сообщения: 13.06.2006 17:28
AndreySh

Цитата:
Рад Вас видеть на моем любимом форуме!
я тебе дал ответ.
Автор: Dimoniusis
Дата сообщения: 13.06.2006 17:53
SlavaMSK в курсе конечно и мониторю и ту ветку Не удивлюсь если он читает эти ветки.

Мне тоже интересно что он сделает
Автор: SlavaMSK
Дата сообщения: 13.06.2006 18:08
А давай его и спросим. Глубокоуважаемый Рапгет, не очень ли мы вас достанем, спросив: -Как у вас продвигаются дела с рапидой?
Автор: rapget
Дата сообщения: 13.06.2006 18:14
SlavaMSK

Цитата:
А давай его и спросим. Глубокоуважаемый Рапгет, не очень ли мы вас достанем, спросив: -Как у вас продвигаются дела с рапидой?



Дайте мне еще 30 минут... до исходников добрался только сегодня утром, т.к. они были на работе.
Примерно через полчаса смогу Вам ответить на вопрос: "Как продвигаются дела?"
Автор: SlavaMSK
Дата сообщения: 13.06.2006 18:31
rapget мы подождём
Автор: rapget
Дата сообщения: 13.06.2006 19:26
SlavaMSK

Цитата:
rapget мы подождём


Ну что я могу ответить? У меня работает! Новый релиз не за горами!
Автор: Azzidum
Дата сообщения: 13.06.2006 19:28
глобальный Respect. весь в ожидании - уж оч много ссылочек рапидовских лежит в списочке rapget
Автор: cwll
Дата сообщения: 13.06.2006 19:30
rapget
А мне вот гораздо интереснее, как ты проблему решил. Засвети решение, а?
Автор: SlavaMSK
Дата сообщения: 13.06.2006 19:32
rapget Я уж в наглую не буду интересоваться алгоритмом, но может посоветуете где копать? Ссылучку на интернет ресурсы подкините.
Автор: rapget
Дата сообщения: 13.06.2006 19:38
SlavaMSK

Цитата:
Я уж в наглую не буду интересоваться алгоритмом, но может посоветуете где копать? Ссылучку на интернет ресурсы подкините.



Ссылочку? http://www.shiryaevalexander.ru/brain.html

Страницы: 1234

Предыдущая тема: Delphi. Как расшарить папку?


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.