Ru-Board.club
← Вернуться в раздел «Прикладное программирование»

» Алгоритм распознавания текста

Автор: AndreySh
Дата сообщения: 13.06.2006 19:45
rapget
Чет не открывается ссылочка
Автор: SlavaMSK
Дата сообщения: 13.06.2006 19:45
Эээ.... Александр, а ссылочка нормальная? Что-то её браузер не открывает.
Автор: rapget
Дата сообщения: 13.06.2006 19:50
AndreySh
SlavaMSK

Вы что поверили, что я что-то из интернета взял?
В переводе на русский это значит:
http://www.ширяевалександр.ру/мозг.html

shiryaevalexander - это я

Сам я все делал
Автор: AndreySh
Дата сообщения: 13.06.2006 19:53
rapget
Да я так и понял! Поэтому улыбочка и стоит.
Автор: SlavaMSK
Дата сообщения: 13.06.2006 19:54
А Александр Ширяев у нас шутник однако. Ну хорошо, подождём твой релиз... посмотрим.
Автор: rapget
Дата сообщения: 13.06.2006 20:27
Конечно алгоритм еще сырой, его нужно усовершенствовать.
Автор: SlavaMSK
Дата сообщения: 13.06.2006 20:36
Тут сырым алгоритмом вся первая страница исписына. Что-то доверие пропало к твоим релизам.
Автор: rapget
Дата сообщения: 13.06.2006 20:40
SlavaMSK

Цитата:
Тут сырым алгоритмом вся первая страница исписына. Что-то доверие пропало к твоим релизам.


Сырой код означает. что я не могу проверить сейчас на 100%, похоже мой IP адрес рапида забанила даже из браузера не работает.
Новая версия выложена, смотрите, а только потом пинайте.
Автор: Azzidum
Дата сообщения: 13.06.2006 20:40
огромнейшее спасибо. реально пашет. Александр спас Рунет

Добавлено:


сейчас качаю. все работает.
Автор: SlavaMSK
Дата сообщения: 13.06.2006 20:46
rapget Извиняюсь про сырой код. Прогу по позже поганяю.
Автор: vkramnik
Дата сообщения: 14.06.2006 09:27
rapget
Уважаемый Александр !
Ваша программа v1.07 от 13.06.2006 файлы с Рапидшары НЕ КАЧАЕТ !!!
В логе пишет :

Цитата:
Not found the signature ("has been deleted", URL=http://rapidshare.de/files/.../ИМЯФАЙЛА.html)

и зацикливается...
Проверено более, чем на десятке разных файлов.
Параллельно наличие этих файлов и их скачивание было проверено программой USDownloader в полуавтоматическом режиме - она работает...
Настройки программы верные - с других сайтов льет за милу душу...
Так что, либо что-то у Вас в алгоритме распознавания не так, либо одно из двух...

Best regards!
Автор: rapget
Дата сообщения: 14.06.2006 09:35
vkramnik

Цитата:
Ваша программа v1.07 от 13.06.2006 файлы с Рапидшары НЕ КАЧАЕТ !!!


Программа качает, но алгоритм работает не на 100%, алгоритм уже улучшаю
Автор: AndreySh
Дата сообщения: 14.06.2006 10:15
vkramnik
У меня то же самое - всю ночь программа пыталась скачать 1 файл, и она ее скачала, но при этом рапида блокировала мой ИП 2 раза по 1,5 часа, так что к утру 1 файл был скачан.
Автор: rapget
Дата сообщения: 14.06.2006 11:28
AndreySh
Алгоритм улучшил, сделал 4 теста подряд - все прошли успешно.
Временно выложил здесь (только exeшник): http://www.rapget.com/download/rapget107_2_exe.rar
Вечером будет официальный релиз.
Автор: SlavaMSK
Дата сообщения: 14.06.2006 14:19
rapget

Цитата:
Вечером будет официальный релиз.

С песнями, плясками и салютом?
Автор: rapget
Дата сообщения: 14.06.2006 14:36
SlavaMSK

Цитата:
С песнями, плясками и салютом?


В Вилларибо уже танцуют, а в Виллабажо еще моют посуду
Автор: Dimoniusis
Дата сообщения: 14.06.2006 16:48
В вилабаджо пока занимаются другими делами
Автор: jeje62
Дата сообщения: 15.06.2006 12:19
Ну уел.
Автор: vkramnik
Дата сообщения: 15.06.2006 15:26
rapget
Добрый день, уважаемый Александр!

Цитата:
В Вилларибо уже танцуют, а в Виллабажо еще моют посуду

Позвольте поинтересоваться - а что именно танцуют в Вилларибо - танец с саблями или танец скелетов ?
Мне почему-то кажется, что второе... В свете нижеизложенного...

Цитата:

15.06.06 16:24:27: ============== Start program ==============
15.06.06 16:26:29: Link added (http://rapidshare.de/files/23091244/Delphi_-_Delphi_Developer_s_Guide_to_XML.rar.html)
15.06.06 16:26:34: Start download (http://rapidshare.de/files/23091244/Delphi_-_Delphi_Developer_s_Guide_to_XML.rar.html)
15.06.06 16:26:34: Not found the signature ("has been deleted", URL=http://rapidshare.de/files/23091244/Delphi_-_Delphi_Developer_s_Guide_to_XML.rar.html)
15.06.06 16:26:57: Downloading (POST) (http://dl27L3.rapidshare.de/files/23091244/1765661579/Delphi_-_Delphi_Developer_s_Guide_to_XML.rar)
15.06.06 16:26:58: Start download (http://rapidshare.de/files/23091244/Delphi_-_Delphi_Developer_s_Guide_to_XML.rar.html)
15.06.06 16:26:58: Downloading (GET) (http://dl27L3.rapidshare.de/files/23091244/1765661579/Delphi_-_Delphi_Developer_s_Guide_to_XML.rar)
15.06.06 16:26:59: Not found the signature ("has been deleted", URL=http://rapidshare.de/files/23091244/Delphi_-_Delphi_Developer_s_Guide_to_XML.rar.html)
...и так много-много раз...
15.06.06 16:28:13: Not found the signature ("has been deleted", URL=http://rapidshare.de/files/23091244/Delphi_-_Delphi_Developer_s_Guide_to_XML.rar.html)
15.06.06 16:28:26: Link deleted (http://rapidshare.de/files/23091244/Delphi_-_Delphi_Developer_s_Guide_to_XML.rar.html)
15.06.06 16:28:29: ============== Exit program ==============


З.Ы. USD ссылку скушал... Таки что там в Вилларибо ???
З.З.Ы. Rapget v1.08 - скачан в 16:23 MSK
Автор: rapget
Дата сообщения: 15.06.2006 15:45
vkramnik

Цитата:
Rapget v1.08 - скачан в 16:23 MSK


Ты бы еще через месяц бы скачал и говорил, что версия 1.08 не работает.
Вообще-то ночью Рапида вновь поменяла код.
Результат: Рапгет работает, но точность распознавания ухудшилась.



Цитата:
USD ссылку скушал...


В полуавтоматическом режиме? Так можно и браузером качать.

Автор: SlavaMSK
Дата сообщения: 15.06.2006 17:07
vkramnik

Цитата:
Позвольте поинтересоваться - а что именно танцуют в Вилларибо - танец с саблями или танец скелетов ?

Видел брачный танец у Зулусов? Вот что-то подобное.
Автор: AndreySh
Дата сообщения: 15.06.2006 18:14
Рапида начала банить за ошибки! Меня только что забанили на 29 минут.
Автор: toitoi
Дата сообщения: 15.06.2006 18:52
Access-code G5R wrong. 1500 KB added to your download-counter.
Only Free-users have to enter an access-code to prevent abuse. Premium-users don't have to!
Автор: Azzidum
Дата сообщения: 15.06.2006 19:26

Цитата:
Ты бы еще через месяц бы скачал и говорил, что версия 1.08 не работает.
Вообще-то ночью Рапида вновь поменяла код.
Результат: Рапгет работает, но точность распознавания ухудшилась.


подтверждаю. за ночь и текущий рабочий день на время поста рапгет вытянул только три файла.
Автор: Cwer
Дата сообщения: 15.06.2006 19:28
Насчет алгоритма:
Нельзя ли сделать так:
1) Посмотреть какие вообще цвета есть на картинке.
2) Какие из них образуются за счет наложения 2х и более цветов (нда.. цветов )
3) Выделить чистые изображения по цвету
4) посмотреть какие изображения являются буквами и числами
???
Автор: Dimoniusis
Дата сообщения: 15.06.2006 20:29
Cwer
1) можно. около 200-600 цетов
2) эээ. а как?
3) если бы это можно было сделать - то проблем бы больше почти не было
ибо 4 - просто прогоняется по базе и смотрим порог распознавания
Автор: vkramnik
Дата сообщения: 15.06.2006 21:43
Dimoniusis
Соображение по поводу п.2 (правда, не думал, как ето запхать в алгоритм) :
1. Если Вы умеете с определенной точностью выделять "сплошные" области, залитые одним цветом, то, в принципе, можно найти их "вершины".
2. В списке областей выделить пары смежных, т.е., тех, у которых совпадают пары вершин.
3. Область, являющаяся "визуальным" пересечением двух символов, будет иметь цвет, равный "сумме" цветов двух областей, смежных с данной областью, но принадлежащих разным символам.
Т.е., можно попробовать просчитать эту область в RGB-пространстве и потом просто на двух копиях картинки поочередно залить эту область одним из цветов смежных областей, восстановив, тем самым, кусок соответствующего символа...
Повторюсь, опять же - подобная задача, по-моему, уже решалась в графической библиотеке Borland Turbo C++ (и Turbo Pascal) первых версий - BGI.
Автор: Cwer
Дата сообщения: 15.06.2006 21:59
нда ща зашел на рапиду. не смог рисунок разобрать
перезагрузил. раньше было лучше %)
извиняюсь был неправ
может тогда собрать много-много картинок, посмотреть какими именно оттенками рисуются буквы (явно же не будет бледно желтого цвета), отсекать все явно бледное.. хз..

еще один вариант:

сейчас открыл, сохранил в 256 цветов в пэйнте. стало лучше по-крайней мере бледный шум убрался
сохранил другой рисунок. на вид стало лучше, но при пристально рассмотрении оказалось все же получше
потом можно убирать маленькие островки не белого цвета, тонкие линии, выступающие пиксели.
мож что и получится
(преполагаю примерно так шум и убирается везде да?)

вообще тут явно не мой профиль
если будут идеи обязательно скажу
Автор: Dimoniusis
Дата сообщения: 15.06.2006 22:11
Cwer ну на первый взгляд эта картинка лучше, хоть и выглядит страшнее. У нее фон НЕ полупрозрачный... то есть легко можно выделять зоны и филттровать...
Автор: TheBlackAngel
Дата сообщения: 15.06.2006 22:44
рапида упростила задачу )

около 5 часов писал алгоритм для тех картинок что были 2 дня назад. добился неплохих результатов но всеже был далек от идеала. сейчас написал за 15 мин более совершенный алгоритм для новых картинок.

как только доведу до идеала - поделюсь)

Страницы: 1234

Предыдущая тема: Delphi. Как расшарить папку?


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.