Ru-Board.club
← Вернуться в раздел «Программы»

» Universal Share Downloader

Автор: vkramnik
Дата сообщения: 12.06.2006 21:40
Gimlei
У меня есть возражения по Вашему предложению :

Цитата:
1) Несмотря на то, что символы могут быть разного размера, тем не менее, площадь, занимаемая пискселями символа, должна укладываться в определенные границы.

Это верно, а вот дальше...

Цитата:
Таким образом, учитывая то, что символы на рапиде пока что (тьфу-тьфу) одного цвета, можно предложить следующий алгоритм: считать, какую площадь занимают пикселы цвета X, если площадь попадает в допустимые рамки - вырезать данный символ и пробовать распознать.

А если на другом участке картинки нарисована мусорная фигня ТЕМ ЖЕ цветом Х ???


Цитата:
2) Если предыдущий способ не прокатит - можно попробовать обобщение предложенного: вырезать все участки картинки одинакого цвета, и пытаться их распознать.

Это тоже почти верно - только зачем пытаться распознавать явный мусор ?
В принципе, у фирмы Борланд, кажется, еще лет ...цать назад, в ее графической библиотеке BGLIB (если не путаю) к компилятору Turbo-C++ v1.0 имелся некий алгоритм заливки площадей, основанный на попадании точки определенного цвета внутрь области того же цвета и с определением границ области (по другому цвету пикселей).


Цитата:
При этом, поскольку алгоритм генерирует очевидно векторные "рюшечки", то они должны быть правильной формы, т.е. можно относительно просто написать алгоритм распознавания сектора овала, и отличать их от символов.

Отнюдь не факт, что алгоритм генерирует именно векторные рюшечки...
По крайней мере, у меня за вчера и сегодня на картинках появлялся явно не векторный мусор, а как бы некий "шумовой", я бы сказал...

Так что, все в руках уважаемого Dimoniusis-a
Автор: Gimlei
Дата сообщения: 12.06.2006 22:10
Не уверен, насколько уместно обсуждение алгоритмов распознавания каптчей в этом топике, но раз модераторы не ругаются, то я продолжу

UriF

Цитата:
единственно, если символы накладываются друг на друга...


Пока что не нашёл ни одной каптчи, где это происходит. Соприкосновения есть, но наложения - не видел.

vkramnik

Цитата:
А если на другом участке картинки нарисована мусорная фигня ТЕМ ЖЕ цветом Х ???


Принимается. Тогда нужно немножко добавить: какую площадь занимают пикселы цвета X, соприкасающиеся друг с другом. Т.е. считать площадь "фигур", где "фигура" - это точки одного цвета, соприкасающиеся друг с другом.


Цитата:
Это тоже почти верно - только зачем пытаться распознавать явный мусор ?


Не понял. Предложите тогда алгоритм, по которому вы определяете, что такое "явный мусор".

По поводу векторных/не векторных рюшечек: я ни на одной новой рапидовской каптче ещё не видел "не-векторных" рюшечек. Киньте тогда ссылку на "шумовой" мусор.
Автор: TheBlackAngel
Дата сообщения: 12.06.2006 22:20

Цитата:

Цитата:
Таким образом, учитывая то, что символы на рапиде пока что (тьфу-тьфу) одного цвета, можно предложить следующий алгоритм: считать, какую площадь занимают пикселы цвета X, если площадь попадает в допустимые рамки - вырезать данный символ и пробовать распознать.

А если на другом участке картинки нарисована мусорная фигня ТЕМ ЖЕ цветом Х ???


цвет символов разный. точнее изначально они одноцветные но после того как туда накладывается мусор цвет отдельных участков отличается весьма значительно. а вот мусор и символы абсолютно идентичные по цвету действительно встречаются


Цитата:
имелся некий алгоритм заливки площадей, основанный на попадании точки определенного цвета внутрь области того же цвета и с определением границ области (по другому цвету пикселей).


есть несколько алгоритмов определения границ области. те из них которые мне известны легко реализуются при наличии четкого критерия определения границ. вот сформулировать бы этот критерий для нашего случая.......


Цитата:

Цитата:
единственно, если символы накладываются друг на друга...

Пока что не нашёл ни одной каптчи, где это происходит. Соприкосновения есть, но наложения - не видел.

+1

Dimoniusis
я тут попробовал мух от котлет отделить:

левота конечно получилась, но есть кое-какие задумки по алгоритму. если заинтересует то пиши в пм.
Автор: UriF
Дата сообщения: 12.06.2006 22:27
АБСОЛЮТНО ТЕМ ЖЕ цветом фон и символы быть не могут, хотя бы потому, что на компе, различающем 65500 цветов, каждый цвет - это ничто иное, как некое число (напр. в VB6, если Вы используете цветовую палетку, то каждому цвету соотв. число типа long integer, по-моему такое implementation во всех Microsoft compilers)
Автор: TheBlackAngel
Дата сообщения: 12.06.2006 22:54

Цитата:
Не уверен, насколько уместно обсуждение алгоритмов распознавания каптчей в этом топике, но раз модераторы не ругаются, то я продолжу


Давайте продолжим тут дабы не засорять тему.

molann ups ))
Автор: molann
Дата сообщения: 12.06.2006 23:05
TheBlackAngel, клевая ссылка, поправь куда хотел.
Кинь туда свой образец, уже оч даже неплохо.
Автор: ns56
Дата сообщения: 13.06.2006 02:49
Ни кто не встречался со след. проблемкой на depositfiles и как ее решить.

Начал качать и остановил..вотом возобновил и теперь depositfiles пишеь что с IP качают, хотя ничего не качается..


Автор: Sish
Дата сообщения: 13.06.2006 04:30
ns56

Цитата:
Начал качать и остановил

сабжем?
Автор: UriF
Дата сообщения: 13.06.2006 06:57
ns56

у меня была подобная проблема - скормил ссылку во FlashGet, он скачал, а далее - Вы скачаваете с IP. Скормил USDownloader proxy list и un-check (как для rapidshare) качать в обход IP
Автор: KChernov
Дата сообщения: 13.06.2006 14:17
Dimoniusis
Скачал последнюю версию - теперь в случае, если скачать не удалось, в Статусе остается Получение ссылки...
Пробовал на версии рапидшаровского плагина без распознавания.
Автор: Sish
Дата сообщения: 13.06.2006 14:29
Dimoniusis
Ну что, пока попытки одолеть злобные нововведения на Рапиде не увенчались успехом?
Автор: Dimoniusis
Дата сообщения: 13.06.2006 17:06
Sish идеи есть, вроде что-то получается
Автор: SlavaMSK
Дата сообщения: 13.06.2006 17:52
filepost.ru
Автор: Dimoniusis
Дата сообщения: 13.06.2006 17:56
SlavaMSK ага. Ну я с ними по почте этото вопрос выяснил
Автор: liudnux
Дата сообщения: 13.06.2006 17:56
А такое видели?:

http://i6.tinypic.com/14abpki.png

Им уже нехватает 3 букв...
Автор: AndreySh
Дата сообщения: 13.06.2006 18:50
liudnux
А мне кажется что там они имели в виду 3 буквы, а палка справа - геом. фигура. Просто по недосмотру оказалась похожа!
Автор: liudnux
Дата сообщения: 13.06.2006 19:06

Цитата:
А мне кажется что там они имели в виду 3 буквы, а палка справа - геом. фигура


Так и есть... потом вспомнил, что у них I не просто палочка.

Да теперь с этой рапидой и глаз ошибается, интерестно, удастся ли Dimonius'у все таки ее обмануть
Автор: Yuk
Дата сообщения: 13.06.2006 19:40

Цитата:
Да теперь с этой рапидой и глаз ошибается

Ну, на 100% и раньше не получалось, ничего страшного. Будет хотя бы 50% правильного распознавания - уже лучше, чем ручками вводить. Так что ждем-с.
Автор: SlavaMSK
Дата сообщения: 13.06.2006 21:20
Dimoniusis Видел? Читал? Пробывал? Какие мысли будут?
Автор: AndreySh
Дата сообщения: 13.06.2006 21:27
Что значит
Цитата:
Какие мысли будут?
Через время Dimoniusis выпустит свой вариант (хотя, может Александр поделится своим алгоритмом отсеивания)
Автор: SlavaMSK
Дата сообщения: 13.06.2006 21:33
AndreySh
Александр может в очередной раз на очередной сайт послать, а не алгоритмом поделиться.
Автор: Dimoniusis
Дата сообщения: 13.06.2006 22:14
AndreySh очень сомневаюсь. Да и срабатывет он у него на 10-15 раз только.

у меня почти сделана моя реализация
Автор: Dmitriy05
Дата сообщения: 13.06.2006 22:17
Если в логах такая запись

"13.06.2006 23:14:31 Плагин вернул ошибку: "Server return: All download slots assigned to your country are in use. Please try again later." "

То файл в ближайшее время USD`ом не скачаешь? (автоплагин)
Автор: SlavaMSK
Дата сообщения: 13.06.2006 22:23
Dmitriy05 Опции --> Pазное --> Юзер Агент такую строчку впиши:
Код: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Alexa Toolbar)
Автор: Glebytsch
Дата сообщения: 13.06.2006 23:12
скачал-попробывал рапгет. качает, но ждать очень долго
минут 15 он пыхтел над одной ссылкой - наверное подбирал "идеальный" капча.
так что в работе плагина в рапгете все зависит насколько "чистый" рисунок выдаст рапида и насколько "правильно" прога сможет его распознать.
Автор: Dimoniusis
Дата сообщения: 13.06.2006 23:18
Glebytsch судя по логу он подбирает... то есть там штьук 15-20 на одну ссылку... насколько я знаю рапиду она любит от такого дела просто болокировать ip на час... для улучшения "зрения"
Автор: Dmitriy05
Дата сообщения: 13.06.2006 23:29
SlavaMSK
USD 1.3.3 - не нашел.
Автор: AndreySh
Дата сообщения: 13.06.2006 23:33
Dmitriy05
А ты попробуй впиши строчку, которую он дал (в 1.3.4 бэта 4 есть возможность менять)
Автор: Matrosking
Дата сообщения: 13.06.2006 23:47
Dimoniusis
Не нужен нам никакой рапгет! Ждём пока ты нас порадуешь новым плагином!

Автор: Glebytsch
Дата сообщения: 14.06.2006 00:14
Dimoniusis
похоже на то...
в среднем, как я подметил, на получение номального тикета затрачивается 4-5 минут.
правда как быть с тем, что после закачки нужно получать новый айпи. в усд у меня стоит - "если не получена ссылка запускать".
тут можно поставить "после закачки файла запускать", но тогда полностью теряется идея микса ссылок... то есть и для файлфектори и прочих серверов будет запускаться батник, что есть бессмыслица.
[more=лог закачки]13.06.2006 23:04:55: Start download (http://rapidshare.de/files/22810687/V.Pelevin_-_Omon_Ra.part1.rar.html)
13.06.2006 23:04:55: Not found the signature ("has been deleted", URL=http://rapidshare.de/files/22810687/V.Pelevin_-_Omon_Ra.part1.rar.html)
13.06.2006 23:06:09: Downloading (POST) (http://dl30cg.rapidshare.de/files/22810687/1741059853/V.Pelevin_-_Omon_Ra.part1.rar)
13.06.2006 23:06:09: Start download (http://rapidshare.de/files/22810687/V.Pelevin_-_Omon_Ra.part1.rar.html)
13.06.2006 23:06:09: Downloading (GET) (http://dl30cg.rapidshare.de/files/22810687/1741059853/V.Pelevin_-_Omon_Ra.part1.rar)
13.06.2006 23:06:10: Not found the signature ("has been deleted", URL=http://rapidshare.de/files/22810687/V.Pelevin_-_Omon_Ra.part1.rar.html)
13.06.2006 23:07:23: Downloading (POST) (http://dl30L3.rapidshare.de/files/22810687/1741073938/V.Pelevin_-_Omon_Ra.part1.rar)
13.06.2006 23:07:24: Start download (http://rapidshare.de/files/22810687/V.Pelevin_-_Omon_Ra.part1.rar.html)
13.06.2006 23:07:24: Downloading (GET) (http://dl30L3.rapidshare.de/files/22810687/1741073938/V.Pelevin_-_Omon_Ra.part1.rar)
13.06.2006 23:07:25: Not found the signature ("has been deleted", URL=http://rapidshare.de/files/22810687/V.Pelevin_-_Omon_Ra.part1.rar.html)
13.06.2006 23:08:38: Downloading (POST) (http://dl30L3.rapidshare.de/files/22810687/1741088309/V.Pelevin_-_Omon_Ra.part1.rar)
13.06.2006 23:08:57: ============== Exit program ==============[/more]

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133

Предыдущая тема: Shtirlitz (Штирлиц)


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.