Ru-Board.club
← Вернуться в раздел «Программы»

» Universal Share Downloader

Автор: molann
Дата сообщения: 12.06.2006 12:35
pasynok, Dimonius над этим работает (галки у плагинов в опцих видел, вот это будет оно).
Неплохо было либо в звуках либо в расписании повесить событие на выскакивание окошка с кодом, чтоб не караулить его у компа.
Автор: AndreySh
Дата сообщения: 12.06.2006 13:22
<удалено>
Автор: Gimlei
Дата сообщения: 12.06.2006 14:05
Пришли в голову две идеи:
1) Несмотря на то, что символы могут быть разного размера, тем не менее, площадь, занимаемая пискселями символа, должна укладываться в определенные границы.

Таким образом, учитывая то, что символы на рапиде пока что (тьфу-тьфу) одного цвета, можно предложить следующий алгоритм: считать, какую площадь занимают пикселы цвета X, если площадь попадает в допустимые рамки - вырезать данный символ и пробовать распознать.

2) Если предыдущий способ не прокатит - можно попробовать обобщение предложенного: вырезать все участки картинки одинакого цвета, и пытаться их распознать. При этом, поскольку алгоритм генерирует очевидно векторные "рюшечки", то они должны быть правильной формы, т.е. можно относительно просто написать алгоритм распознавания сектора овала, и отличать их от символов.

Да, и ещё - любой алгоритм нужно на чем-то обкатывать. Dimoniusis, нужно ли тебе для удобства тестирования кучу captcha с рапидшары? Одному их собирать - дело нудное, а если каждый читающий форум по 3-5 штук зальёт - то можно набрать солидную базу.
Автор: Dimoniusis
Дата сообщения: 12.06.2006 14:08
Gimlei спасибо... у мя есть мелкий файл на нем я уже штук 20 капчей собрал за 5 минут

Ладно подумаем...
Автор: terminat0r
Дата сообщения: 12.06.2006 15:11
Dimoniusis
Вот еще каптчей если надо
_http://rapidshare.de/files/22858899/CAPTCHI.rar.html
Если разработка будет успешна, то будешь обязан этот алгоритм запатентовать
Автор: UriF
Дата сообщения: 12.06.2006 20:28

Gimlei

единственно, если символы накладываются друг на друга...
проблема отделения символа от фона...
может, создать 2 (или 3) графических файлов одного цвета и уже их распознавать?

SergFM
извиняюсь, что это флэйм, но мы живем в разных часовых поясах (~8 часов), а я (если мне это надо) запускаю все эти сервисы с домашнего компа на ночь, так что ...
Автор: vkramnik
Дата сообщения: 12.06.2006 21:40
Gimlei
У меня есть возражения по Вашему предложению :

Цитата:
1) Несмотря на то, что символы могут быть разного размера, тем не менее, площадь, занимаемая пискселями символа, должна укладываться в определенные границы.

Это верно, а вот дальше...

Цитата:
Таким образом, учитывая то, что символы на рапиде пока что (тьфу-тьфу) одного цвета, можно предложить следующий алгоритм: считать, какую площадь занимают пикселы цвета X, если площадь попадает в допустимые рамки - вырезать данный символ и пробовать распознать.

А если на другом участке картинки нарисована мусорная фигня ТЕМ ЖЕ цветом Х ???


Цитата:
2) Если предыдущий способ не прокатит - можно попробовать обобщение предложенного: вырезать все участки картинки одинакого цвета, и пытаться их распознать.

Это тоже почти верно - только зачем пытаться распознавать явный мусор ?
В принципе, у фирмы Борланд, кажется, еще лет ...цать назад, в ее графической библиотеке BGLIB (если не путаю) к компилятору Turbo-C++ v1.0 имелся некий алгоритм заливки площадей, основанный на попадании точки определенного цвета внутрь области того же цвета и с определением границ области (по другому цвету пикселей).


Цитата:
При этом, поскольку алгоритм генерирует очевидно векторные "рюшечки", то они должны быть правильной формы, т.е. можно относительно просто написать алгоритм распознавания сектора овала, и отличать их от символов.

Отнюдь не факт, что алгоритм генерирует именно векторные рюшечки...
По крайней мере, у меня за вчера и сегодня на картинках появлялся явно не векторный мусор, а как бы некий "шумовой", я бы сказал...

Так что, все в руках уважаемого Dimoniusis-a
Автор: Gimlei
Дата сообщения: 12.06.2006 22:10
Не уверен, насколько уместно обсуждение алгоритмов распознавания каптчей в этом топике, но раз модераторы не ругаются, то я продолжу

UriF

Цитата:
единственно, если символы накладываются друг на друга...


Пока что не нашёл ни одной каптчи, где это происходит. Соприкосновения есть, но наложения - не видел.

vkramnik

Цитата:
А если на другом участке картинки нарисована мусорная фигня ТЕМ ЖЕ цветом Х ???


Принимается. Тогда нужно немножко добавить: какую площадь занимают пикселы цвета X, соприкасающиеся друг с другом. Т.е. считать площадь "фигур", где "фигура" - это точки одного цвета, соприкасающиеся друг с другом.


Цитата:
Это тоже почти верно - только зачем пытаться распознавать явный мусор ?


Не понял. Предложите тогда алгоритм, по которому вы определяете, что такое "явный мусор".

По поводу векторных/не векторных рюшечек: я ни на одной новой рапидовской каптче ещё не видел "не-векторных" рюшечек. Киньте тогда ссылку на "шумовой" мусор.
Автор: TheBlackAngel
Дата сообщения: 12.06.2006 22:20

Цитата:

Цитата:
Таким образом, учитывая то, что символы на рапиде пока что (тьфу-тьфу) одного цвета, можно предложить следующий алгоритм: считать, какую площадь занимают пикселы цвета X, если площадь попадает в допустимые рамки - вырезать данный символ и пробовать распознать.

А если на другом участке картинки нарисована мусорная фигня ТЕМ ЖЕ цветом Х ???


цвет символов разный. точнее изначально они одноцветные но после того как туда накладывается мусор цвет отдельных участков отличается весьма значительно. а вот мусор и символы абсолютно идентичные по цвету действительно встречаются


Цитата:
имелся некий алгоритм заливки площадей, основанный на попадании точки определенного цвета внутрь области того же цвета и с определением границ области (по другому цвету пикселей).


есть несколько алгоритмов определения границ области. те из них которые мне известны легко реализуются при наличии четкого критерия определения границ. вот сформулировать бы этот критерий для нашего случая.......


Цитата:

Цитата:
единственно, если символы накладываются друг на друга...

Пока что не нашёл ни одной каптчи, где это происходит. Соприкосновения есть, но наложения - не видел.

+1

Dimoniusis
я тут попробовал мух от котлет отделить:

левота конечно получилась, но есть кое-какие задумки по алгоритму. если заинтересует то пиши в пм.
Автор: UriF
Дата сообщения: 12.06.2006 22:27
АБСОЛЮТНО ТЕМ ЖЕ цветом фон и символы быть не могут, хотя бы потому, что на компе, различающем 65500 цветов, каждый цвет - это ничто иное, как некое число (напр. в VB6, если Вы используете цветовую палетку, то каждому цвету соотв. число типа long integer, по-моему такое implementation во всех Microsoft compilers)
Автор: TheBlackAngel
Дата сообщения: 12.06.2006 22:54

Цитата:
Не уверен, насколько уместно обсуждение алгоритмов распознавания каптчей в этом топике, но раз модераторы не ругаются, то я продолжу


Давайте продолжим тут дабы не засорять тему.

molann ups ))
Автор: molann
Дата сообщения: 12.06.2006 23:05
TheBlackAngel, клевая ссылка, поправь куда хотел.
Кинь туда свой образец, уже оч даже неплохо.
Автор: ns56
Дата сообщения: 13.06.2006 02:49
Ни кто не встречался со след. проблемкой на depositfiles и как ее решить.

Начал качать и остановил..вотом возобновил и теперь depositfiles пишеь что с IP качают, хотя ничего не качается..


Автор: Sish
Дата сообщения: 13.06.2006 04:30
ns56

Цитата:
Начал качать и остановил

сабжем?
Автор: UriF
Дата сообщения: 13.06.2006 06:57
ns56

у меня была подобная проблема - скормил ссылку во FlashGet, он скачал, а далее - Вы скачаваете с IP. Скормил USDownloader proxy list и un-check (как для rapidshare) качать в обход IP
Автор: KChernov
Дата сообщения: 13.06.2006 14:17
Dimoniusis
Скачал последнюю версию - теперь в случае, если скачать не удалось, в Статусе остается Получение ссылки...
Пробовал на версии рапидшаровского плагина без распознавания.
Автор: Sish
Дата сообщения: 13.06.2006 14:29
Dimoniusis
Ну что, пока попытки одолеть злобные нововведения на Рапиде не увенчались успехом?
Автор: Dimoniusis
Дата сообщения: 13.06.2006 17:06
Sish идеи есть, вроде что-то получается
Автор: SlavaMSK
Дата сообщения: 13.06.2006 17:52
filepost.ru
Автор: Dimoniusis
Дата сообщения: 13.06.2006 17:56
SlavaMSK ага. Ну я с ними по почте этото вопрос выяснил
Автор: liudnux
Дата сообщения: 13.06.2006 17:56
А такое видели?:

http://i6.tinypic.com/14abpki.png

Им уже нехватает 3 букв...
Автор: AndreySh
Дата сообщения: 13.06.2006 18:50
liudnux
А мне кажется что там они имели в виду 3 буквы, а палка справа - геом. фигура. Просто по недосмотру оказалась похожа!
Автор: liudnux
Дата сообщения: 13.06.2006 19:06

Цитата:
А мне кажется что там они имели в виду 3 буквы, а палка справа - геом. фигура


Так и есть... потом вспомнил, что у них I не просто палочка.

Да теперь с этой рапидой и глаз ошибается, интерестно, удастся ли Dimonius'у все таки ее обмануть
Автор: Yuk
Дата сообщения: 13.06.2006 19:40

Цитата:
Да теперь с этой рапидой и глаз ошибается

Ну, на 100% и раньше не получалось, ничего страшного. Будет хотя бы 50% правильного распознавания - уже лучше, чем ручками вводить. Так что ждем-с.
Автор: SlavaMSK
Дата сообщения: 13.06.2006 21:20
Dimoniusis Видел? Читал? Пробывал? Какие мысли будут?
Автор: AndreySh
Дата сообщения: 13.06.2006 21:27
Что значит
Цитата:
Какие мысли будут?
Через время Dimoniusis выпустит свой вариант (хотя, может Александр поделится своим алгоритмом отсеивания)
Автор: SlavaMSK
Дата сообщения: 13.06.2006 21:33
AndreySh
Александр может в очередной раз на очередной сайт послать, а не алгоритмом поделиться.
Автор: Dimoniusis
Дата сообщения: 13.06.2006 22:14
AndreySh очень сомневаюсь. Да и срабатывет он у него на 10-15 раз только.

у меня почти сделана моя реализация
Автор: Dmitriy05
Дата сообщения: 13.06.2006 22:17
Если в логах такая запись

"13.06.2006 23:14:31 Плагин вернул ошибку: "Server return: All download slots assigned to your country are in use. Please try again later." "

То файл в ближайшее время USD`ом не скачаешь? (автоплагин)
Автор: SlavaMSK
Дата сообщения: 13.06.2006 22:23
Dmitriy05 Опции --> Pазное --> Юзер Агент такую строчку впиши:
Код: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Alexa Toolbar)

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133

Предыдущая тема: Shtirlitz (Штирлиц)


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.