Captcha Exchange Server Вобщем-то несколько моих последних бессонных ночей вылились в продукт жизнедеятельности программиста
под названием Captcha Exchange Server.
Вобщем-то идея не нова, не раз высказывалась в разных вариантах здесь на форуме. Обычно эти разговоры начинаются тогда, когда происходит резкая смена старых устоев (картинок или хтмл-кодов) и у всех начинается паника
"А как же дальше качать?"
Я так думаю, теперь этой проблемы стоять не будет
Т.е. какие бы хитровыверченные картинки файлообменники не придумали - у нас есть средство разделить территориально процесс распознавания.
Вкратце:
- реализована нормальная система биллинга, юзер за распознавание чужих картинок получает очки и тратит их на распознавание своих.
- картинки имеют разную "ценность" - картинка, распознанная в "час пик" (когда очередь картинок большая, а людей мало) ценится гораздо больше, чем когда наоборот. По идее, это должно как-то регулировать потоки
- сервер написан на php и mysql, 50к кода
- клиент включен на данный момент внутрь плагина RapidShareCom.plg (не увеличив его размер принципиально), а можно включить и в другие плагины типа ифолдера - в принципе, серверу пофигу, откуда эти картинки - с рапиды или с авангарда
- мы сами выбираем (уже из трех вариантов), как нам распознавать:
1. Ввести вручную, 2. Запустить внешнюю распознавалку 3. Обратиться к серверу.
Можно конечно и вообще увязать все в общий вариант - но, к сожалению, рапида дает всего одну попытку.
- если кто-то ввел неправильный код - плагин распознает эту ситуацию и "стучит" на сервер - и с распознавателя снимаются штрафы в пользу пострадавшего
Есстественно, использование сервера - не идеальный вариант - кому-то удобнее распознавать Файнридером. Ну а кому-то и нет
А кто-то не может ничего настроить
По крайней мере, это поможет решать вопрос, когда картинки совсем дохлые
А заодно собирать коллекцию картинок с точным соответствием правильных кодов (!) для последующего обучения распознавалки.
Ну ладно, это все лирика
1. У меня все отлажено, но могут быть ошибки при реальной работе. Поэтому прежде, чем выпускать на волю это создание, надо его оттестировать малой группой
Нужно несколько человек, которые не будут сильно обижаться, если вдруг с них будут сниматься лишние очки или происходить какие-то ошибки
Я дам код приглашения, инструкцию по настройке и мы некоторое время его погоняем.
2. Хостинг. У меня сегодня еще не решен этот вопрос (нет прав на запись картинок, залитых извне), видидмо только завтра.
Я-то оттестировал на своем сервере, но он рухнет под нагрузкой
Поэтому ждем еще день-два нормальный хостинг.
Вроде все, пора спать
P.S. Может быть рапида увидит, что нам любые каптчи ни по чем и перестанет их менять?
Тоже результат
Добавлено: Кстати, вот пример реально лога:
Код: ...
05.03.2007 03:08:55 ==== RapidShareCom.plg from DVK (ICQ 9860399), version 0.06 (04.03.2007) ====
05.03.2007 03:08:55 GET URL: <http://rapidshare.com/files/18498060/Fundamentalnie.algoritmi.na.Cpp.P.5.2002.rar>
05.03.2007 03:08:56 File D:\USDownloader\RapidShareComLink1.html saved.
05.03.2007 03:08:56 First POST sublink found:
http://rs35.rapidshare.com/files/18498060/Fundamentalnie.algoritmi.na.Cpp.P.5.2002.rar 05.03.2007 03:08:56 File D:\USDownloader\RapidShareComLink2.html saved.
05.03.2007 03:08:56 Non-unescaped string found. Try to unescape...
05.03.2007 03:08:56 File D:\USDownloader\RapidShareComLink3.html saved.
05.03.2007 03:08:56 Download action link found:
http://rs35l33.rapidshare.com/files/18498060/2405703/Fundamentalnie.algoritmi.na.Cpp.P.5.2002.rar 05.03.2007 03:08:56 Captcha image found:
http://rs35.rapidshare.com/access2405703.jpg 05.03.2007 03:08:56 Found download ticket delay timer, waiting for: 38 sec.
05.03.2007 03:09:35 GET URL: <http://rs35.rapidshare.com/access2405703.jpg>
05.03.2007 03:09:35 File D:\USDownloader\RapidShareCom.jpg saved.
05.03.2007 03:09:35 Nick = <TEST>, pass = <xxxxxxxxxxxx>
05.03.2007 03:09:35 PostInetStream return = Ok
05.03.2007 03:09:35 Capthca exchange server answer: _ok001; Captcha is loaded with ID(63), your balance (153), please wait recognition...
05.03.2007 03:09:35 CaptchaID = <63>, waiting for recognition...
05.03.2007 03:09:50 1. Receive: _ok003; There are 2 activity users and 1 captchas in order. Waiting...
05.03.2007 03:10:05 2. Receive: _ok003; There are 2 activity users and 1 captchas in order. Waiting...
05.03.2007 03:10:20 3. Receive: _ok003; There are 2 activity users and 1 captchas in order. Waiting...
05.03.2007 03:10:36 4. Receive: _ok005; Captcha was send to user "DVK" 5 seconds ago and still it has not been recognised. Waiting...
05.03.2007 03:10:51 5. Receive: _ok005; Captcha was send to user "DVK" 20 seconds ago and still it has not been recognised. Waiting...
05.03.2007 03:11:06 6. Receive: _ok002; AccessCode(93gw), price 1 point, recognized "DVK" 6 seconds early, balance (152).
05.03.2007 03:11:06 Captcha access code is <93gw>, apply to link...
05.03.2007 03:11:06 Parsing networks links...