Ru-Board.club
← Вернуться в раздел «Программы»

» Universal Share Downloader

Автор: Yourbill
Дата сообщения: 19.12.2006 17:09
Dmitriy05

Цитата:
Новый подарок от рапидщары

А в чем новизна??? Вроде уже скоро сутки будут как эта картинка появилась.
Автор: shultz555
Дата сообщения: 19.12.2006 17:24
KireevSasha

чё та у меня не распознает код полностью
то 2 то 3 буквы
в чём дело?
Автор: DStar
Дата сообщения: 19.12.2006 17:31
Обучать, однако, надо.
Автор: shultz555
Дата сообщения: 19.12.2006 17:35
DStar

как ??? плиз подскажи
Автор: DVall
Дата сообщения: 19.12.2006 17:39
Да ничего не надо, все работает.
Правильно настройте ФР.
Автор: Cers
Дата сообщения: 19.12.2006 17:40
KireevSasha

Не рулить, однако.
Автор: qpola
Дата сообщения: 19.12.2006 17:42
shultz555

Цитата:
как ??? плиз подскажи

http://forum.ru-board.com/topic.cgi?forum=5&topic=21567&start=800#18
Автор: shultz555
Дата сообщения: 19.12.2006 17:48
Dimoniusis

Цитата:
Получаем обновленный вариант USD.exe
http://dump.ru/files/2/2818326425/

Принцип работы старый
- берем файл Rapidsharecom.jpg
- ообрабатываем его по всем правилам (чистим, крутим)
- сохраняем в RapidsharecomR.bmp

Дальше за дело берется Gocr или Finerader
Ниакаих .NET и всего прочьего для работы не требуется. У всех у кого работало раньше, должно работать и сейчас.

И для полноты картины
Моя папка USDownloader, которая у меня находится в корне C:\
http://dump.ru/files/7/7319911478/
Плагин обновлен до 18.5, хотя и с 18.1 все работает на ура.


не катитраспознает то 2 то 3 буквы и все

Автор: Yuk
Дата сообщения: 19.12.2006 17:50
Я тоже только что проснулся.
Скачал последнюю сборку от KireevSasha.
По умолчанию настроено на gocr, распознавало только 2-3 символа.
В OCR.bat раскомментировал строку с файнридером и закомментировал с gocr'ом. Теперь пашет за милую душу без всякого обучения.
KireevSasha, спасибо!
Автор: KireevSasha
Дата сообщения: 19.12.2006 17:56
Потому всем желающим настроить USDownloader и Gocr/Finereader делаем следующее
1. Если еще не скачали, качаем Universal Share Downloader v 1.3.4 Beta 8 отсюда http://www.dimonius.ru/dusd.php (c) Dimoniusis
2. Во избежание всяческих недоразумений по поводу путей с пробелами и т.д. Universal Share Downloader v 1.3.4 Beta 8 ставим в папку C:\USDownloader\
Если Вы понимаете что делаете и можете сами поправить файлы конфигураций – устанавливайте в любую папку и правьте пути в соответствии с Вашим выбором.

ABBY Finerader
3. Если планируется работа с системой ABBYY Finerader - его необходимо установить, зарегистрирова и активировать.
Скачать полный комплект можно отсюда.
тут и тут только пилюля для удобной и безпроблемной работы

4. Далее необходимо провести настройку ABBYY Finerader. Подробная иснтрукция лежит тут. (c) C0USIN
5. В кратце - необходимо добавить пользовательский язык rapidcaptcha и обучить Finerader на наборе картинок.
6. Мой usd.fbt файл-результат обучения лежит тут http://dump.ru/files/8/8004058190/ (c) KireevSasha

Gocr
3. Для работы с системой распознавания Gocr качаем набор Antirap для распознавания файлов отсюда http://webfile.ru/1239616 (c) bormoglot & Andrew
4. Содержимое архива (папку Antirap) распаковуем в папку C:\USDownloader\
5. В файле C:\USDownloader\Antirap\recognize.cmd исправляем путь к программе на наш C:\USDownloader\
Для этого открываем на редактирование файл recognize.cmd и находим там строку set PU=I:\Inet\Downloads\USDownloader\ и заменяем ее на set PU=C:\USDownloader\
6. Аналогично в файле C:\USDownloader\Antirap\collect.cmd исправляем путь к программе на наш C:\USDownloader\
Для этого открываем на редактирование файл collect.cmd и находим там строку set PU=I:\Inet\Downloads\USDownloader\ и заменяем ее на set PU=C:\USDownloader\

7. Находим файл USDownloader.ini, который должен находиться в папке C:\USDownloader\. Если его нет – тогда запустите USDownloader.exe, обновите плагины и закройте программу – будет создан файл USDownloader.ini с настройками по умолчанию. В нем (USDownloader.ini) находим секцию [Plugin_rapidshare.com] и заменяем ее такой

[Plugin_rapidshare.com]
NetworkNum=0
WaitTime=1
RecogniseCMD=""C:\USDownloader\FineOCR.bat""


8. Сохраняем файл USDownloader.ini и качаем прогу USD.exe отсюда http://dump.ru/files/2/2818326425/ (c) KireevSasha
Прога не требует никакх .NET и т.д. и умеет очищать картинку и поворачивать символы для удобного распознавания. Для удобного использования я создал BAT файл FineOCR.bat, в котором запускается программа USD.exe и за ней одна из систем распознавнания.
call USD.EXE
"c:\Program Files\ABBYY FineReader 8.0 Professional Edition\fineocr.exe" "C:\USDownloader\RapidShareComR.bmp" /lang rapidcaptcha /send clipboard /optionsfile usd.fbt
rem call "C:\USDownloader\Gocr\recognize.cmd"


Сейчас файл настроен на вызов FinerReader, если есть необходимость его перенастроить - можно заккоментировать вторую строку и убрать коммент с третей. Тут нужно учитывать, что имя файла, в котором храниться очищенная картинку RapidsharecomR.bmp, в то время как recognize.cmd ищет Rapidsharecom.bmp - потому нужно или подправить recognize.cmd или удалять файл Rapidsharecom.bmp и переименовывать RapidsharecomR.bmp в Rapidsharecom.bmp. Тогда BAT файл примет вид
call USD.EXE
rem "c:\Program Files\ABBYY FineReader 8.0 Professional Edition\fineocr.exe" "C:\USDownloader\RapidShareComR.bmp" /lang rapidcaptcha /send clipboard /optionsfile usd.fbt
Echo Yes | Del Rapidsharecom.bmp
rename RapidsharecomR.bmp Rapidsharecom.bmp
call "C:\USDownloader\Gocr\recognize.cmd"


Gocr
9. Качаем набор картинок для обучения распознавалки отсюда http://dump.ru/files/6/613454445/ (c) KireevSasha
Содержимое архива 870 файлов BMP распаковуем в папку Data, которая расположена в C:\USDownloader\Antirap\
10. После того как распаковали файлы запускаем файл C:\USDownloader\Antirap\learn.cmd
Это начнет процесс обучения. Система распознавания будет пытаться распознать сброшенные ей картинки и при когда будет сомневаться – выбрасывает на экран текстовое изображение картинки (символами изображая вид подозрительного символа). Нудно ввести с клавиатуры тот символ, на котором сомневается программа. И дальше система спросить, что делать с полученной информацией – нужно ввести цифру 2, которая скажет ей, что необходимо занести это в базу (которую потому она сама будет использовать при распознании уже новых картинок для скачивания файлов)
11. Когда все файлы будут пройдены и процесс обучения закончиться – считаем что все готово и можно приступать к работе.
Вместо пунктов 10-11 можно взять мою базу. Хотя ввиду малого количества картинок работает она явно хуже FinerReader ( http://dump.ru/files/9/983487334/ ) (c) KireevSasha

12. Запускаем USDownloader.exe и загружаем файлами очередь и ждем. Для начала можно таки поглядеть в лог и проследить все ли распознается….
В логе "интересными должны быть строки вида"
17.12.2006 20:17:48 Rapidshare: Download Code Image: "http://ul43.rapidshare.com/access4458304.jpg" to "c:\USDownloader\RapidShareCom.jpg"
17.12.2006 20:17:48 GET URL: http://ul43.rapidshare.com/access4458304.jpg

17.12.2006 20:17:54 Rapidshare: AccesCode="91HS"
17.12.2006 20:17:54 Ссылка: http://dl43cg2.rapidshare.com/files/7310884/4458304/kart_fokusy.part1.rar?accesscode=91HS
17.12.2006 20:17:54 Ожидание на включение Download Ticket

Если все выглядит примерно так, то все ок. Главное, что б в строке Rapidshare: AccesCode="91HS" было 4 символа в распознанном коде и они соответствовали тем, что изображены в файле Rapidsharecom.jpg, который находиться в папке C:\USDownloader и постоянно обновляется тем, что получен от Rapidshare.com в качестве кода на скачивание, который мы столько времени более-менее успешно обходим.

Вот и все.
Думаю детальней некуда….

================================================================================

Кому в облом читать все это / разбираться в этом / не хватает времени / интелекта и т.д.
Качаем отсюда http://dump.ru/files/7/7319911478/ то что получиться в папке C:\USDownloader\
Содержимое архива распаковуем в корень C:\ и все - запускаем, все готово к употреблению и проверено лично....
Этот вариант работает с FineReader, так как у меня нет достаточного количества картинок и времени, что б обучить Gocr
На сотне картинок FinerReader ведет себя явно лучше чем Gocr и не глотает буквы и т.д.
А отключить перехват буфера у DownloadMaster для меня не большая проблема.

================================================================================

Всем желающим - собирать картинки формата JPG, которые выдает сервер Rapidshare.com и сохранять в укромном месте выкладывая их на форум (вернее на сервера обмена а на форум линки). Так можно будет быстро обучить FineOCR.
Для сбора картинок предлагаю такой вариант - создать файл Copier.bat и в него поместить такой вот код (с) Ka3ax

set SCHETCHIK=0
set /p SCHETCHIK=<schet
echo %SCHETCHIK%
type schet
set /a SCHETCHIK=SCHETCHIK + 1
echo %SCHETCHIK% > schet

copy "C:\USDownloader\RapidShareCom.BMP" "C:\USDownloader\BMP\%SCHETCHIK%.BMP"
copy "C:\USDownloader\RapidShareCom.JPG" "C:\USDownloader\BMP\%SCHETCHIK%.JPG"
copy "C:\USDownloader\RapidShareComR.BMP" "C:\USDownloader\BMP\%SCHETCHIK%_R.BMP"

Предварительно нужно создать папку BMP в папку C:\USDownloader если она еще у Вас не создана.
Если у Вас не включена работа по расписанию, то в файл USDownloader.ini добавить секцию

[Schedule]
item0_active=1
item0_day=0
item0_event=2
item0_time=0
item0_action=0
item0_actparam="C:\USDownloader\Copier.bat|3|0"


Если шедулер включен - тогда просто добавить задание на выполнение коммандного файла :\USDownloader\Copier.bat
каждый раз перед закачкой файла.
Все файлы (JPG и BMP будут сохраняться в папке BMP)
Автор: shultz555
Дата сообщения: 19.12.2006 18:00
Yuk

а для этого нужно поставить Finereader?
Автор: gu900
Дата сообщения: 19.12.2006 18:02
EZH, KireevSasha, благодарю!


Цитата:
не катитраспознает то 2 то 3 буквы и все

всё работает. правда, все 4 символа gocr распознал где-то с восьмой попытки. и почему бы не сделать следующий заход на картинку без попытки скачивания, если в распознанном тексте есть прочерки "_" (как об этом не раз говорили), не постигаю...
Автор: Dimoniusis
Дата сообщения: 19.12.2006 18:03
shultz555 написано же, что есть 2 метода - FineReader и GOCR. Какой тебе нужен - такой и гоняешь
Автор: PREVED
Дата сообщения: 19.12.2006 18:28
Вопрос отменяется. Уже сам разобрался.

P.S. Спасибо всем кто продолжает бороться с рапидой!
Автор: SlavaMSK
Дата сообщения: 19.12.2006 18:38

Цитата:
Gocr
3. Для работы с системой распознавания Gocr качаем набор Antirap для распознавания файлов отсюда http://webfile.ru/1239616 (c) tascam

Ну tascam ни какого авторства не имеет к Gocr, он только перекопировал пост из гостивой Димониуса. Первым его выложил bormoglot, а подкорректировал Andrew.

Ребята с рапиды сжалились и свой GOCR выложили:


Вообщем KireevSasha глянь, твоя не твоя. www.megaupload.com/de/?d=DF12CDEQ
Автор: shultz555
Дата сообщения: 19.12.2006 18:39
Dimoniusis
KireevSasha
через gocr работает ОЧЕНЬ ХРЕНОВА
обучил его заразу всем 870 картинкам а он из 30 раз распознал только 1 раз все 4 символа а так то 1 то 2 то 3 символа распознавал
хренова кароче

надо будет попробовать завтра с файнридером поиграться
Автор: Yuk
Дата сообщения: 19.12.2006 18:40
Dimoniusis
Проблема с Connection timeout. Выставлено 600 сек.
Качаю с filefactory. Попробовал через браузер, медленно, но работает.
USD выдает:
19.12.2006 11:32:53 GET URL: <http://www.filefactory.com/file/76bcce/>
19.12.2006 11:33:14 x GET Error: Connection timed out (Error #10060)
Всегда ровно через 21 сек.
Менял 600 на 6000, никаких изменений. Кстати, в ini изменения не появляются.
ОК, захожу в ini и правлю ConnectTimeout ручками. Все равно ждет только 21 сек.
Что делать?

shultz555
естественно
Автор: Dimoniusis
Дата сообщения: 19.12.2006 18:49
Yuk не то. Если бы было "GET ERROR: Timeout" - ТО настройка таймаута играла бы роль. А у тебя системнй таймаут - то есть винда говорит что сокет не работает, и тут прога не при чем.
Автор: KireevSasha
Дата сообщения: 19.12.2006 19:01
SlavaMSK

Цитата:
Вообщем KireevSasha глянь, твоя не твоя. www.megaupload.com/de/?d=DF12CDEQ

Моя - а что толку. Или ты вправду веришь что это чел с Rapidshare, зашел выучил русский и сидит тут следит за всеми перепетиями.
Им важен конечный результат - и в тонкости того как это будет получено оно, скорее всего не вникают, как уже заявлял Dimoniusis

Хотя - тут спорный вопров.

А по поводу ответа в гостей - я тоже могу написать что я Rapidshare и мыло у меня такое. Хоть Bill Gates.
Автор: wolfvt13
Дата сообщения: 19.12.2006 19:15
Автор: SlavaMSK
Дата сообщения: 19.12.2006 19:15
KireevSasha

Цитата:
Моя - а что толку

Радоваться этому надо.


Цитата:
Или ты вправду веришь что это чел с Rapidshare

Так же я верю в существование зелёных человечков и крылатоподобных ёжиков.


Цитата:
зашел выучил русский и сидит тут следит за всеми перепетиями.
Им важен конечный результат - и в тонкости того как это будет получено оно, скорее всего не вникают, как уже заявлял Dimoniusis

Я в своём сообщении не интересовался тем как рапидовцы выясняют "готово у них распозновалка или нет". Был задан простой и единственный вопрос, а ты мне столько лишнего накатал.
Автор: Vulcanite
Дата сообщения: 19.12.2006 19:20
KireevSasha
а почему ""C:\USDownloader\OCR.bat"" в двойных кавычках?
Автор: SlavaMSK
Дата сообщения: 19.12.2006 19:37
Vulcanite

Цитата:
а почему ""C:\USDownloader\OCR.bat"" в двойных кавычках?
ответ.
Автор: Dimoniusis
Дата сообщения: 19.12.2006 19:43
Vulcanite потому, что в INI могут тоже использоваться пробелы на концах. Чтобы с концов их не отсекало - параметры заключают в кавычки. А так как строка внутри сама содержит кавычки - то получается надо иметь 2 пары кавычек
Автор: esel
Дата сообщения: 19.12.2006 19:58
А megaupload в автомате появится?
Автор: KireevSasha
Дата сообщения: 19.12.2006 20:02
SlavaMSK
Ссори если что не так.
Просто мне показалось что ты шутишь

По поводу проги - да - быстро люди подхватывают.
Но мне то что, я не жадный Пока....

Все работает как часы - связка USDOwnloader -> USD.exe -> FineOCR.exe -> USdownloader.
Автор: 0pgm
Дата сообщения: 19.12.2006 20:43
Интересно что еще придумают. Предлагаю создать ветку "Спортивное распознавание RapidCaptcha".
Gocr работает нормально.
Автор: SlavaMSK
Дата сообщения: 19.12.2006 20:59
0pgm
В своё время создали ветку Алгоритм распознавания текста
Автор: Vulcanite
Дата сообщения: 19.12.2006 21:05
KireevSasha

Цитата:
Содержимое архива 870 файлов BMP распаковуем в папку Data

там нет столько файлов у меня всего 108
Автор: janatas
Дата сообщения: 19.12.2006 21:11
Люди, спасибо вам всем! Пришлось мне все пути править, конечно, под свои. Но ведь сразу запахало все. Я не ожидала, что все смогу так быстро настроить. СПАСИБО!!!

Добавлено:
Vulcanite

Цитата:
там нет столько файлов у меня всего 108

У меня то же самое и при разархивировании выдает, что неожиданный конец архива, видимо, побился он data.rar. Но все равно работает и с тем что есть.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172

Предыдущая тема: Advanced Vista Codec Package


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.