Ru-Board.club
← Вернуться в раздел «Программы»

» Universal Share Downloader

Автор: KireevSasha
Дата сообщения: 21.12.2006 14:22
Vulcanite
В том сборнике что я выложил Gocr вообще не обучен на эти картинки, оптому нада собрать картинки и переучить. но все равно у него возможностей кк обучению меньше чем у Abbyy Finerader и сидеть с ним гораздо муторней, клавишь больше нажимать нада, вопросов он больше задает и даже к концу 3 сотни все равно переспрашивает почти все картинки - а воодить 1200 символов меня ломает, честно.

С FinerReader куда проще - он обучается уже и через 50 картинок, с ним проще и сам поцесс обучения и все такое. И эффект куда лучше.

sumchanin_Yuri
valhalla
У меня вообще такого нет. Тем более в таком количестве.
Может картинки не чистяться Finereader получает вместе с фоном (кучей мелких символов фона) - проверь файлик Rapidsharecom.bmp

Автор: C0USIN
Дата сообщения: 21.12.2006 14:27
sumchanin_Yuri
Создал язык rapidcaptcha? В нем нет таких символов.

valhalla
Нужен, чтобы накапливать картинки если захочешь потом обучить распознавалку.
Автор: andrew_al
Дата сообщения: 21.12.2006 14:31
база для gocr
распознавание далеко не стопроцентное (несмотря на обучение более чем по 1000 картинок)

http://www.upload.com.ua/get/425553975/

P.S. убрал из опций m 258 вроде бы нормально более менее рабтает...
Автор: sumchanin_Yuri
Дата сообщения: 21.12.2006 14:49
C0USIN

В том то и дело, все было сделано по инструкции, язык создал, даже чуть-чуть доучил finereader, но вот толи параметр rapidcaptcha не передается через bat-файл, то ли что-то ещё не так. Но тогда почему если просто запустить сам батовский файл, в буфере обмена все становиться нормально?

Добавлено:
KireevSasha

картинки чистятся, так что дело в чем-то другом?!
Автор: DVall
Дата сообщения: 21.12.2006 14:57
Dimoniusis
Есть маленький просьб.
Если меняется плугин, не всвязи с изменением картинки или исправлением известных багов, куда нибудь пулять инфу.
Вот он сегодня поменялся, чаму?
Автор: Lennonenko
Дата сообщения: 21.12.2006 15:25
DVall
э-э-э, а автоапдейта тебе мало?
Автор: KireevSasha
Дата сообщения: 21.12.2006 15:39
DVall
Сегодня сменилась версия с 18.5 до 18.6
Я попросил добавить проверку на правильность кода вообще
Скажем если распонзнавалка вернула код K^6 он заведомо не может быть верным.По
тому плагин делает проверку кода - если он из 4 символов и все символы назодться в списке 0123456789ABCDEFGHIJKLMNPRSTUVWXYZ тогда продолжаем работу если нет - тогда бросаем это соединение и идет по новой - опять тянем страничку, картинку - распознаем и т.д.
Автор: C0USIN
Дата сообщения: 21.12.2006 15:45
Это давно уже просили
Автор: andrew_al
Дата сообщения: 21.12.2006 15:51
KireevSasha
а если завтра цифр станет 5?
может и стоит такое сделать но тогда надо переходить на модульность плагина (типа распознающая часть, проверочная часть и т.д.)
Автор: Alex_Lost
Дата сообщения: 21.12.2006 15:58
Бросьте, пожалуйста, рабочий батник для запуска варианта с GOCR.
Тот, который прописывать в USdownloader.ini.
Считаем, что с путями я разберусь и база для GOCR уже скачана по приводившейся ссылке.
Можно прямо сюда, если там несколько строк.
Автор: Dimoniusis
Дата сообщения: 21.12.2006 16:00
andrew_al дык по рапиде мы так и перешли. Ибо в формате плага только я пишу, другие не берутся, а для внешних прог есть время у Саши и EHZ, за что им огромное спасибо
Автор: qpola
Дата сообщения: 21.12.2006 16:03
Alex_Lost

Цитата:
Бросьте, пожалуйста, рабочий батник для запуска варианта с GOCR.

ocr.bat

Код: call start /wait F:\USDownloader\antirap\usd.exe RapidShareCom.jpg RapidShareCom.bmp
call F:\USDownloader\antirap\recognize.cmd
Автор: cne
Дата сообщения: 21.12.2006 16:12
valhalla у тебя FineOCR.bat должен быть такой
Цитата:
cd c:\USDownloader
start /wait USD.exe RapidShareCom.JPG RapidShareCom.bmp
"c:\Program Files\ABBYY FineReader 8.0 Professional Edition\fineocr.exe" "C:\USDownloader\RapidShareCom.bmp" /lang rapidcaptcha /send clipboard /optionsfile usd.fbt
про start /wait не забудь

KireevSasha usd.exe у меня падал потому, что в строке
Цитата:
start /wait USD.exe RapidShareCom.JPG RapidShareCom.bmp
был пробел после bmp, типа, пробелы по краям параметров обрежь, если не трудно
Автор: sumchanin_Yuri
Дата сообщения: 21.12.2006 16:19
C0USIN
KireevSasha

Фуф, вытирая пот с лоба - ура, удалось получить результат - поставил пути короткие и явно прописал путь до usd.fbt

start /wait d:\usd\USD.EXE RapidShareCom.jpg RapidShareCom.bmp
start /wait C:\PROGRA~1\ABBYYF~1.0PR\FineOCR.exe RapidShareCom.bmp /lang rapidcaptcha /send clipboard /optionsfile d:\usd\usd.fbt

Теперь заработало..

Большое всем спасибо, может ещё кому-нибудь поможет в разрешении задач.
Автор: Alex_Lost
Дата сообщения: 21.12.2006 16:20
qpola
и современную начинку вот этого, плиз

Цитата:
recognize.cmd

Автор: qpola
Дата сообщения: 21.12.2006 16:22
Alex_Lost

Цитата:
и современную начинку вот этого, плиз

recognize.cmd

Код: :@echo off
set PP=%~d0%~p0
set PU=F:\USDownloader\
pushd %PP%
for /F "tokens=1,2,3 delims=. " %%i in ('%PP%date_.exe +%%m%%d%%H%%M%%S') do set TMPNAME=sampl%%k%%j%%i
copy "%PU%RapidShareCom.bmp" %PP%data\%TMPNAME%.bmp 2>&1 1>nul

%PP%alchlong %PP%data\%TMPNAME%.bmp %PP%tmp.pbm -k -o -b
del /q %PP%tmp.txt 2>&1 1>nul
%PP%gocr.exe -i %PP%tmp.pbm -o %PP%tmp.txt -m 258 -C 0-9A-NP-Z -v 63 2>%PP%data\%TMPNAME%.log
for /F "tokens=1,2,3,4,5,6,7,8,9,10 delims=_. " %%a in ('type %PP%tmp.txt') do set TMPCODE=%%a%%b%%c%%d%%e%%f%%g%%h%%i%%j
copy %PP%tmp.txt %PP%data\%TMPNAME%.txt 2>&1 1>nul
%PP%nircmdc clipboard clear
%PP%nircmdc clipboard set %TMPCODE%
popd
Автор: andrew_al
Дата сообщения: 21.12.2006 16:25
qpola
в примере не вижу вызов usd.exe
Автор: DVall
Дата сообщения: 21.12.2006 16:25
2qpola
Ты уж определись или call или start а то так слишком уж.
Автор: qpola
Дата сообщения: 21.12.2006 16:26
andrew_al

Цитата:
в примере не вижу вызов usd.exe


Цитата:
call start /wait F:\USDownloader\antirap\usd.exe RapidShareCom.jpg RapidShareCom.bmp


Добавлено:
DVall

Цитата:
Ты уж определись или call или start а то так слишком уж.

Так ведь работает...
Автор: serGAN
Дата сообщения: 21.12.2006 16:50
По-хорошему распознавалку надо на модули разбить
очищение
разбиение на части
разворот
распознаване, ну или как получается
+ при изменение картинки, можно обновить 1 или несколько частей,
не надо плясать с 0
можно эти модули прикрутить к другим сервисам
мега - распознавание
и-фолдер - расчлинение, разворот и распознавание и т.д по необходимости
- ? х/з
но это так мысли, возможно алгоритм USD.EXE не позволяет этого, или жёстко привязан, к нашей ненаглядной рапидушке
Автор: Vulcanite
Дата сообщения: 21.12.2006 16:59
KireevSasha

Цитата:
меня ломает, честно

да это и не надо........мне синтаксис......
чо я там намудрил то?
Автор: Gimlei
Дата сообщения: 21.12.2006 17:12
Рапида побеждена.
Связка USDownloader + FineReader + комплект батников и настроек от KireevSasha работают как часы.

Спасибо огромное всем.
Автор: qpola
Дата сообщения: 21.12.2006 17:27
Gimlei

Цитата:
Рапида побеждена.
Связка USDownloader + FineReader + комплект батников и настроек

Ага. Отличный наборчик ~50 Mb добра, чтобы качать с одной Рапиды...
Автор: sumchanin_Yuri
Дата сообщения: 21.12.2006 17:33
qpola

Ваши предложения!!!

В остальном конечно трудно не согласиться, поскольку везде приходится мучиться!!! Мне то finereader по-любому надо, а вот многим это только лишняя морока.. Чем больше предложений, тем лучше.
Автор: vengeance
Дата сообщения: 21.12.2006 17:41
qpola

Собственно, тебя никто не заставляет качать и юзать эти 50 мег.
Автор: Karlo Daddy
Дата сообщения: 21.12.2006 17:42
подскажите,для чего usd.ini?
я в нем путь к FR не прописывал, но все работает.
В каких случаях его применять?
Автор: qpola
Дата сообщения: 21.12.2006 17:45
vengeance

Цитата:
Собственно, тебя никто не заставляет качать и юзать эти 50 мег.

А собственно его (FR) и не юзаю... Мы с gorc дружим...
Автор: andrew_al
Дата сообщения: 21.12.2006 17:49
qpola
+1
Автор: KireevSasha
Дата сообщения: 21.12.2006 17:50
Karlo Daddy

usd.ini - в сборку значит попал случайно
Он не нужен - так пережитки прошлого.
Можешь удалить если именно usd.ini а не USDownloader.ini
Автор: vengeance
Дата сообщения: 21.12.2006 17:55
Никто с OmniPage не пробовал? Он вроде умеет сохранять в текстовик.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172

Предыдущая тема: Advanced Vista Codec Package


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.