Ru-Board.club
← Вернуться в раздел «Программы»

» Распознавание речи (Speech Recognition) Горыныч / Диктограф

Автор: Infection
Дата сообщения: 18.06.2003 11:34
Программы распознавания речи


Распознавание речи

Название Статус Языки Обсуждение Поиск
Автор: KostiKL
Дата сообщения: 18.06.2003 20:11
Infection
Я могу привести тебе ряд программ, которые вроде бы распознают текст!
Многие из них лежат у меня на винте.
Но, делясь опытом, скажу что твоя затея - пустая трата времени!
В свое время я очень хотел провернуть что-то подобное для лекций преподов в ВУЗе, но увы ни фига не получилось!
Проги эти не дошли пока до того уровня чтобы вот так вот с ходу голос распознавать!
Распознают они, но с трудом, после долгого привыкания и если только им медленно выговаривать каждое слово!
Еще более менее сносно работают проги для голосового управления Виндовсом, дабы там набор слов ограничен... и одни не больно сложные!
В завершение приведу тебе все таки небольшой список:

Из нашиз бесспорный лидер на этом поприще прога ГОРЫНЫЧ (бери лучше версии из последних).
Из импортных более менее понравилась REALIZE VOICE - она единственная голос распознавала без особо долгого превыкания!
Ну еще куча других мало заметных!
Автор: ZAHAL
Дата сообщения: 18.06.2003 21:32
Infection

Цитата:
???ПРОГРАММА??? распознает текст и записывает его в файл.

В смысле текст сканированный в ауди?Или просто речь записать?
Автор: KostiKL
Дата сообщения: 19.06.2003 14:47
ZAHAL
Скзал же человек

Цитата:
распознает текст и записывает его в файл.



Добавлено
Хочет чтобы звук (голос) в буковки превращался... мда
Автор: Sorok
Дата сообщения: 19.06.2003 21:28
Удивительно. Создание хорошей проги для распознавания речи сродни созданию "Windows".
В любой конторе, не говоря уж о домашних заботах, ввод информации в комп занимает не мало времени.
Рынок - весь МИР.
Миллиарды зеленых и НИКТО не хочет серьезно этим заняться.
УДИВИТЕЛЬНО!!!
Прошу прощения за спам, наболело.
Может найдутся на этом форуме програмисты готовые заняться этим?
Автор: KostiKL
Дата сообщения: 20.06.2003 23:29
Sorok
Горы программистов занимаются этим...
Кстати, сам Мыхрософт замутил в этом буквально году создание таковой проги и якобы даже мы что-то из их творений увидим в ближайших версия ВыньДос!

А все что ты сказал - горькая правда, но что-то поделать с этим трудно...
Природу, брат, не обскачешь - человеческий голос это тебе не шухры мухры!

Сорри за оффтоп, тоже наболело!
Автор: Acerv
Дата сообщения: 26.06.2003 14:47
KostiKL
Доброе время суток!
Уважаемый KostiKL!

Цитата:
Я могу привести тебе ряд программ, которые вроде бы распознают текст!
Многие из них лежат у меня на винте.

Вот интересно - есть ли на указанном вами месте программы "Микросервис" или от фирмы 1С "Диктограф" (это одно и тоже, только названия разные).
Еще интересно узнать наличие программы "Горыныч Проф2".
Первые две программы по виду являются вроде бы руссифицированными аналогами упомянутой Вами англоязычных "ReadPlease 2003" от http://readplease.com или "Realize® Voice 4.0" от http://www.realizesoftware.com.
Недостатком их является то, что говорят и понимают только английскую речь, как и Dragon NaturallySpeaking 7, а достоинством, что в них включена функция распознования текстовой строки, что улучшает общее распознование речи. Так вот- такая же функция или нечто подобное сделано в "Микросервисе" от http://www.mstechnology.ru/instructions/lite/instruction.htm или от фирмы 1С "Диктограф", которая только сменила названия продукта.
Нет ли у вас этих программ - "Микросервис", "Диктограф", "Горыныч Проф2"?
И можно ли вести переговоры по поводу "поделится, если есть" или дать ссылку?
Развитие распознования русского языка, официально, на данный момент времени остановилось только на голосовых командах.
Спасибо
Автор: tumber
Дата сообщения: 26.06.2003 15:15
Acerv

Цитата:
И можно ли вести переговоры по поводу "поделится, если есть" или дать ссылку?

Можно, но в Варезнике
Там есть темы, посвященные этим программам, но самих программ вроде бы сейчас нет.
Темы ищутся по фильтру.
Автор: Acerv
Дата сообщения: 26.06.2003 16:45
tumber
Это понятно.
Но вопрос был KostiKLу
Автор: tumber
Дата сообщения: 26.06.2003 17:59
Acerv
Тогда sorry, что влез.
Автор: KostiKL
Дата сообщения: 26.06.2003 22:18
Acerv
Горыныч был похерен с винта буквально неделю назад за ненадобностью после очередной попытки выдавить из нее что-нибудь толковое!
Но при желании можно восстановить (в смысле достать)!


Цитата:
Dragon NaturallySpeaking 7

вот про эту прогу забыл, сорри в связи с этим!
Да английский она понимает супер, даже людей с кривым произношением - сам проверял! Неплохо было бы найти русский аналог!
Кстати неплохо понимает английский встроенный в Офис ХР движок - по крайней мере вопиющего безобразия не было, хоть и после долгих тренировок путем чтения биографии Билли Гейтса


Цитата:
Нет ли у вас этих программ - "Микросервис", "Диктограф", "Горыныч Проф2"?

Первых двух даже в руках не держал...
Хотя слышал не очень лестные отзывы о них!
Горыныч была единственной программой, которая вызвала хоть какое-то уважение.
К сожалению давно не искал новостей о ней... а надо бы!
В плане дать ссылку или поменяться - чем могу помогу!

А вообще все разработчики (в том числе "Майкрософт в России") твредят, что распознавать русскую речь значительно сложнее. чем английскую... так что ждать будем долго!
Тренируем пальчики!
Автор: Acerv
Дата сообщения: 26.06.2003 22:53
KostiKL
Спасибо за ответ.
У вас Горыныч Проф 2 был наверное версии Light, т.е. упрощенный? Сколько весит? Честно говоря по Горынычу 2 у меня подозрения, что там просто переделали 1-ый Горыныч для работы под Win 2000 (решили проблему с кодовой страницей).
А по поводу "Микросервис" и "Диктограф" мне ответили от1С, что Диктограф это Микросервис и круг замкнулся. А бывший работник Микросервис расказал, что "Микросервис" делали вместе с немцами, но потом контора распалась. А сама Микросервис/help молчит упорно. А отзывы о "Микросервис" похоже делали те, кто работал версией Light. Но описание на программы на http://www.mstechnology.ru/instructions/lite/instruction.htm довольно толковое. Что-то они там должны были сделать. Ведь в Dragon NaturallySpeaking 7 не зря даются для тренировки большие куски текстов (я тренировался на чтении "Алисы в стране чудес"), т.е. идет обучении проги распознованию не только отдельных слов, а текстовой строки. Но русского модуля никто не сделал, похоже трудоемкая задача.
Значит надо смотреть имеющиеся продукты. Один человек на art.bdk.com.ru, писал, что создал базу для первого Горыныча в 36.000 слов.

Автор: Alexky
Дата сообщения: 27.06.2003 00:25
Sorok

Цитата:
Миллиарды зеленых и НИКТО не хочет серьезно этим заняться.

У меня один хороший приятель этим занялся. Основал компанию вместе с одним известным языковым колледжем, которая занималась разработкой такого софта и т.д. Через года полтора компания закрылась. Не нашли финансирование. А ты говоришь...
Автор: KostiKL
Дата сообщения: 27.06.2003 13:29
Acerv

Цитата:
У вас Горыныч Проф 2 был наверное версии Light, т.е. упрощенный? Сколько весит? Честно говоря по Горынычу 2 у меня подозрения, что там просто переделали 1-ый Горыныч для работы под Win 2000 (решили проблему с кодовой страницей).

Да был Лайт! Сколько весит не помню... Насчет подозрений - мне тоже так кажется!
Принципиально нового я там не увидел!


Цитата:
А бывший работник Микросервис расказал, что "Микросервис" делали вместе с немцами, но потом контора распалась.

Если взглянуть на последния пост Alexky, то можно сделать вывод о том, что еще долго все фирмы занимаюиеся распознаванием русского будет постигать та же участь. Ведь русский язык считается одним из самых выразительных и, соответственно, самых сложных!


Добавлено

Цитата:
Ведь в Dragon NaturallySpeaking 7 не зря даются для тренировки большие куски текстов (я тренировался на чтении "Алисы в стране чудес"), т.е. идет обучении проги распознованию не только отдельных слов, а текстовой строки. Но русского модуля никто не сделал, похоже трудоемкая задача.

В WinXP та же самая история... Я тренировался на чтении биографии Билла Гейтса и еще на чем-то... после этого качество распознавания резко возросло! Но с русским модулем та же проблема - где-то читал ответ на вопрос "Почему вы не сделаетет русский модуль для распознавания речи под WinXP?" от руссийского представительства Майкрософт. Дык вот они как раз и говорили, что это очень
Цитата:
трудоемкая задача
по сравнению с английским.
Автор: vzbzdnov
Дата сообщения: 27.06.2003 19:37
IBM ViaVoice - неплохая прога для распознавания голоса. Можно добавлять языковые модули (за отдельную денежку, естессно)
Автор: Acerv
Дата сообщения: 27.06.2003 21:21
vzbzdnov
Может быть и хорошая, но, жаль, среди 10 языковых модулей русского-то нет.
Задача этой темы получить инфу о прогах распознающих русский язык и отзывы пользователей о них.
Пока нелестные отзывы о трех программах версии lihgt .
Автор: Sorok
Дата сообщения: 28.06.2003 11:51

Если бы
Цитата:
У меня один хороший приятель этим занялся. Основал компанию вместе с одним известным языковым колледжем, которая занималась разработкой такого софта и т.д. Через<b> года полтора</b> компания закрылась. Не нашли финансирование. А ты говоришь...


Если бы Гейтц полтора года делал свой первый "Windows", то он бы до сих пор сидел бы в раплатанных штанах!!!
Автор: KostiKL
Дата сообщения: 28.06.2003 13:32
Sorok
Тоже правда, но ведь та же участь постаигает компании которые этим десятилетиями занимаются!
Автор: Sorok
Дата сообщения: 28.06.2003 21:11

Цитата:
Тоже правда, но ведь та же участь постаигает компании которые этим десятилетиями занимаются!


То, чем они занимаются, в среде медиков, называется "онанизмом"
Автор: KostiKL
Дата сообщения: 29.06.2003 14:49
Sorok
Гейтс тогда главный онанист, да?
Автор: Burn
Дата сообщения: 29.06.2003 20:11
Не мог удержаться чтоб не сказать ДА!

Добавлено
Все что было сказано я не читал. Могу заметить что в этом году знакомый написал диплом по такой проге. Я принимал участи в написание проги. Она хорошо распознает речь. Программа писалась под пилота. Он говорит команды а программа управляет самолетом. У нас получилось под конкретного человека 100% распознование речи. Программа основана на элементах искуственного интеллекта. Сложность в ней в том, что ее надо обучить. Тупо сидеть и произносить слова, она будет их распознавать. Это необходимо чтоб прога понимала голос. Чем больше записать голосов, тем больше будет вероятность правильного распознования. Вот.
Автор: Acerv
Дата сообщения: 29.06.2003 20:47
Burn

Цитата:
Это необходимо чтоб прога понимала голос. Чем больше записать голосов, тем больше будет вероятность правильного распознования. Вот.

Может быть - чем больше будет наговорено слов, тем больше процент распознования?
Распознование делалалось под одного человека? На каком языке творилась?
И как бы эту прогу попробовать?
Можно или нет?
Единственный голос ЗА в общем объеме голосов за распозновование на руском языке, но, увы, за что-то неизвестное .
АВТОРА!!!! И прогу.
Автор: Tor_Zoom
Дата сообщения: 29.06.2003 21:14

Цитата:
Из нашиз бесспорный лидер на этом поприще прога ГОРЫНЫЧ (бери лучше версии из последних).


У меня щас стоит этот горынычь 5.011 версии (староват наверно) - короче я хотел сказать, что он меня достал, там не толко сложно заствить его написать требуемое слово, но и голосовые команды он тоже очень плохо распознаёт. Единственное что почти без ошибок он может написать ! и римские цыфры - ну может ещё какие нить слова. Вобщем не стоит тратить на него своё время.
Автор: Acerv
Дата сообщения: 29.06.2003 21:27
Tor_Zoom
Имелся в виду Горыныч Проф2, выпуск март-апрель этого года, но и все равно надо в нем, теоретически, иметь объем слов более 10000, а в старом Горныче или Комбате объем около 5000, да и в нем действительное трех слов не свяжещь слитно без вмешательства.
Автор: Burn
Дата сообщения: 29.06.2003 22:29
Я разговор вел не о Горыныче. У проги пока названия нет. Естественно что чем больше наговорить слов, тем точнее прога распознает слова. Конечно нужно наговаривать и с разным ударением и скоростью и интонацией и т.д. А если еще записать несколько голосов (мужских и женских), то программа будет болле универсальна под любой голос. Повторюсь, что писалась и обучалась под голос конкретного человека. И было 100% распознование. В настоящее время программа дорабатывается в другом направлении. Я постараюсь связаться с автором и если получу добор то обязательно выложу её.
Автор: savage2000
Дата сообщения: 29.06.2003 22:55
Как я понял, хорошей программы распознавания русской речи нет.
Тогда возникает следующий вопрос: а есть ли хорошие программы распознавания других языков, но ПОЛНОСТЬЮ обучаемые? Т.е. я говорю слово - программа, естественно, "ни бэ, ни мэ" , я ввожу, как это слово пишется, но русское слово! В итоге я получу программу, которая знает мой голос и пишет русскими словами.
Рано или поздно я так могу вбить свой небогатый лексикон (лексикон среднестатистического человека - 3-5 тысяч слов, это только Пушкин мог порядка 35 тыс. слов употреблять).
Очевидные недостатки такого подхода:
- только один голос
- вначале придется каждое слово вбивать.
Но меня бы это устроило. Все равно через месяц больше 95% слов уже не приходилось бы набивать.
Какая программа подошла бы под мои критерии?
Автор: KostiKL
Дата сообщения: 29.06.2003 22:57

Цитата:
Главные трудности фонемного подхода

1. Темп речи варьируется в широких пределах, часто в несколько раз. При этом различные звуки речи растягиваются или сжимаются не пропорционально. Например, гласные изменяются значительно сильнее, чем полугласные и особенно смычные согласные. Для так называемых щелевых звуков есть свои закономерности. (Полугласные - это звуки при генерации которых необходимо участие голосовых связок, как и для гласных звуков, но сами они в обиходе считаются согласными. Например, так обычно звучат "м", "н", "л" и "р". Смычные звуки образуются при резком смыкании и размыкании органов артикуляции. Например "б", "п", "д", "т". Образование щелевых звуков связано с шипением и прочими эффектами турбулентности в органах артикуляции. Можно назвать "в", "ж", "с", а также "ш" и другие шипящие. В качестве примеров для простоты намеренно не приведены звуки, не имеющие буквенных обозначений.) Эта свойство называется временной нестационарностью образцов речевого сигнала.

2. Произнося одно и то же слово или фразу в разное время, под влиянием различных факторов (настроения, состояния здоровья и др.), мы генерируем заметно не совпадающие спектрально-временные распределения энергии. Это справедливо даже для дважды подряд произнесенного слова. Намного сильнее этот эффект проявляется при сравнении спектрограмм одной и той же фразы, произнесенной разными людьми. Обычно этот эффект называют спектральной нестационарностью образцов речевого сигнала (см. примеры спектрограмм).

3. Изменение темпа речи и четкости произношения является причиной коартикуляционной нестационарности, означающей изменение взаимовлияния соседних звуков от образца к образцу.

4. Проблема кластеризации слитной речи. Из непрерывного речевого потока довольно непросто выделить какие-либо речевые единицы. Многие звуки "слипаются" либо имеют нечеткие границы.

Вот лишь некоторые причины, препятствующие реализации систем распознавания речи.


Это лишь небольшая цитатка из неплохой статью, дядьки, который этим вроде не один год занимается, даже вроде ученый какой-то...
Если заинтересовало, выложу куда-нибудь!


Добавлено
savage2000
Хорошо распознается английский, причем почти любыми программами перечисленными здесь! Бери Dragon Dictate какой-нибудь и вперед....


Добавлено

Цитата:
Dragon Naturally Speaking Personal Edition. v.1.0
Как утверждает Dragon Systems Inc. - это первая в мире система распознавания беглой речи (датируется она 1997 годом). То есть с ее помощью можно набирать тексты на компьютере, просто диктуя иx так, как Вы обычно говорите - с интонацией, не разделяя слова и т.д. Судя по демонстрационному ролику, вещь просто фантастическая! Целое предложение здесь формируется не по отдельным словам, а в процессе диктовки. Нужные слова подставляются исxодя из контекста. Все манипуляции с текстом производятся голосом. Создается впечатление, что система понимает все, что ей говоришь, xоть основана она, конечно, на Dragon Dictate, и основной набор команд остался таким же.


Это древнее описание Dragon'a... с тех времен когда еще 32Мб оперативки за счастье было! Делаем выводы о распознавании английской речи!...
Увы наши программеры таким похвастаться не могут!
И не надо тыкать программами, которые распознают отдельные слова!
Автор: Acerv
Дата сообщения: 29.06.2003 23:20
savage2000
Вопрос конечно интересный. Я попробовал подобный подход на Dragon NaturallySpeaking, не получилось. При внимательном чтении инструкции по Dragon NaturallySpeaking понял, что он поодерживает один язык (английский), но с вариантами различных диалектов.
Поэтому в этом направлении , по моему мнению, более перспективнен работа с программами, которые поддерживают несколько языков. Вот, к примеру Voice Suite на http://www.autonomy.com/Content/Products/AV/Voice_Suite/ - поддерживает несколько языков, но сам продукт не нашел или упомянутый выше IBM ViaVoice - тоже 10 языков, только создавай свой профиль и говори на каком хочешь языке (теоретически).
Надо бы на art.bdk.com/ru ревизию всех описанных ими программ устроить, может и новое найдем, а то они с 1999 года на обновляются.

Добавлено
KostiKL
Это похоже ты приводишь статью дядьки, который хочет создать единую базу размеченных речевых фрагмента (аллофонов), т.е. загнать все произношения русскго языка под какие-то одни правила, а все произношения индивидульны, т.е. надо идти по направлению обучения каждого пользователя под свою базу данных объема словаря.
Вот почему у меня вызывает сомнения высказывания Burn, что надо больше голосов и мужских и женских, ведь в том же Драконе есть различия в обучении и произношения мужского и женского голоса. Может он что-то революционное придумал?


Автор: KostiKL
Дата сообщения: 29.06.2003 23:34
Acerv

Цитата:
идти по направлению обучения каждого пользователя под свою базу данных объема словаря

по этому поводу никаких возражений...
Но обобщатели всегда найдутся!
Без них никуда!
Автор: Farch
Дата сообщения: 30.06.2003 13:43
хм программы тут уникальные. а кото видел программу которая работает по голосовым меткам? как телефон например

Страницы: 12345

Предыдущая тема: SF2 MIDI-Плеер без плейлиста


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.