Ru-Board.club
← Вернуться в раздел «Программы»

» Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Автор: vikkiv
Дата сообщения: 13.10.2006 18:57
Microsoft Agent / Speech API



Официальный сайт
Файлы для пользователей :: Файлы для разработчиков

Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.

Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):

1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5 - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина 22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller - что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4 (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.

Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.

В общем я лично пока рекомендую (из общедоступных) только 4 голоса:

1) Acapela-Group Алёна 22Khz - SAPI5/SAPI4
2) Loquendo Ольга / Loquendo Дмитри
3) Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
4) Katerina
(остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:

Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).

5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.

Ну а программы для их использования - это дело вкуса и отдельный разговор.

По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:

Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))

+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

Горыныч :: Диктограф

Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

Дополнительные экранные персонажи:

Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
Microsoft Agent Character Editor + руководство по использованию

Программы для чтения текста голосом (говорилки):

DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.
Автор: Shpindler
Дата сообщения: 17.10.2006 18:40
Реал спик 4 - комплект из пяти голосов (английский, немецкий и т.д. русского нет) - http://rapidshare.de/files/37056951/Rapidshara_SUXXXXX____.AVI
перименовать в RAR , пасс - ru-board
Автор: vikkiv
Дата сообщения: 17.10.2006 23:23
Спасибо, а то они все в еМуле есть, а у меня провайдер все порты против него забанил - нахожу там по крайней мере штук 30-35 (голосов от СканСофта) а скачать не могу. ..... А этот 5-ти язычный блок на 120-160 МБ идет на САПИ4 - в то время как САПИ5 модули занимают где-то по 40-80 МБ -> Вывод: 5-ти язычный модуль более низкого качества (За исключением русского Татьяна - которую нигде не достать - их первая разработка которую потом при переходе с САПИ4 на САПИ5 переименовали в Катерину, к-стате где-то читал что Татьяна не была такой истеричной).
Автор: Shpindler
Дата сообщения: 18.10.2006 09:46

Цитата:
Спасибо, а то они все в еМуле есть, а у меня провайдер все порты против него забанил - нахожу там по крайней мере штук 30-35 (голосов от СканСофта) а скачать не могу. ..... А этот 5-ти язычный блок на 120-160 МБ идет на САПИ4 - в то время как САПИ5 модули занимают где-то по 40-80 МБ -> Вывод: 5-ти язычный модуль более низкого качества (За исключением русского Татьяна - которую нигде не достать - их первая разработка которую потом при переходе с САПИ4 на САПИ5 переименовали в Катерину, к-стате где-то читал что Татьяна не была такой истеричной).


Упс , ошибочка вышла , там Даниэль, SAPI-5 22кгц, размером в 90 с лих метров, качество синтезуруемого текста выше всяких похвал, а дженифер тоже пятую щас заливаю.
Кста на вирджиниевском диске какая версия , помоему SAPI-4 ?
Автор: vikkiv
Дата сообщения: 18.10.2006 17:54

Цитата:
Кста на вирджиниевском диске какая версия , помоему SAPI-4 ?

На самом деле не знаю - вирджин модуль не ставил так как полные версии все доступны - а она - демо.
Автор: Shpindler
Дата сообщения: 19.10.2006 08:04
vikkiv

Х.З. - У верджиниевского диска очень неплохое качество синтеза речи, плюс ко всему вирджиниевский Даниэль сразу добавился в промт, а отдельный модуль , тот что я выкачал с мула ,на базе SAPI-5 промт в упор не видит
Автор: vikkiv
Дата сообщения: 19.10.2006 20:05
А Промт вообщe что нибудь на основе САПИ5 видит? Eсли нет - тогда причина ясна - если да - тогда скачалась глючная версия (лучше её проверить с другими САПИ5 совместимыми приложениями - если всё нормально - то производители промта ещё не полностью освоили САПИ5 протоколы).
Автор: tolik20002
Дата сообщения: 26.10.2006 02:03
Ребяте, где можно найти и скачать Speech Cube Elan v5.1?
И вообще что лучше установить для нормальной работи читалки.(И где это можно реально скачать)
Автор: Pitersky
Дата сообщения: 26.10.2006 02:20
tolik20002
_http://jaws.tiflocomp.ru/synths/
Автор: tolik20002
Дата сообщения: 26.10.2006 02:25
Pitersky
Спасибо, но мой к_о_з_е_л сисадмин зарубил обьем закачки до 5 Мб, а там целих 12.
Может подскажите какойто друго сайт?
Автор: Pitersky
Дата сообщения: 26.10.2006 02:37
tolik20002
Я, кстати, дико извиняюсь... Но там версия 4.2 лежит.
Автор: Shpindler
Дата сообщения: 26.10.2006 12:45
Pitersky


hXXp://rapidshare.com/files/516883/874365287654.XEP

пасс: nnm
Автор: vikkiv
Дата сообщения: 26.10.2006 19:13
5.1. У кого-то здесь на форуме видел hххp://rl-team.ru/326930
Однако если лимит на 5МБ то ничего не поможет - если только а) кто-то не зальёт несколькими кусками б) твой к_о_...ин не снимит ограничения. Так- что иди к друзьям и там качай.
Автор: ilyaor
Дата сообщения: 27.10.2006 09:35
Есть в нарезку вот здесь =) http://mp3book2005.narod.ru/8.htm
Автор: vikkiv
Дата сообщения: 27.10.2006 12:56

Цитата:
Есть в нарезку вот ...

Там версия 4.2.
Автор: Darsanval
Дата сообщения: 31.10.2006 02:46
ELAN Speech Cube V4.2(5каналов)
Работает на SAPI5.1, а то люди могут подумать, что это голосовой движок только для SAPI4.
Автор: tolik20002
Дата сообщения: 31.10.2006 16:18
ilyaor
Пасибо, но там я уже был. Закачал на 30 дней. (На сайте написано)

что лучше установить для нормальной работи читалки.(И где это можно реально скачать)
Автор: clip
Дата сообщения: 10.11.2006 14:05
2 tolik20002
для николая есть резетилка триала (называется активатор) - много где валяется.
Хороший словарь ударений лежит на сайте http://mp3book2005.narod.ru (просто копируется в нужную папку движка, поверх пустышек). А вот словарь сокращений - дело очень спорное. От него в книжках получаются "гигабайты" вместо ГБ, междометия он тоже калечит.
Программу я использую самопальную (о ней ветка http://palmz.in/board/index.php?act=ST&f=43&t=28307&st=0# , гости атач должны видеть).
Темп речи рекомендую устанавливать повыше - мозгу некогда будет на дефекты речи отвлекаться, он смысл ловит .
Катерина для книжек мне не понравилась категорически, выше уже говорили, что что-то в ней есть стервозное
Автор: SergeySPB
Дата сообщения: 01.12.2006 20:42
C Николаем ELAN Speech Cube V4.2 работал нормально.
Попытался перейти на
Speech Cube Elan v5.1 и читать Николай перестал.ТекстАлауд говорит PlayStreamException ClassNotRegistered.
У меня что-то не так или у всех так и есть какой секрет?
Это версия hXXp://rapidshare.com/files/516883/874365287654.XEP на 30 дней. Я правильно понимаю,что запуск сubec.exe должен заново запускать отсчет этих 30 дней?
Возможно есть свой активатор, старый от V4.2 указывает неверные пути в стартап...
Не подскажете?А может есть уже нормально крякнутая версия Николая 5.1?
Автор: vikkiv
Дата сообщения: 04.12.2006 19:41
Все доступные в И-нете версии 5.1. (которые я нашёл) включают в себя механизм перезапуска 30 дней. В виндовсе для нормальной работы должен быть установлен русский язык. Перед установкой надо предварительно деинсталировать старую версию Николая. Для надёжности после установки можно перезапустить компютер.
Автор: SergeySPB
Дата сообщения: 05.12.2006 01:13
Версию 5.1 в конце концов установил.Но вот после установки Раина (это уже 5.2 акапела), Николай перестает говорить.
Перепробовал все доступные версии Николая 5.1 и даже вернулся к 4.2, но НИКОГО из них с 5.2 соместить не удалось. Николай не хочет работать с другими голосами.
Если кто знает ухишрение, как это сделать, напишите.
Пробовал и SDK 300 метровый,версии 5.1. Там можно все голоса заставить говорить,но у голосов только data файлы и отсутствуют голосовые движки,поэтому качество звучания получается на уровне L&H 3000, низкое весьма.
Почему то в версию 5.2 не включили до сих пор русский голос...дискриминация...
Никто не слышал- собираются они подтягивать Николая до 5.2?
А вот сакрамента рассказчика в сети так и не нашел доступного
Автор: vikkiv
Дата сообщения: 06.12.2006 01:08
Для решения этой проблемы изпользуют мультимедийную версию еttsеnginе.ехе - одна проблема - демо работает только в один поток и без ускорения (собран на основе SDK).

По русскому 5.2. (да и по 5.1) Акапела сказала что готовых продуктов у них нету (все версии у нас левые и дома собранные из SDK).
Версия 5.2 с Райном/Люси/Хевер/Грахам/Арон/Лаура/Клаир/Юлия (все доступны) и т.д. собрана на основе Телеком (СпичКуб) - а она не совместима с тем-же телекомом других версий (определители одинаковые) - только с мултимедийным - так-как у них разные определители речевых движков в реестре.

Подтягивать его не будут - нету смысла - разработки по этому движку прекращены ( ограничение лицензии для акапелы от питерских разработчиков - такие слухи) да и начиная с версии 5.2 большинство голосов переходит на 22 Кгц, а для Николая таких исходников нету, он изначально разрабатывался на такое качество (по тем временам максимальное - вроде год 1997) - уж легче новый голос сделать (что и произошло с большинством из них).

По сакраменту - посмотри на сайте Wеcrаsоft.nаrоd.ru (набирай в ручную - здесь от поискивикив часть букв - кирилица) но там версии не старше 2-й.
Автор: SergeySPB
Дата сообщения: 06.12.2006 23:46
Тоесть Николай медленно,но верно умирает и ему уже ничто не поможет...
Придется ограничиться Катериной...
А вот голоса сакрамента с wecrasoft.narod.ru какие-то битые.
Я установил аж три- Вячеслава,Ольгу и Ирину, но эффект один и тот же. Встают без ругани, но далее не работают.
В тексталауде при запуске вылетают с сообшением об ошибке, а в лернвордз просто молчат.
Кстати, если у кого есть лечение к LearnWords для Винда, не кините...
Автор: vikkiv
Дата сообщения: 07.12.2006 00:50

Цитата:
SergeySPB

Странно - а у меня всё поставилось, даже удалось на ето-же ядро прикрутить ещё три - более старых голоса.
Автор: SergeySPB
Дата сообщения: 07.12.2006 22:54

Цитата:
даже удалось на ето-же ядро прикрутить ещё три - более старых голоса.

Техталауд при попытке чтения ругается так, как будто не установлен движок связывающий голос с техталаудом и обеспечиающий интерфейс, как если пытаться майка16 поставить перед кристал16. Кристал содержит и движок и должна быть первой установлена(или надо этот движок предварительно откуда-то установить).Возможно перед тем, как эти голоса сакрамента ставить ,нужно что-то установить с движком... Или, может быть, какой-то голос надо непременно первым ставить,может он содержит в себе и движок...?

Цитата:
ещё три - более старых голоса.

я хотел под САПИ5,старые могут его и не потдерживать....


Автор: vikkiv
Дата сообщения: 08.12.2006 19:01
Там надо 3 элемента предварительно (перед голосами) поставить - Адаптер - Движок - Редактор (точно не помню).
Автор: SergeySPB
Дата сообщения: 09.12.2006 18:33
"надо 3 элемента предварительно (перед голосами) поставить "
8-))) вот я так и думал, а где эти вещи в свободном доступе взять можно?
Вместе с голосами они не лежат...
C техталауд они совместны?
Автор: vikkiv
Дата сообщения: 09.12.2006 20:57

Цитата:
...а где эти вещи в свободном доступе взять можно?

На wесrаsоfт.nаrоd.ru (тока набирай руками - там против поисковиков честь букв кирилицей)
Автор: SergeySPB
Дата сообщения: 28.12.2006 02:20
Спасибо, я поначалу без этих 3 элементов установил...
Теперь все заработало, но после этого наступило глубокое разочарование. Качество этих голосов на порядок хуже и Николая и тем более Катерины...
Такое впечатление,что Катя явно лучшая на сегодня.
Автор: king_stiven
Дата сообщения: 02.01.2007 21:43
А у меня катька накрылась(?)

Страницы: 1234567891011121314151617181920

Предыдущая тема: Программа для поиска на фтп


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.