Ru-Board.club
← Вернуться в раздел «Программы»

» Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Автор: cuneiform
Дата сообщения: 08.01.2016 02:38
Русский голос Милена Vokalizer на рутрекере выложен = 600 Мб и куча предварительных условий-установок софта. А если надо читать несколько голосов? Может хорошее качество.
Но для меня лучше хуже качество, но больше голосов. И поменьше всякого софта для этого предварительно устанавливать.
Автор: Apokrif
Дата сообщения: 08.01.2016 06:42

Цитата:
И поменьше всякого софта для этого предварительно устанавливать.
Не понял...
Вроде нужно только VS runtime поставить, больше ничего?
Или вы имеете ввиду "всякого софта для этого предварительно устанавливать" - это установка MD?
Автор: cuneiform
Дата сообщения: 10.01.2016 14:17

Цитата:
Вроде нужно только VS runtime поставить, больше ничего?


Для работы так же необходимо установить: microsoft visual c++ 2005 sp1 redistributable package и microsoft visual c++ 2005 service pack 1 redistributable package atl security update
Автор: Apokrif
Дата сообщения: 10.01.2016 18:52

Цитата:
Для работы так же необходимо установить: microsoft visual c++ 2005 sp1 redistributable package и microsoft visual c++ 2005 service pack 1 redistributable package atl security update
Это просто VS runtime updates. Т.к. VS runtime (несколько версий) обычно уже стоят, все update-ы к ним тоже уже стоят.
Автор: ajoukov
Дата сообщения: 22.02.2016 02:57

Цитата:
Эта утилита (acatts.exe) просто перегоняет текст в wav, используя библиотеку acatts.dll напрямую, минуя костыли SAPI4/5. Исходники и саму программу перезалил


У кого-нибудь еще сохранились эти исходники Ajaja?


Автор: Apokrif
Дата сообщения: 22.02.2016 09:28

Цитата:
У кого-нибудь еще сохранились эти исходники Ajaja

У него самого на http://mytts.forum2x2.ru/ спросите!
Автор: 9669
Дата сообщения: 28.05.2016 13:47
кто ни будь смог установить Acapela-Group Алёна 22Khz на видоус 10 поделитесь опытом пожалуйста
Автор: ajoukov
Дата сообщения: 24.06.2016 15:50

Цитата:

Цитата: У кого-нибудь еще сохранились эти исходники Ajaja

У него самого на http://mytts.forum2x2.ru/ спросите!
Автор: Apokrif
Дата сообщения: 24.06.2016 17:00
Народ,
Кому интересно:
На harposoftware.com выложили триалы голосов для Nuance Vocalizer Expressive.
Подробнее

Автор: esisl
Дата сообщения: 20.07.2016 10:05
Коллеги (по счастью)!

А не подскажет ли кто, говорилку, которая помимо синтеза речи, давала бы временную разметку текста.
Например:
"В лесу родилась ёлочка"
В - 0 сек
л - 0.1 сек
е - 0.15 сек
с - ...
и т.д???
Автор: Apokrif
Дата сообщения: 21.07.2016 00:40

Цитата:
А не подскажет ли кто, говорилку, которая помимо синтеза речи, давала бы временную разметку текста.
В смысле что бы говорилка делала call back при произношении букв?
Или разметить текст перед произношением?
Автор: esisl
Дата сообщения: 21.07.2016 22:45
Разметить текст.
Автор: Apokrif
Дата сообщения: 22.07.2016 02:13

Цитата:
Разметить текст.
Наверное, можно изобразить фонемами и микро-паузами, но никогда не слышал, чтобы так кто-нибудь делал... А какая конечная цель-то?
Автор: esisl
Дата сообщения: 22.07.2016 22:03
Синхронизация с анимацией
Автор: Apokrif
Дата сообщения: 23.07.2016 20:44

Цитата:
Синхронизация с анимацией
Понятно.
Вы пытаетесь синхронизировать анимация -> голос.
А у них есть в другую сторону: голос -> анимация, через callback, который указывает положение губ.

Автор: esisl
Дата сообщения: 23.07.2016 21:11
Нет, мне и надо голос -> анимация!
"У них" - это у кого?
Автор: Apokrif
Дата сообщения: 23.07.2016 22:25

Цитата:
Нет, мне и надо голос -> анимация!
"У них" - это у кого?
У большинства TTS. Вроде были и говорилки, которые эту фичу использовали.
Почти уверен, что в SAPI эта фича не входит...
Автор: esisl
Дата сообщения: 23.07.2016 22:32
TTS - это text-to-speech processor?
А кокой посоветуете посмотреть?
Автор: Apokrif
Дата сообщения: 24.07.2016 06:40

Цитата:
А кокой посоветуете посмотреть?
Ivona или Nuance


Цитата:
Почти уверен, что в SAPI эта фича не входит...

Похоже, что я не прав: http://talkingmoose.ca/voice-ivona-voices-500-ms-duration-visemes
Автор: esisl
Дата сообщения: 07.08.2016 15:48
Ура!
Разобрался!

Тупо втыкаем в delphi sapi и там есть соответствующий callback (событие)
Всех много спасибо
Автор: Apokrif
Дата сообщения: 07.08.2016 20:08

Цитата:
Тупо втыкаем в delphi sapi и там есть соответствующий callback (событие)
Когда картинки прикрутите, выложите ролик!
Автор: esisl
Дата сообщения: 08.08.2016 22:04
*НЕПРИЛИЧНОЕ ВЫРАЖЕНИЕ*
callback на фонемы работает только для латинницы
Автор: Apokrif
Дата сообщения: 08.08.2016 23:34

Цитата:
callback на фонемы работает только для латинницы
Т.е. при озвучивании латиницы русским голосом callback работает, а для русского текста этим же голосом - нет?
Автор: esisl
Дата сообщения: 09.08.2016 00:37
Русский голос не озвучивает латинницу.
Латинницу озвучивает англицкий голос.
И вот у англицкого голоса callback`и есть, а у русского callback`ов на фонемы - нет
Автор: Apokrif
Дата сообщения: 09.08.2016 17:45

Цитата:
Русский голос не озвучивает латинницу.
Это смотря какой. Nuance Milena нормально говорит по английски.


Цитата:
И вот у англицкого голоса callback`и есть, а у русского callback`ов на фонемы - нет
И эти голоса от одного производителя?


Автор: esisl
Дата сообщения: 16.08.2016 22:52
Несколько разных голосов от разных производителей
В конце-концов получил, относительно приемлемый результат, заставляя SAPI формировать треки "+1 буква" и каждый раз меряя длину трека.
Автор: Apokrif
Дата сообщения: 18.08.2016 05:34

Цитата:
В конце-концов получил, относительно приемлемый результат, заставляя SAPI формировать треки "+1 буква" и каждый раз меряя длину трека.
Без callback-ов?
Автор: esisl
Дата сообщения: 18.08.2016 20:50
Варварски.
Берём фразу текста.

Берём 1-й символ, озвучиваем, меряем длину трека в отсчётах.
Прибавляем 2-й символ, озвучиваем, меряем длину трека в отсчётах.
Прибавляем 3-й символ, озвучиваем, меряем длину трека в отсчётах.
....
Прибавляем последний символ, озвучиваем, меряем длину трека в отсчётах

Страшно? "А мы тут живём!" (с)
Автор: Apokrif
Дата сообщения: 20.08.2016 22:12

Цитата:
Страшно?
Лучше б разобрались, почему callback-и не работают.
Может просто как-то включить нужно?
А то как в анекдоте, "Дергаем зубы, через Ж, автогеном!"

Страницы: 1234567891011121314151617181920

Предыдущая тема: Программа для поиска на фтп


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.