Ru-Board.club
← Вернуться в раздел «Программы»

» Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Автор: LAndrew
Дата сообщения: 02.12.2007 12:47
поскольку тут специалистов больше, то спрошу - есть ли синтезатор голоса для КПК (Pocket PC) с поддержкой командной строки? (последнее - очень важно! sakrament - не подходит!)
Автор: vikkiv
Дата сообщения: 17.12.2007 23:13

Цитата:
есть ли синтезатор голоса для КПК

Насчет командной строки не-знаю, но для КПК годится MobileSpeak. Из русских голосов там к сожалению только Сакрамент - зато другие Акапела и т.д. Может там какая-нибудь поддержка comand_line. Такое-вот предположение, но фактов или другой информации нету.
Автор: vikkiv
Дата сообщения: 31.12.2007 16:00
Вот тут нашёл хорошие голоса для Говорилок:
Примите во внимание что:
1) Loquendo это не готовые голоса а только SpeechPack без самого SAPI5 движка
2) Прекрасно работают на движке от старых голосов (от qualisoftware / qualispeak) которые широко доступны в сетях (но низкого качества т.к. размер около 30~40Мб) + #Скрыто#.
3) Установку производить в директорию X:/Program Files/Loquendo/LTTS/ (Где Х - ваш диск)
4) В большинстве голосов Loquendo работают эмоциональные тэги.
5) #Скрыто#
Английский
Neospeech
Kate1 (235MB) Kate2 (230MB)
Paul1 (235MB) Paul2 (230MB)
Loquendo
Simon1 (275MB) Simon2 (300MB)
Kate1 (290MB) Kate2 (310MB)
Susan (230MB)
Dave (270MB)
Elizabeth (182MB)
Испанский
Loquendo
Carlos (230MB)
Carmen (185MB)
Jorge (170MB)
Португальский
Loquendo
Gabriela (235MB)
Шведский
Loquendo
Annika (415MB)
Греческий
Loquendo
Afroditi (182MB)
Французкий
Loquendo
Bernard1 (157MB) Bernard2 (170MB)
Juliette1 (220MB) Juliette2 (230MB)
Немецкий
Loquendo
Stefan (260MB)
Katrin (275MB)
Итальянский
Loquendo
Luca (200MB)
Paola (200MB)
Датцкий
Loquendo
Willem (270MB)
Saskia (265MB)
Японский
Neospeech
Show (646MB)
Misaki (530MB)
Китайский
Neospeech
Wang (203MB)
Lily (520MB)

Через неделю дам ссылки на голоса AT&T и оставшийся пакет от NeoSpeech

Сервера для скачивания все легальные (просто наверное админам зарплату урезают - так они молодцы и работают по принципу рыночной экономики = "сколько платят - на столько и работаем").[more] Хотя я не думаю что после публикации такой безпредел будет долго продолжатся -> ссылки скоро потухнут[/more].
Автор: SelenaNight
Дата сообщения: 02.01.2008 02:04
vikkiv
Ссылка на Dave с ошибкой: вместо loquendosdave.exe надо loquendodave.exe

Огромное спасибо! Будем ждать продолжения

Автор: vikkiv
Дата сообщения: 02.01.2008 16:26
SelenaNight

Цитата:
..вместо loquendosdave.exe надо loquendodave.exe

Ok, исправил; спасибо
Автор: vikkiv
Дата сообщения: 04.01.2008 07:29
Вот как обещал следующая партия TTS движков с легальных серверов (от высказыванний в адрес владельцев сайта воздержусь): www.flamespeech.com
Tам в разделе "Voices" можно найти голоса от АТ&T и NeoSpeech
Японский
Miyu 430MB
Show 625MB
Корейский
Yumi 535MB
JunWoo 360MB
Французкий
Juliette 645MB
Alain 640MB
Английский
Audrey 720MB
Charles 740MB
Claire 575MB
Crystal 575MB
Julia 600MB
Lauren 880MB
Mel 525MB
Mike 600MB
Ray 580MB
Rich 425MB
Kate 230MB
Paul 230MB
Немецкий
Klara 620MB
Reiner 700MB
Испанский
Rosa 715MB
Alberto 690MB
Автор: SergeySPB
Дата сообщения: 04.01.2008 20:55
Спасибо.
И какой английский голос на ваш взгяд лучший на сегодня?
Автор: vikkiv
Дата сообщения: 04.01.2008 21:35
Ответ конечно субъективный будет.. хотя если отфильтровать эмоции и "нравится ненравится" то в первую группу по качеству произношения можно включить (по крайней мере эти иcпользую периодически а остальные удалил):
Kate / Paul (Neospeech)
Ryan / Heather / Lucy (Acapela/Elan)
Kate / Simon / Dave (Loquendo)
Lee / Daniel / Karen (Nuance / ScanSoft)
порядок здесь абсолютно неважен
А что лучше из AT&T или Cepstral сразу сказать неcмогу, надо вспоминать или тестировать по новой.
Автор: vikkiv
Дата сообщения: 14.01.2008 00:04
Новый пакет от "AT&T Natural voices" с сайта NextUp (голоса не включённые в предыдущие списки помечены жирным синим цветом). Для запуска любого голоса AT&T (без установки первого диска Mike/Crystal) в редких случаях (и только! Не ставьте если и так всё работает!) необходимо установить движок:
English
Crystal-US
Mike-US
Julia-US
Lauren-US
Mel-US
Ray-US
Rich-US
Claire-US
Audrey-UK
Charles-UK
Anjali-Indian
Spanish
Alberto
Rosa
German
Klara
Reiner
French
Alain
Juliette
Arnaud-Canadian
Japanese (вместо директории "3g" можно набрать "3z" - там то-же самое) То-же вместо ttsvoices.com=nextupdownloads.com
NeoSpeech Miyu
NeoSpeech Show
Korean (вместо директории "3g" можно набрать "3z" - там то-же самое) То-же вместо ttsvoices.com=nextupdownloads.com
NeoSpeech JunWoo
NeoSpeech Yumi

Эти линки убъют довольно быстро - в течении одной-двух недель (если не раньше)....

P/S Бонус - Acapela 2 голоса Arabic 30 day demo - 2 voices Salma/Nawfal
Автор: SergeySPB
Дата сообщения: 16.01.2008 01:08
Спасибо.
Казалось бы,чем больше голос занимает места,тем натуральнее должен голос звучать.
Ведь он обладает более богатой базой данных.
Тоесть, большие голоса АТТ, по идее, должны звучать лучше.
Ведь 880МВ впечатляют.
Но не могу сказать,что я улавливаю в образцах на сайте разницу.
Может быть разница сказывается на больших отрезках текста?

А голоса Loquendo проигрываются движком nextup?

Автор: Yeeshik
Дата сообщения: 16.01.2008 07:17

Цитата:
голоса Loquendo проигрываются движком nextup?

Нет, не проигрываются.

Кстати, Локвендо с нетсбрайн содержат движок.
Автор: SergeySPB
Дата сообщения: 17.01.2008 21:17

Цитата:
не проигрываются...Локвендо с нетсбрайн содержат движок.

а наоборот, на этом движке, голоса АТТ и прочие проигрываться будут?
Я подозреваю,что нет.
Речь идет о том,чтобы смешивать разные голоса, озвучивая один текст.
Автор: vikkiv
Дата сообщения: 18.01.2008 06:52
Лучше разобраться о чём здесь идёт речь -
1) либо о пльзовательской программе-интерфейсе для работы с движками типа TextAloud MP3Book2005 CoolReader и.т.д.
2) либо о API интерфейсе и ядре через который производитель движка работает в среде (Windows) для связи с приложениями.
"Loquendo - SpeechPack" и "A&TT Natural Voices" без ядра - это всего лишь частные случаи когда в комплекте с ними оно (ядро/движок) не идёт; пакетам от других производителей это не помогает и не мешает. Движок с инсталяцией весит пару мегабайт (на самом деле сам всего-лишь до одного мегабайта) так-что скачать и установить его - это не проблема, к тому-же систему он не грузит и подключается только при использовании голоса от этого производителя.

Для переключения голосов в программах можно изпользовать тэги или функции самой программы, в TextAloud например реализация такая:
<voice required="name = Scansoft Katerina_Full_22kHz">Привет Коля!
<voice required="name = ELAN TTS Russian (Nicolai 16Khz)">Здравствуй Катерина, рад встрече!
<voice required="name = Scansoft Katerina_Full_22kHz">Как у тебя дела?
<voice required="name = ELAN TTS Russian (Nicolai 16Khz)">Прекрасно, а ты сессию уже сдала?
Автор: SelenaNight
Дата сообщения: 20.01.2008 20:23
Заметила одну особенность Николая 5.1
Сначала я даже решила, что SAPI4 не работает вообще, а оказалось, что по умолчанию громкость голоса на нуле. Поэтому его просто не слышно.
Кто-нибудь знает, как эту установку поправить? А то каждый раз лезть настраивать очень не удобно.
Автор: vikkiv
Дата сообщения: 20.01.2008 22:34
При первичной разработке Николая из дистрибъютива разработчика который содержал 27 голосов выбросил практически всё кроме того что имело отношение к Николаю и SAPI5 (лекарства добавлялись позже и другими) поддержка SAPI4 не проверялась - может там и попалось что-нибудь из настроек нужное под горячую руку. Ну это так - один из возможных вариантов деффекта. Сам ответ на вопрос может зависеть от программы в которой используется Коля - например в ТекстАлоуд в опциях установливаются настройки каждого голоса (и запоминаются) как для SAPI4 так и для SAPI5. Лучший вариант конечно переключится на SAPI5.
Автор: SelenaNight
Дата сообщения: 20.01.2008 23:03
vikkiv
Жаль, что нельзя поправить...
Пользуюсь ICEReader
Там при выборе голоса применяются установки по умолчанию для данного голоса, которые можно корректировать при желании
Но есть программы, использующие TTS вообще без регулировок, применяются эти самые по умолчанию
Впрочем, старый дигало2000 работает, так что не беда
Автор: vikkiv
Дата сообщения: 21.01.2008 00:23
На уровне SAPI4 вряд-ли они чем-то отличаются - дигало2000 и "новый" Коля это на самом деле одно и то-же (по крайней мере пока никто разницу не слышит). Там вроде только ядро меняли вместе с разработкой других голосов - вот и Колю переставляли на новый движок, а речевая база без изменений.
Автор: SelenaNight
Дата сообщения: 21.01.2008 00:35
это понятно
просто у "старого" Коли по умолчанию громкость на максимуме а из Acapela-Elan-TTS-SpeechCube-SaySo-Tempo-28oldVoicesCracked.exe по умолчанию громкость на нуле
Автор: SergeySPB
Дата сообщения: 24.01.2008 06:12

Цитата:
... о чём здесь идёт речь - "Loquendo - SpeechPack" и "A&TT Natural Voices" без ядра - это всего лишь частные случаи когда в комплекте с ними оно (ядро/движок) не идёт; пакетам от других производителей это не помогает и не мешает. Движок с инсталяцией весит пару мегабайт (на самом деле сам всего-лишь до одного мегабайта) так-что скачать и установить его - это не проблема, к тому-же систему он не грузит и подключается только при использовании голоса от этого производителя.

Спасибо, я об этом и спрашивал. Попытался TextAloud-ом проиграть голос Loquendo. Понятно, что не идет, ибо движок нужен.А где можно скачать этот двухмегабайтный движок, не подскажите?
Автор: vikkiv
Дата сообщения: 24.01.2008 09:31
#Скрыто#
Как альтернатива
а) можно в Муле найти Loquendo SDK 6.5 или версия 6.6 (40~240 MB);
или
б) Любой в Муле голос от производителя Qualispeak + #Скрыто#.
Не забудь что Спичпаки надо ставить в директорию ...\Program Files\Loquendo\LTTS\ а не ту которая идёт по умолчанию ...\Program Files\Loquendo\.
Самый лёгкий вариант смотри в ПМ.
Автор: SergeySPB
Дата сообщения: 24.01.2008 21:39
Спасибо.
Попробовал легкий вариант.
Все встает без вопросов.
Создал LTTS и туда Спичпак установил.Да, теперь,не вываливается ошибка, как раньше было. Но просто звука нет, молча без всяких сообщений.

Добавлено:
а движок надо по умолчанию ставить или в созданную папку LTTS, куда Спичпак поставил?
Автор: vikkiv
Дата сообщения: 25.01.2008 09:01
После инсталляции файлы с расширением "dll" (LoqTTS6.dll; loqsapi5.dll) должны находится в директории "...\Program Files\Loquendo\LTTS" , там-же должны оказатся директории типа "EnglishGb", "EnglishUs" - в зависимости от установленного языка.
Я лично сам ставил через голоса Qualispeak которые можно найти в Emule.

Добавлено
Аaa... если использовал лёгкий вариант (Собранный нашими корейскими друзьями) то там всё надо ставить (как движок так и SpeechPack) в директории по умолчанию (...\Program Files\Loquendo) - без всяких ...\LTTS. !!!
Автор: SergeySPB
Дата сообщения: 25.01.2008 20:37
Спасибо.
я поначалу как раз создал LTTS и туда Спичпак поместил,а движок по умолчанию поставил.Не пошло.Снес.
ТОгда движок тоже в LTTS при установке выбрал.
Не пошло.Возможно,потому что он не в LTTS ставит,а папку внутри LTTS создает.
Поставил еще Qualispeak, тоже ничего.
Снес движок и спичпак и их заново установил по умолчанию.Все заработало.И тексталауд и кволиспик.После этого убрал кволиспик. Голос работает.
Немного смущает меня,что Кволиспик говорил про голос,что это 30 дневная трайл версия. Тексталауд ничего такого не говорит и не ругается.Надеюсь,что нормально будет работать,а не 30 дней.
Автор: ZeroTime
Дата сообщения: 26.01.2008 15:50
Мне тоже в РМ напиши легкий и трудный способ пожалуйста. Кстати что там с регистрацией голосов, они все будут работать, или нужны какие то ухищрения?
Автор: SergeySPB
Дата сообщения: 26.01.2008 21:43
ZeroTime, послал вам легкий способ.
Трудный здесь описан выше тоже, прочтите внимательнее.
Ослом,к примеру, воспользоваться можно.
А вот будет ли через 30 дней голос Локуендо работать, не знаю пока.
я только что его поставил.
Автор: SkySandy
Дата сообщения: 29.01.2008 05:26
to SergeySPB

Тогда и мне плиз вышлите этот способ. Все голоса уже скачал :-)
Автор: vikkiv
Дата сообщения: 29.01.2008 16:53

Цитата:
Тогда и мне плиз вышлите...

Появился местный способ установки Loquendo подробней здесь. Проверить не успел но источник сомнений не вызывает...
Ещё один тестовый линк для Loquendo
Автор: SergeySPB
Дата сообщения: 29.01.2008 20:02
SkySandy, послал вам легкий способ.
Он у меня работает.
С новой ссылкой от vikkiv пока не сравнивал.

Автор: xxx6286
Дата сообщения: 01.02.2008 19:58
николай 5.1 при записи в мп3 тире между словами читает как ИНДАЖ помогите избавится
Автор: Waasja
Дата сообщения: 03.02.2008 08:15
Я скачал Катьку от НеоСпич. Подскажите пожалуйста, где взять верификейшен-файл и что с ним делать.

Заранее спасибо.

Страницы: 1234567891011121314151617181920

Предыдущая тема: Программа для поиска на фтп


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.