Ru-Board.club
← Вернуться в раздел «Программы»

» Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Автор: Speechpro
Дата сообщения: 03.04.2009 17:03
1. Ударения выставлять можно
2. Скорость речи диктора можно регулировать

****************

Система «VitalVoice»

Основные характеристики :

Два синтезируемых голоса – мужской и женский;
Размер морфо-грамматического словаря – до 100 тыс словоформ.
Создание собственного голоса под заказ;
Синтаксический и семантический анализ.
Управление ритмикой и интонацией синтезированной речи в зависимости от содержания текста.
Естественное «человеческое» звучание синтезируемой речи;
Согласование падежей и времён;
Правильное произнесение имен собственных, числительных, сокращений и аббревиатур;
Изменения темпа речи – замедление или ускорение темпа до двух раз;
Возможность изменения основного тона голоса – от -25% или +50% относительно среднего значения;

Stroodder
1. Битрейт 64 кбит\с
2. Над интонацией работаем. Она не случайная но плавность голоса будет значительно улучшена. Сейчас идет разметка по эмоциональному состоянию диктора, что приведет к значительному улучшению реализации интонации. Исчезнут неуместные эмоциональные проявления. Не будет резких всплесков в интенсивности речи.
3. Не каждая запятая выражается паузой. Обработка знаков препинания намного сложнее.

Знак ударений естественно есть

SelenaNight

Русский язык настолько богат сочетаниями аллофонов, что иногда точных не находится и приходится брать близкие.



Автор: SelenaNight
Дата сообщения: 03.04.2009 22:57
Speechpro
да я не ругаю, я просто расстраиваюсь каждый раз, очень уж хочется, чтоб заговорил компьютер по-человечески
еще десять лет назад обещали, что не сегодня-завтра компьютер еще и понимать будет человеческую речь... а воз и ныне там
и кстати, не только русский язык такой, с польскими голосами та же ситуация
Автор: sadasd
Дата сообщения: 10.04.2009 14:44
Подскажите пожалуйста программу для чтения на двух языках в завивимости от текста, у меня есть вот эта - http://depositfiles(точка)com/files/uuaim1saf, но дело в том что новейший движок Olga в этой проге используется с низкой частотой и звучит хуже чем он есть (с етим движком та же ситуация в программе Textaloud)
Автор: Hmuryj_Mik
Дата сообщения: 15.04.2009 23:43
Все перепробовал. Все раздражают "подвываниями"
Колю только терплю, даже забавны некоторые читаемые им "обороты". Только сколько-ж лет нужно, что-бы реализовали синтез получше? Может и Николай получился чисто случайно ...
Автор: ALEX666999
Дата сообщения: 16.04.2009 00:05
Hmuryj_Mik
Предполагаю, что потенциальным создателям заморачиваться не хочется: для создания движка всяческих затрат выйдет больше, чем срубят бабла, из-за пиратства и т.п.
Автор: Cosmotron
Дата сообщения: 16.04.2009 11:05


Цитата:
Все перепробовал. Все раздражают "подвываниями"
Колю только терплю, даже забавны некоторые читаемые им "обороты"

Аналогично
Автор: ALEX666999
Дата сообщения: 16.04.2009 12:23
Меня в Мыколе бесит картавость. Так то чёрт с ним с подвыванием (это вы видимо имеети ввиду что гласные тянет?)
Автор: Seymour
Дата сообщения: 03.05.2009 21:04
Mister_Che

Цитата:
Извините, а что нужно скачать, чтобы компьютерный голос читал текст и чтобы качать не много надо было, не эти 200метровые файлы. Объясните, пожалуйста, подробно.

Вот - полный комплект Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - всего 13 Мб (зеркало). Там все, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Эксклюзив!

Также понадобится программа для чтения текста (говорилка), я рекомендую DeskBot (версию mini) - полное использование всех наворотов технологий MS Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0 - 5.x, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб. Там же можно найти дополнительные анимированные персонажи от сторонних разработчиков. Ну и движки тоже другие можно попробовать, если стандартный TTS3000 не устроит.

Всем остальным, кто интересуется этой темой также рекомендую скачать дистрибутив Microsoft Speech API 5.1 - полный комплект со всеми голосовыми движками для Windows 95-XP. Собран собственноручно из msm-модулей с этой странички - 40 Мб. Или только SAPI без движков (включен в архив MSAgent.rar) - 500 Кб. Эксклюзив!

SAPI 5.1 также можно найти здесь и здесь - абсолютно идентичные моим дистрибутивы, сделанные из тех же вышеупомянутых msm-модулей. По первой ссылке качается версия для Windows 95-2000, по второй для Windows 95-XP. На XP устанавливается только Mike + Mary Voices Addon, т.к. SAPI и TTS Engine (Sam Voice) на нее уже предустановлены. Если не нужен английский голосовой движок, то лучше качать мою 500 килобайтную версию.

SAPI 5.3 является неотъемлемой частью Windows Vista и отдельно не распространяется.
Автор: Seymour
Дата сообщения: 08.05.2009 00:31
Модераторам: шапку бы надо включить, и оформить по-человечески кому-нибудь, а то уже на 19 страниц темка расползлась. А эту тему закрыть, а ссылку в шапку кинуть, когда появится.
Автор: alex6886
Дата сообщения: 01.06.2009 15:43
Подскажите а как сделать чтоб Ольга могла чихнуть или кашлянуть,или издать какой-нибудь вздох между словами?Где-то в демке я слышал такое...Вот здесь:
http://www.loquendo.com/en/audio/Olga.mp3
Автор: Voleon
Дата сообщения: 05.06.2009 16:22
alex6886
я думаю это специальные теги должны быть в тексте программы, как на странице http://tts.loquendo.com/ttsdemo/default.asp?page=id&voice=Olga . У меня не получись у себя воспроизвести.
Имхо: По ощущениям голос Аленка лучше чем Ольга, тем более с подключенными словарями. он мягче читает.
Автор: maK
Дата сообщения: 05.06.2009 19:09
alex6886

Запустить TTS Director, выбрать Effects, разметить наличный текст ...
Автор: Hiken
Дата сообщения: 05.06.2009 20:16
Подскажите, можно ли как то сделать, чтобы английский текст читал голос вроде Kate, а русский - та же Катя? Какой на данный момент лучший русский голосовой движок? Подскажите пожалуйста также лучший немецкий, кто пробовал..
Автор: AnitrA
Дата сообщения: 12.06.2009 01:04
чето я так и не понял что качать и как юзать... чего так сумбурно то все
Автор: AmitaKrishna
Дата сообщения: 14.06.2009 17:26
Кто-нибудь знает, где взять голоса Sangeeta (индийский английский) и Lekha (хинди) для RealSpeak TTS? Судя по демкам Лекха отлично читает на хинди и это единственный из существующих голосов для этого языка.
Автор: fty
Дата сообщения: 15.06.2009 22:28
Seymour
Спасибо за файлы и подробное описание!
Автор: PONN
Дата сообщения: 17.06.2009 08:59

Цитата:
Привет! Кто знает, как можно записать в мп3 смешанный текст (англ и русск)? Пробовал mp3book, textaloud, cool audio везде для чтения используется только один движек, либо русский либо английский....


http://www.kom-pas.narod.ru/audiobook_net.htm

Итак программа AUDIOBOOK может:

Анализ диалогов + Поддержка тегов и Чтение по ролям: 1. Русский - Английский. 2. Мужской - Женский...

а так же:

1) Использовать TTS Engine стандартов SAPI 4 и SAPI 5.
2) Записывать текст в файлы форматов: MP3, OGG, WMA, WAV, VOX, AU, AIFF.
3) Писать речь в файл с максимальной скоростью.
4) Автоматически разбивать книгу на фрагменты при записи.
5) Продолжать незаконченную работу (загружать автоматически сохраненный проект для последующей обработки).
6) Автоматически очищать текст от ошибок с произношением типа "ПРОСТРАНСТВА" на Digalo и Elan.
7) Использовать анализатор диалогов. Читать и писать книги применяя уникальную технологию прадварительной разметки текста.
8) Использовать индивидуальны словари работающие на основе регулярных выражений для каждого голоса. См. Пример 1 и Пример 2.
Автор: maK
Дата сообщения: 17.06.2009 10:02
Первое впечатление - "гасите свет!" Версия программы 1.4.2 и такое убожество (в частности: 3 запуска - 2 вылета).
Автор: PONN
Дата сообщения: 18.06.2009 03:45

Цитата:
Первое впечатление - "гасите свет!" Версия программы 1.4.2 и такое убожество (в частности: 3 запуска - 2 вылета).


Странно у меня все ок.
Автор: Cosmotron
Дата сообщения: 18.06.2009 09:35

Цитата:
3 запуска - 2 вылета

Да, у меня тоже первый раз при запуске вылктела, плюс в работе глюков хватает, но автор предупреждал - это хобби проект + нету времени, так что нормальная ситуация, отписываемся ему по глюкам, и глядишь - через годик будет конфетка, а еще через год - $50....
Автор: XATAXAMA
Дата сообщения: 21.06.2009 23:45
Люди, а какие "читалки" могут выделенный в любой программе фрагмент текста прочитать по нажатию комбинации клавиш или "росчерку" мыши?
Я только у "Speak Aloud" в описании такую возможность видел, и найти её в доступном виде пока не удаётся.
Может, ещё что-нибудь есть?
Автор: sdkeeper
Дата сообщения: 10.07.2009 15:42
Если имеется в виду чтение "буфера" - то могу посоветовать программу Balabolka
Автор: XATAXAMA
Дата сообщения: 12.07.2009 05:00
Спасибо за совет, Балаболкой я уже давно пользуюсь.
Но идеально хотелось бы, чтобы:
а) на буфер это не влияло, и
б) работало по хоткею из другой программы...
Автор: Seymour
Дата сообщения: 23.07.2009 03:47
Обновил архив с MSAgent (чуть чуть подправил инструкцию)
Автор: vikkiv
Дата сообщения: 25.07.2009 02:04
Ветка про Loquendo обновилась новым голосом - Дмитрий
Автор: Sylvia
Дата сообщения: 29.07.2009 14:12

Цитата:
Ветка про Loquendo обновилась новым голосом - Дмитрий

А его можно где-то скачать?

Автор: Proktolog
Дата сообщения: 31.07.2009 21:42
AnitrA
Качать/инсталить нужно 3 вещи
- голосовой движок (я юзаю алену, не знай почему николая все хвалят, оля с аленой получше говорят)
- Microsoft Speech API 5.1
- программу говорилку (я юзаюTextaloud, хороший выбор также балаболка и MP3BOOK2005)

Вот кстати вопрос ко всем - какая по вашему мнению говорилка наиболее удобна для быстрого конвертирования текста в mp3-файлы? В textaloud что не устраивает - не получилось пакетное создание /обработка нескольких фалов
- ограничение на размер wav 2 ГБ
Автор: Sylvia
Дата сообщения: 03.08.2009 10:20
Proktolog

Цитата:
Вот кстати вопрос ко всем - какая по вашему мнению говорилка наиболее удобна для быстрого конвертирования текста в mp3-файлы?

Вы же сами ответили выше

Цитата:
хороший выбор также балаболка и MP3BOOK2005

Присоединяюсь.

Автор: farida
Дата сообщения: 03.08.2009 17:58
Да конечно это не начитанная поставленным дикторским голосом книга, но через 5-10 минут к некоторым ошибкам произношения и интонирования привыкаешь и становится практически не отличимо от человеческого голоса.
Делюсь своими наработками в области конвертации текста в голос т.е. как перевести текст в аудиокнигу.
Во первых на сегодня (на февраль 2009) из всех опробованных TTS (Text to Speech) движков лучший результат выдает Acapela-Group Алёна SAPI5/SAPI4.

Прослушать пример можно прямо на сайте производителя 111www.acapela-group.com/download-infovox-desktop-text-to-speech-dem...

Преобразование текста в голос

Для установки необходимо скачать 2 модуля:
Движок: 111www.acapela-group.com/FDownload2.php?FId=96 (24Mb)
Сам голос: 111www.acapela-group.com/FDownload2.php?FId=97 (150Mb)

Скачав и установив, мы получим полнофункциональную 30-и дневную версию. Через 30 дней она просто откажется работать… как это обойти, я поясню чуть ниже.


Чем записывать

Кроме того, сразу скачиваем программку, которая будет записывать аудиокниги.

Таких программ несколько, но для себя я остановился на Балаболке как наиболее оптимальном варианте.

1111www.cross-plus-a.ru/balabolka.html

Программа совершенна бесплатна.

взято из 111ancher.ru/content/19-02-2009/audioknigi-delaem-sami
Автор: triskach
Дата сообщения: 04.08.2009 08:41
Text to Speech Maker это лучшая программа для преобразования текста в речь, позволит вам прослушивать документы, почту или web страницы вместо их чтения на мониторе. Позволяет превращать текст в WAV, MP3 или VOX файлы для прослушивания на вашем компактном MP3 плеере.


Основные качества:
Поддерживает множество мужских, женских или роботизированных голосов на нескольких языках;
Быстрая скорость конвертирования;
Чтение и Конвертирование файлов происходит без временных файлов, что экономит место на жестком диске и обеспечивает высокую скорость конвертирования;
Поддерживает Функцию MP3 качества;
Поддержка шрифтовых настроек;
Удобный пользовательский интерфейс;
Быстрая скорость работы.
Таблетка в архиве.

Скачать | Download Text to Speech Maker 1.6.7 (12,11 MB):
LetItBit: http://letitbit.net/download/fac365821422/ferrocan-Text-to-Speech-Maker-v1.6.7.rar.html
DepositFiles: http://depositfiles.com/files/s8w7uylej
RapidShare: http://rapidshare.com/files/182682693/ferrocan_Text_to_Speech_Maker_v1.6.7.rar

+Голосовой движок Acapela Alyona (русский) -самый лучший на сегодняшний день. Так же добавлю что лично мне движок понравился — произношение просто отличное, но встречаются ошибки — поэтому составление словаря должно исправить положение.
Компания Acapela разработчики популярного русскоязычного голосового модуля Николай, выпустили новый русский, женский голосовой движок, который получил название Алёна, работает на SAPI-5 с частотой 22 КГц , по качеству синтезируемой речи Алёна намного опережает Николая, тембр голоса и интонация по мнению пользователей приятней чем у движка Катерина от ScanSoft RealSpeak.

Вместе с движком поставляется Lexicon Manager — редактор словарей, который позволяет изменять произношение слов как буквенно, так и фонетически.

Доп. информация: Text-to-speech engine или движки синтеза речи — это программы выполненные в виде системного драйвера, предназначенные для преобразования текста в речь. Движки синтеза речи не имеют внешнего интерфейса, поэтому для того, чтобы Ваш компьютер заговорил, не достаточно установить только движок. Для использования движка необходима программа синтеза речи (TextAloud, Cool Reader, Balabolka и т.д), которая выполняет роль интерфейса, позволяет работать с движком, изменять его настройки, звучание речи, использует дополнительные возможности. В нашем случае это программа Text to Speech Maker 1.6.7
Скачать depositfiles.com
Скачать vip-file.com
Скачать letitbit.net
Таблетка в архиве

Страницы: 1234567891011121314151617181920

Предыдущая тема: Программа для поиска на фтп


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.