Ru-Board.club
← Вернуться в раздел «Программы»

» Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Автор: vikkiv
Дата сообщения: 09.02.2009 03:12
astashov
Здесь попробуй, может чего и пригодится. Вообще-то и другие производители под сервера делают - но так сразу не найду. Поройся там на начальной странице по поставщикам...
Автор: astashov
Дата сообщения: 15.02.2009 18:16
vikkiv

Цитата:
Здесь попробуй, может чего и пригодится. Вообще-то и другие производители под сервера делают - но так сразу не найду. Поройся там на начальной странице по поставщикам...


Да в принципе посмотрел еще до твоего поста, только вот я там что-то руского голоса не нашел. Может можно как-то к Cepstral русский голос прикрутить?
Автор: Legos
Дата сообщения: 17.02.2009 00:33
Был бы благодарен за пояснение в чем дело:
Скачал Алену.
При установке на лицензионные и не лецензионные Винды (виста, хрюн)выдается сообщение (с переводом в Промте):

----
The contents of this file cannot be unpacked. The executable you are attempting to run has been corrupted.
Please obtain another copy of the file, verifi its integrite, and try again


Содержание этого файла не может быть распаковано. Выполнимое, которым Вы пытаетесь управлять, было развращено. Пожалуйста получите другую копию файла, проверьте его целостность, и попробуйте еще раз
---
Что за хрень и как с эти бороться ?
Автор: Rodny
Дата сообщения: 17.02.2009 00:50
Legos
Значит, при скачивании произошла ошибка, файл повреждён. Нужно качать заново.
Автор: Legos
Дата сообщения: 17.02.2009 00:51
Ссори забыл указать что за Алена:
_http://softgate.ru/2008/07/31/golosovojj_dvizhok_acapela_alyona_russkijj.html

Добавлено:

Цитата:
Значит, при скачивании произошла ошибка, файл повреждён. Нужно качать заново.

И всего то .
Счас перекачаю...пасиб

Автор: vikkiv
Дата сообщения: 17.02.2009 02:56
astashov
Неа, у Cepstral Русского нету, Sakrament (2) вроде из местных компаний на альтернативные платформы ориентируется - но у них сейчас акцент в основном на мобильные...

В общем не знаю, мы простые пользователи, лично я кроме MS-Windows систем никакими серьёзными примочками не обвешивал - поэтому тут не смогу помочь.
Единственное что приходит на ум с поддержкой русского это Loquendo (2) Linux и Acapella-Group (2) Linux.
И у обеих компаний есть рынок серверных голосовых систем - у Loquendo даже лично видел под Линукс, правда не помню на какой....

В условно-свободном доступе из этого всего ничего не видел (на самом деле просто никогда не интересовался) - поэтому это вовсе не исключает что возможно где-то и есть, да и производители часто устраивают демо-раздачи для разработчиков (по крайней мере так пишут на сайтах типа свяжитесь с нами) и т.д.
Автор: astashov
Дата сообщения: 17.02.2009 19:22
vikkiv

спасибо. посмотрю
Автор: dred707
Дата сообщения: 03.03.2009 14:08
Всем привет!

1. Установил голосовой движок: c:\Program Files\Character Builder\Speech Packs\NeoSpeech Kate\
2. Подключил его в программе TextAloud
3. В программе TextAloud попробовал этим голосовым движком озвучить английский текст.

Озвучивает нормально, но перед озвучкой идет краткая инфа, кажись, рекламного характера, а если учесть, что зачастую пару слов надо только озвучить, то эта инфа перед началом озвучки раздражает (в голосах по умолчанию в TextAloud такого перед началом озвучки нет). Как ее убрать?
Автор: LaVas_ki
Дата сообщения: 04.03.2009 17:30
наблюдаю проблемы с громкостью и сапи4 и сапи5 у николая 5.1 - работают очень тихо по отношению к другим звукам, другим программам, и даже другим синтезаторам ))) девки после него вообще как гром с ясного неба - все громко и четко).... однако...

при чем сапи4 ваще еще тише сапи5 самогоже николая... практчиски шепот!
это можно как то решить?
Автор: Uraanfgh56
Дата сообщения: 14.03.2009 14:29
Подскажите пож-та программу или голосовой модуль для чтения книг (лучше мужским голосом) из форматов txt и doc. Желательно по возможности что бы голос был не как в Magic Goody - бубнёж , ну и по возможности настройки - чтобы лучше настроить ...
Автор: MaxMIsaev
Дата сообщения: 16.03.2009 13:06
" Вниманию уважаемой публики представляется новая Text To Speech программа RussAcc фирмы BZ Soft. Она предназначена для озвучивания текстов, создания аудиокниг (в формате wav, mp3, amr, vmo), расстановки ударений в русских текстах (отсюда и ее название - сокращенное Russian Accents).
Это только первая версия, но уже сейчас по довольно многим параметрам она превосходит программы, существующие годами (каждую в своем).
Некоторые программы во время озвучивания текстов, только выделяют (т.е. даже и не цветом) текущий читаемый абзац целиком. RussAcc выделяет цветом текст текущего предложения, в зарегистрированной версии можно установить и цвет фона подсветки читаемого фрагмента. Также некоторые программы выделяют каждый раз нижний абзац и для каждого нового абзаца перемещают весь текст вверх; когда абзацы маленькие, то текст часто "дергается". RussAcc же проходит по странице сверху донизу и только после этого перелистывает ее.
Для mp3 в режиме VBR можно указать минимальный и максимальный битрейты, а также качество VBR. Для AMR можно выбирать из 8 значений битрейта. Для создания AMR из WAV RussAcc не использует промежуточные форматы.
В конце записи, если количество файлов-блоков больше одного, создается список файлов в формате m3u.
Многие программы используют для определения верного ударения текстовые правила типа "освобождени*=освобожде<ни". RussAcc же в своей базе для каждого слова имеет все его формы с их грамматическими параметрами и ударениями (всего более 3 миллионов форм). Для слов с неоднозначным ударением он рассматривает какие слова стоят рядом и какие у них грамматические параметры и на этой основе делает выбор.
По скорости автоматической расстановки ударений RussAcc обгоняет ближайшего конкурента, использующего грамматические параметры, почти на порядок (для обработки мегабайта текста требуется всего несколько секунд).
Кроме режима автоматической расстановки ударений в программе RussAcc есть режим расстановки с подтверждением. В этом режиме программа предоставляет пользователю возможность скорректировать ударения для слов с неоднозначным ударением. Коррекция производится кликом мыши на выбранной гласной слова - быстро и удобно. С помощью этого режима RussAcc позволяет добиться почти идеального качества расстановки ударений, по-видимому, недоступного ни для каких других программ при таких относительно небольших временных затратах (при больших можно и в блокноте).
RussAcc обладает современным визуальным интерфейсом, используются окна-лотки с режимом Auto Hide (Автоскрытие), 32-битные иконки, XP-шные темы оформления.
В диалоге записи указывается сколько прошло времени и сколько примерно осталось, указываются не только минуты, но и секунды.
RussAcc работает и с Алёной и с Николаем и с другими движками, но рекомендуем, конечно, Николая. (Этому выбору, между Алёной и Николаем, в файле справки посвящен целый раздел.)

Налетай, торопись, покупай звукопись! (Предварительно скачав).
http://bzsoft.spb.ru/russacc.html "
Автор: Gideon Vi
Дата сообщения: 17.03.2009 10:53
MaxMIsaev, зачем экзешник в хлам убивать? Тот же DrWeb с ума сойдёт, пока такое проверять будет.
Автор: Trost
Дата сообщения: 17.03.2009 15:36
Кстати, автоматическая расстановка ударений в RussAcc на порядок лучше чем в MP3Book. Пробовал с Николаем. Еще бы туда авторы пользовательский словарь ударений добавили - была бы реальная конкуренция для MP3Book. И по цене вполне приемлимый продукт.
Автор: MaxMIsaev
Дата сообщения: 22.03.2009 13:03
Уважаемому глубокому космосу (судя по количеству сообщений) представляется версия 1.0.1 программы RussAcc.
Улучшен алгоритм сохранения параметров окна при выходе из программы. Произведены некоторые изменения, связанные с фокусом (выбором) окон после закрытия окон-лотков. С этой версии RussAcc помнит текстовую позицию для 50 последних файлов. В меню "Файл" к имеющимся недавним файлам добавлен пункт "Недавние папки" (до 16 штук).
Неужели участники такого форума не попробовали программу с самыми разными движками? Не могли бы форумчане, если таковые имеются, поделиться информацией, с какими движками, в каких режимах использовали RussAcc, есть ли замечания, все ли работает. А то ощущение, что это скринсэйвер, изображающий форум, и одновременно напоминает затишье перед... акцией по дискредитации.
Автор первого вопроса, наверное сам знает ответ на него, но это не самая мощная защита программ, какая бывает. Автору второго сообщения спасибо за положительную оценку RussAcc и за упоминание о тестировании с Николаем. Правда в этом сообщении есть несколько поводов для вопросов. Упомянем только, что, например, по маленькому скриншоту на странице программы видно наличие словаря (кнопка "... для всех текстов, т.е. в словарь"), написано о нем и в справочной системе.

http://bzsoft.spb.ru/russacc.html
Автор: 7615790
Дата сообщения: 22.03.2009 14:40
Приветствую MaxMIsaev
Думаю "....затишья перед... акцией по дискредитации." в ближайшее время не планируется, потому что Ваша программа (кстати, очень даже не плохая!) пока "не раскручена" т.е. никто о ней не знает, поэтому делайте выводы.
Теперь по софту:
- Обнаружил старую "болячку" все аналогичных програм - это произношение "е" и "ё" а если точнее то слов "все" и "всё".

- Так и не нашел всех "наворотов", описанных в Help к программе RussAcc (.......Или, например, в RussAcc могут использоваться правила типа "если в радиусе n слов от слова "стоит" находится слово, основная форма которого имеется в списке денежных единиц (рубль, копейка, грош и т.п.), то более вероятно ударение "сто<ит", чем "стои<т".

- на мой взляд, удобней было бы, если "скорректированный" файл (там где программа проставила ударения, появлялся сразу в рабочем окне программы, т.к. заново открывать файл dig_ххххххх.txt не совсем удобно. (не смертельно, но, не удобно!!

И на последок! К сожалению почувствовать всю мощь вашего детища проблематично, по одной простой причине, когда урезано половину функций, то и отзывов вы получите ровно на столько, на сколько дали попробовать программу. Триальная версия (по времени, но полнофунционал) дала бы вам больше отзывов о всех проблемках и усовершенствованиях, связанных с вашей программой.
А так программа очень даже ничего. Особенно радует, что автор пошел по единственно правильному пути - не раздувать пользовательский словарь, а формировать правила чтения! С удовольствием буду следить за Вашим развитием!

Автор: sdkeeper
Дата сообщения: 24.03.2009 17:02
Нет никакого интереса тестировать программу, которой в дальнейшем не будешь пользоваться.
А пользоваться не буду по причине платности программного продукта. По тем же причинам не пользуюсь существующей уже давно MP3book2005.
KoobAudio, Balabolka и Demagog - мой выбор. 8)
Автор: Wasil
Дата сообщения: 25.03.2009 17:50
Полностью поддерживаю sdkeeper. Да и словарь в Balabolka с ударениями ставится неплохо. Практически процентов на 90% Алена правильно читает текст.
Автор: Speechpro
Дата сообщения: 01.04.2009 13:56
Приветствую All!

Центр речевых технологий заканчивает проект по созданию синтеза естественной русской речи и выводит на рынок новый продукт "Живой голос". На сегодняшний день существует два голоса Александр и Мария. К концу лета голосов будет 8. 4 мужских и 4 женских.
Описание и примеры звучания можно прослушать здесь:
http://speechpro.ru/rus/company/tech/vital-voice/

Вопросы и конструктивная критика приветствуются
Автор: maK
Дата сообщения: 01.04.2009 18:37

Цитата:
примеры звучания можно прослушать здесь


нет там никаких "примеров звучания"
Автор: pisid
Дата сообщения: 02.04.2009 01:32
мак, есть они там, там кнопками между обзацами.
Движок очень даже не плох!
Автор: maK
Дата сообщения: 02.04.2009 05:44
pisid

Блокировка флэша была включена ) Другой вопрос: как этим добром разжиться?
Автор: SelenaNight
Дата сообщения: 02.04.2009 07:13
Слабенькие пока эти Александр и Мария
Автор: dimzdrec33
Дата сообщения: 02.04.2009 11:04
SelenaNight

Категорически не согласен. По крайней мере тот текст, который они читают, лучше бы не прочитал ни один из существующих аналогов.

Единственное, это вопрос как обстоит дело со скоростью чтения? (могут ли они читать быстрее) Потому что такое неторопливое и плавное чтение конечно очень красиво, но вот для чтения книг оно не подойдет из за своей медлительности, и еще хотелось бы иметь возможность прослушать произвольный текст.
Автор: SelenaNight
Дата сообщения: 02.04.2009 13:50
dimzdrec33
Особо не отличаются ни от Ольги, ни от Алены.
И так же "приквакивают", как и они, а интонации и того хуже.
Если цитировать выше приведенный сайт, то "естественность голоса на уровне плавности звучания и интонации" до сих пор лучше всего у Коли
Автор: maK
Дата сообщения: 02.04.2009 15:05

Цитата:
"естественность голоса на уровне плавности звучания и интонации" до сих пор лучше всего у Коли


сегодня уже не 1-е апреля ))
Автор: Ajaja
Дата сообщения: 02.04.2009 18:28
SelenaNight

Цитата:
Особо не отличаются ни от Ольги, ни от Алены.

Для меня это похвала Хотя сам считаю, что до Алены голоса не дотягивают, но это субъективная оценка. В любом случае, голоса звучат очень достойно. ЦРТ - молодцы.

dimzdrec33

Цитата:
Единственное, это вопрос как обстоит дело со скоростью чтения? (могут ли они читать быстрее) Потому что такое неторопливое и плавное чтение конечно очень красиво, но вот для чтения книг оно не подойдет из за своей медлительности, и еще хотелось бы иметь возможность прослушать произвольный текст.

+1
Вопрос скорости тоже очень интересует.
Автор: SelenaNight
Дата сообщения: 02.04.2009 18:28
maK
Какие шутки?
Разумеется "человечности" у Коли никакой, явный андроид. Ударять его нужно учить, и во многих случаях невозможно откорректировать произношение слов (например, слово в кавычках в его словарь исключения не добавить).
Но я писала о "плавности звучания и интонациях". Здесь ему конкурентов нет.
Синтезаторы слушаю много и давно очень. И Катю, и Алену, и Ольгу поставила (пробовала и все, что встречалось ранее), но комфортно слушать можно только Колю. Кстати, его интонации на уровне неплохого живого чтеца (аудио-книги тоже слушаю в большом количестве, есть с чем сравнить).
Автор: maK
Дата сообщения: 02.04.2009 23:33

Цитата:
его интонации на уровне неплохого живого чтеца


... да, что б я так жил! ))))) Если Коля неплохой чтец, тогда я - китайский император ))
Автор: dimzdrec33
Дата сообщения: 03.04.2009 02:00
SelenaNight

На вкус и цвет как говорится...но это уже слишком мне кажется. Какая естественность и человеческие интонации в голосе робота? Насчет "квакания" я еще соглашусь, но все остальное просто ерунда....явные придирки...слишком велика привычка к Коле судя по всему. Если слушать его постоянно, то вероятно происходит привыкание и центры в мозгу отвечающие за восприятие синтеза речи просто перестраиваются таким образом, что нормально вопринимают только речь роботов
Автор: Stroodder
Дата сообщения: 03.04.2009 06:56

Приятно, что кто-то что-то делает на почве TTS стремясь к качеству.

1. Битрейт маловат на слух, верхов тоже не хватает ("гУлко") - это примеры пожали или так оно и есть?
2. Интонация рандомная, ощущение, что исходный аудоматериал писался на реальном тексте и близкие соседи звучат неплохо, а вперемежку интонация скачет и атака не к месту практически в каждом предложении. Где начинаются и заканчиваются синтагмы приходится додумывать самому, короче говоря к голосу нужно привыкать, как и ко всем движкам.
3. Зависимость изменения интонации от знаков препинания выражена слабо, а точнее практически никак. По крайней мере в примерах.

Говоря проще на автодиспетчера АТС потянет

З.Ы. Надеюсь разработчики не забудут привинтить стандартный знак указания ударений )))

Страницы: 1234567891011121314151617181920

Предыдущая тема: Программа для поиска на фтп


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.