Text-to-Speech system

Аналогично системам преобразования речи в текст (см. sttd).
Также была написана для случаев когда необходимость все иметь локально и чтоб не тормазило.


Написан на C, с использованием: wstk, lame, speex DSP, espeak, onnx, piper.
Способен работать на стандартных серверах, обеспечивает быстрый ответ, подходит для создания диалоговых систем реального времени.


Цена: 350$
Задать вопросы или уточнить детали можно на странице с контактами.
Возможен ознакомительный период с установкой на ваши серверы (предпочтительно Ubuntu 22.04 x64).



Основные возможности:


--- Примеры ---

Request:
curl -q http://127.0.0.1:8802/v1/speech -X POST -H "Authorization: Bearer secret" -H "Content-Type: application/json; charset=utf-8" -d '{"language":"en","samplerate":8000,"foramt":"mp3","input":"Hello, how can I help you?"}'

ответ будет как mp3 поток (файл)