@rf Подскажите tts на русском с локалхостом и опенсурсовое. Если можно будет делать свой голос(хочу прикрутить kasane teto) - будет вообще замечательно. Хостится будет на линуксе, 4гб видеопамяти + 30 рамы
Спросил у Грока, Гемини и Чатгпт. -------------------------------------------------- Ниже — надёжные, полностью офлайн и open-source варианты русскоязычного TTS под Linux с Вашими ресурсами (VRAM 4 ГБ, RAM 30 ГБ), плюс варианты под «свой голос» с учётом Kasane Teto.
Рекомендуемые варианты TTS
Вариант 1. Piper — быстрый офлайн TTS
Лицензия: MIT (и движок, и код), готовые голоса поставляются отдельно. Есть русские голоса (например, ru_RU–irina, ru_RU–dmitri, ru_RU–ruslan, ru_RU–denis). Работает на CPU очень быстро; на Вашей машине проблем не будет. github.com/rhasspy/piper huggingface.co/rhasspy/piper-v…
Вариант 2. Coqui TTS (библиотека) + модель XTTS-v2 — мульти-язычный, экспрессивный, с клонированием голоса
Код фреймворка: MPL-2.0 (open-source).
Модель XTTS-v2 поддерживает много языков, в т. ч. русский, и умеет zero-shot-клонирование; НО лицензия CPML (только некоммерческое использование модели и её выходов). Если нужна коммерция — не подойдёт. github.com/coqui-ai/TTS huggingface.co/coqui/XTTS-v2
Вариант 3. OpenVoice V2 — permissive zero-shot voice cloning
Лицензия: MIT (разрешено коммерческое использование).
Нативно заявлены EN/ES/FR/ZH/JA/KR; модель кросс-языковая, но для русского качество придётся эмпирически проверить (может потребоваться аккуратная нормализация/фонемизация).
Замечание: проект активно развивается, но в официальном описании русский не входит в список «нативно поддержанных» языков; тем не менее заявлено cross-lingual клонирование — проверьте на Ваших текстах. github.com/myshell-ai/OpenVoic…
Запрос был такой --------------------------------------------- Мне нужен Text-To-Speach на русском с работой полностью на моей машине и при этом open source. Если можно будет делать свой голос (хочу прикрутить kasane teto) — будет вообще замечательно. Машиной будет Linux, 4 GB VRAM + 30 GB RAM
Спросил у Грока, Гемини и Чатгпт.
--------------------------------------------------
Ниже — надёжные, полностью офлайн и open-source варианты русскоязычного TTS под Linux с Вашими ресурсами (VRAM 4 ГБ, RAM 30 ГБ), плюс варианты под «свой голос» с учётом Kasane Teto.
Рекомендуемые варианты TTS
Вариант 1.
Piper — быстрый офлайн TTS
Лицензия: MIT (и движок, и код), готовые голоса поставляются отдельно.
Есть русские голоса (например, ru_RU–irina, ru_RU–dmitri, ru_RU–ruslan, ru_RU–denis).
Работает на CPU очень быстро; на Вашей машине проблем не будет.
github.com/rhasspy/piper
huggingface.co/rhasspy/piper-v…
Вариант 2.
Coqui TTS (библиотека) + модель XTTS-v2 — мульти-язычный, экспрессивный, с клонированием голоса
Код фреймворка: MPL-2.0 (open-source).
Модель XTTS-v2 поддерживает много языков, в т. ч. русский, и умеет zero-shot-клонирование; НО лицензия CPML (только некоммерческое использование модели и её выходов). Если нужна коммерция — не подойдёт.
github.com/coqui-ai/TTS
huggingface.co/coqui/XTTS-v2
Вариант 3.
OpenVoice V2 — permissive zero-shot voice cloning
Лицензия: MIT (разрешено коммерческое использование).
Нативно заявлены EN/ES/FR/ZH/JA/KR; модель кросс-языковая, но для русского качество придётся эмпирически проверить (может потребоваться аккуратная нормализация/фонемизация).
Замечание: проект активно развивается, но в официальном описании русский не входит в список «нативно поддержанных» языков; тем не менее заявлено cross-lingual клонирование — проверьте на Ваших текстах.
github.com/myshell-ai/OpenVoic…