Post by Соус Кальве с грибочками

Соус Кальве с грибочками 10 мес. назад • glitchsoc

@rf Подскажите tts на русском с локалхостом и опенсурсовое.
Если можно будет делать свой голос(хочу прикрутить kasane teto) - будет вообще замечательно. Хостится будет на линуксе, 4гб видеопамяти + 30 рамы

@Rоссийская🐻Fедерация

Эта запись была отредактирована (10 мес. назад)

Nokita Kaze 10 мес. назад friendica (DFRN)

Спросил у Грока, Гемини и Чатгпт.
--------------------------------------------------
Ниже — надёжные, полностью офлайн и open-source варианты русскоязычного TTS под Linux с Вашими ресурсами (VRAM 4 ГБ, RAM 30 ГБ), плюс варианты под «свой голос» с учётом Kasane Teto.

Рекомендуемые варианты TTS

Вариант 1.
Piper — быстрый офлайн TTS

Лицензия: MIT (и движок, и код), готовые голоса поставляются отдельно.
Есть русские голоса (например, ru_RU–irina, ru_RU–dmitri, ru_RU–ruslan, ru_RU–denis).
Работает на CPU очень быстро; на Вашей машине проблем не будет.
github.com/rhasspy/piper
huggingface.co/rhasspy/piper-v…

Вариант 2.
Coqui TTS (библиотека) + модель XTTS-v2 — мульти-язычный, экспрессивный, с клонированием голоса

Код фреймворка: MPL-2.0 (open-source).

Модель XTTS-v2 поддерживает много языков, в т. ч. русский, и умеет zero-shot-клонирование; НО лицензия CPML (только некоммерческое использование модели и её выходов). Если нужна коммерция — не подойдёт.
github.com/coqui-ai/TTS
huggingface.co/coqui/XTTS-v2

Вариант 3.
OpenVoice V2 — permissive zero-shot voice cloning

Лицензия: MIT (разрешено коммерческое использование).

Нативно заявлены EN/ES/FR/ZH/JA/KR; модель кросс-языковая, но для русского качество придётся эмпирически проверить (может потребоваться аккуратная нормализация/фонемизация).

Замечание: проект активно развивается, но в официальном описании русский не входит в список «нативно поддержанных» языков; тем не менее заявлено cross-lingual клонирование — проверьте на Ваших текстах.
github.com/myshell-ai/OpenVoic…

Nokita Kaze 10 мес. назад friendica (DFRN)

Запрос был такой
---------------------------------------------
Мне нужен Text-To-Speach на русском с работой полностью на моей машине и при этом open source.
Если можно будет делать свой голос (хочу прикрутить kasane teto) — будет вообще замечательно. Машиной будет Linux, 4 GB VRAM + 30 GB RAM