Добавить
Уведомления

Qwen TTS - обучение, клонирование, кастомизация голоса

Qwen TTS - это модель для преобразования текста в речь. Qwen TTS имеет лучшее качество, высокую скорость и низкое потребление VRAM (7 ГБ на старшей модели). Качество сравнимо с платными аналогами ElevenLabs и MiniMax. В этом видео вы узнаете: как преобразовать текст в речь, как клонировать голос, как кастомизировать голос, как записать голос и даже как обучить модель Qwen TTS (fine-tune qwen tts). Все это будет работать в comfyui. МЕНЮ 00:00 - Что такое Qwen TTS 00:40 - Обзор Qwen TTS 02:45 - Установка Qwen 3 TTS в ComfyUI 03:32 - Базовые схемы Qwen TTS 04:32 - Клонирование голоса с Qwen3 TTS 08:00 - Коллекция голосов Qwen TTS 10:46 - Disign Voice - создание своего голоса 11:45 - Multi speaker - озвучка с несколькими спикерами 20:05 - Обучение модели Qwen TTS - Fine tune model 21:36 - Wisper для транскрибации аудио - audio to text 33:56 - Выводы Сборку ComfyUI можно скачать бесплатно тут: https://boosty.to/stabledif/posts/c64c559f-1357-432b-b7c6-19c1f7eb8882 🔥 Мой структурированный курс по "ComfyUI" с моей поддержкой на сайте https://stabledif.ru/comfyui 🔥 Мой структурированный курс по "AUTOMATIC 1111" с моей поддержкой на сайте https://stabledif.ru 🔑 Все ссылки и файлы доступны на Boosty: https://boosty.to/stabledif/posts/0c37a7ee-cc89-4710-a239-9a8cb97790a1 ✔️Телеграм-канал: https://t.me/stabledif_lesson ✔️ Telegram ЧАТ: https://t.me/stable_dif ✔️VK Prompts: https://vk.com/stabledif

Иконка канала StableDif | ComfyUI | Automatic1111
2 158 подписчиков
12+
861 просмотр
месяц назад
12+
861 просмотр
месяц назад

Qwen TTS - это модель для преобразования текста в речь. Qwen TTS имеет лучшее качество, высокую скорость и низкое потребление VRAM (7 ГБ на старшей модели). Качество сравнимо с платными аналогами ElevenLabs и MiniMax. В этом видео вы узнаете: как преобразовать текст в речь, как клонировать голос, как кастомизировать голос, как записать голос и даже как обучить модель Qwen TTS (fine-tune qwen tts). Все это будет работать в comfyui. МЕНЮ 00:00 - Что такое Qwen TTS 00:40 - Обзор Qwen TTS 02:45 - Установка Qwen 3 TTS в ComfyUI 03:32 - Базовые схемы Qwen TTS 04:32 - Клонирование голоса с Qwen3 TTS 08:00 - Коллекция голосов Qwen TTS 10:46 - Disign Voice - создание своего голоса 11:45 - Multi speaker - озвучка с несколькими спикерами 20:05 - Обучение модели Qwen TTS - Fine tune model 21:36 - Wisper для транскрибации аудио - audio to text 33:56 - Выводы Сборку ComfyUI можно скачать бесплатно тут: https://boosty.to/stabledif/posts/c64c559f-1357-432b-b7c6-19c1f7eb8882 🔥 Мой структурированный курс по "ComfyUI" с моей поддержкой на сайте https://stabledif.ru/comfyui 🔥 Мой структурированный курс по "AUTOMATIC 1111" с моей поддержкой на сайте https://stabledif.ru 🔑 Все ссылки и файлы доступны на Boosty: https://boosty.to/stabledif/posts/0c37a7ee-cc89-4710-a239-9a8cb97790a1 ✔️Телеграм-канал: https://t.me/stabledif_lesson ✔️ Telegram ЧАТ: https://t.me/stable_dif ✔️VK Prompts: https://vk.com/stabledif

, чтобы оставлять комментарии