Добавить
Уведомления

Как установить Qwen3 TTS в ComfyUI - бесплатная локальная озвучка и клонирование голоса

В этом видео я подробно показываю, как установить Qwen3 TTS в ComfyUI и настроить бесплатную локальную озвучку текста без подписок и внешних сервисов. Qwen3 TTS — это современная TTS-модель с поддержкой клонирования голоса, кастомных спикеров и русского языка. Нативной поддержки в ComfyUI пока нет, поэтому мы вручную подключим ноды, установим все зависимости и разберёмся, как правильно их использовать на практике. # Таймкоды 00:00 - Qwen3 TTS примеры генерации 01:00 - Установка Qwen3 TTS 03:57 - Общий обзор TTS моделей 04:38 - Как клонировать голос 15:08 - Кастомные голоса 18:20 - Дизайн голоса 23:15 - Выводы # Команды .\python_embeded\python.exe -m pip install -r .\ComfyUI\custom_nodes\ComfyUI-Qwen-TTS\requirements.txt .\python_embeded\python.exe -m pip install onnxruntime (если выдаст ошибку импорта) # Шаблон для Voice Design gender: Определяет пол голосовой идентичности. pitch: Задаёт высоту голоса и её изменение в зависимости от эмоционального состояния. speed: Контролирует темп речи и его динамику в процессе произношения. volume: Определяет громкость речи и то, как она усиливается при эмоциональном всплеске. age: Задаёт воспринимаемый возраст говорящего по тембру и манере речи. clarity: Отвечает за чёткость произношения и разборчивость звуков. fluency: Определяет плавность речи, наличие или отсутствие пауз, запинок и слов-паразитов. accent: Задаёт акцент и региональную манеру произношения. texture: Описывает тембральную окраску голоса (яркость, «чистота», насыщенность). emotion: Управляет эмоциональной динамикой и переходами между состояниями. tone: Определяет коммуникативный тон речи - отношение говорящего к собеседнику. personality: Формирует характер и поведенческую модель голоса в диалоге. # Ссылки Официальный сайт Qwen3 TTS - https://qwen.ai/blog?id=qwen3tts-0115 Ноды (GitHub) - https://github.com/flybirdxx/ComfyUI-Qwen-TTS

Иконка канала Нейрослав
34 подписчика
12+
264 просмотра
2 месяца назад
12+
264 просмотра
2 месяца назад

В этом видео я подробно показываю, как установить Qwen3 TTS в ComfyUI и настроить бесплатную локальную озвучку текста без подписок и внешних сервисов. Qwen3 TTS — это современная TTS-модель с поддержкой клонирования голоса, кастомных спикеров и русского языка. Нативной поддержки в ComfyUI пока нет, поэтому мы вручную подключим ноды, установим все зависимости и разберёмся, как правильно их использовать на практике. # Таймкоды 00:00 - Qwen3 TTS примеры генерации 01:00 - Установка Qwen3 TTS 03:57 - Общий обзор TTS моделей 04:38 - Как клонировать голос 15:08 - Кастомные голоса 18:20 - Дизайн голоса 23:15 - Выводы # Команды .\python_embeded\python.exe -m pip install -r .\ComfyUI\custom_nodes\ComfyUI-Qwen-TTS\requirements.txt .\python_embeded\python.exe -m pip install onnxruntime (если выдаст ошибку импорта) # Шаблон для Voice Design gender: Определяет пол голосовой идентичности. pitch: Задаёт высоту голоса и её изменение в зависимости от эмоционального состояния. speed: Контролирует темп речи и его динамику в процессе произношения. volume: Определяет громкость речи и то, как она усиливается при эмоциональном всплеске. age: Задаёт воспринимаемый возраст говорящего по тембру и манере речи. clarity: Отвечает за чёткость произношения и разборчивость звуков. fluency: Определяет плавность речи, наличие или отсутствие пауз, запинок и слов-паразитов. accent: Задаёт акцент и региональную манеру произношения. texture: Описывает тембральную окраску голоса (яркость, «чистота», насыщенность). emotion: Управляет эмоциональной динамикой и переходами между состояниями. tone: Определяет коммуникативный тон речи - отношение говорящего к собеседнику. personality: Формирует характер и поведенческую модель голоса в диалоге. # Ссылки Официальный сайт Qwen3 TTS - https://qwen.ai/blog?id=qwen3tts-0115 Ноды (GitHub) - https://github.com/flybirdxx/ComfyUI-Qwen-TTS

, чтобы оставлять комментарии