
bsp; TTS控制从标签到自然语言的转变,本质上是在降低专业门槛。以前调情绪要靠反复录制,现在用一句话描述就能定义音色的细腻层次。这对专业创作者和普通用户都是正向变化。 但问题在于,自然语言控制虽然灵活,却不一定比标签更高效。对
nbsp; 4月16日,阶跃星辰发布新一代语音生成模型StepAudio 2.5 TTS,并已全量上线其开放平台。 同样在4月16日,谷歌发布了Gemini 3.1 Flash TTS,两者都选择了自然语言作为控制入口,指向同一个信号,TTS的控制范式正在从“选标签”
当前文章:http://cilmc.zomuqia.cn/ffs/u6mya8.doc
发布时间:08:59:57