Loading...

解码AI

解码AI

开源AI语音模型实现90分钟四人中文对话生成

8 月 27 日消息,科技媒体 marktechpost 于 8 月 25 日发布博文,报道称微软发布开源文本转语音(TTS)模型 VibeVoice-1.5B,可一次生成最长 90 分钟、最多 4 位不同说话者的自然语音,并支持跨语言及歌声合成。 在架构方面,VibeVoice...

Sam Altman:2025 年将是 Agent 元年

OpenAI CEO Sam Altman预测2025年AI Agent将全面爆发,尤其编程领域或将主导变革。他强调语音交互与图形界面融合的创新潜力,并指出GPT-3 API作为经济型工具已助力建...

OpenAI 公布 AI 健康基准,新模型媲美人类医生

OpenAI最新推出HealthBench医疗AI评估体系,通过真实对话与医生评分验证,o3模型性能提升28%并超越竞品,AI生成回答质量已接近依赖AI辅助的医生水平,标志医疗领域AI应用迈入新阶...