开源AI语音模型实现90分钟四人中文对话生成
8 月 27 日消息,科技媒体 marktechpost 于 8 月 25 日发布博文,报道称微软发布开源文本转语音(TTS)模型 VibeVoice-1.5B,可一次生成最长 90 分钟、最多 4 位不同说话者的自然语音,并支持跨语言及歌声合成。 在架构方面,VibeVoice...
8 月 27 日消息,科技媒体 marktechpost 于 8 月 25 日发布博文,报道称微软发布开源文本转语音(TTS)模型 VibeVoice-1.5B,可一次生成最长 90 分钟、最多 4 位不同说话者的自然语音,并支持跨语言及歌声合成。 在架构方面,VibeVoice...
日前,OpenAI 研究员 Noam Brown 在接受《Latent Space》的采访,其在节目中深入探讨 AI 推理范式与多智能体未来。 谈及 AI 与人类协作的未来,Noam 强调推理范式...
昨日,Meta 携手美国运动眼镜品牌 Oakley 正式推出全新 AI 智能眼镜——Oakley Meta HSTN。 与此前 Ray-Ban Meta 一样,Oakley Meta HSTN 也...
6 月 22 日消息,2025 世界人形机器人运动会将于 2025 年 8 月 15 日-17 日在国家体育场(鸟巢)和国家速滑馆(冰丝带)举办。即日起,《2025 世界人形机器人运动会比赛规则(...
警方通报AI造谣案例,揭露不实信息传播链,国家网信办专项打击行动已清理违规内容超96万条,相关账号和产品被封禁,维护网络环境安全。
马斯克计划利用Grok重写知识库,删除错误信息,但面临伦理争议与安全风险,引发对AI训练数据可靠性的质疑。
央视曝光AI聊天软件存在低俗诱导内容,引发监管部门约谈。专家指出需完善内容审核机制,明确未成年人网络保护责任,防止AI技术滥用对青少年造成伤害。
OpenAI因商标纠纷被法院禁令要求撤回“io”宣传材料,视频下架,但收购计划未受影响。iyO公司指控商标混淆,法官倾向其立场,双方正评估应对方案。
Perplexity最新智能浏览器搭载创新搜索技术,提供购物车分析、邮件管理、试衣等功能,即将登陆Windows及Android平台,与Opera Neon等竞品展开浏览器领域新角逐。
温网通过AI助手和预测工具革新观赛体验,提供实时互动与动态分析,提升球迷参与度与赛事互动性。
银河通用完成11亿元融资,人形机器人智慧零售方案实现高效部署,通过自动化流程提升零售效率,深化与博世合作推动全球商业化应用落地。
华为与南钢联合研发的"元冶・钢铁大模型"打通全流程数据贯通,推动劳动生产率提升30%、能耗降低15%,构建行业级智能生态助力钢铁业转型。
Yupp推出人工评测系统,用户通过打分生成AI模型排行榜,帮助优化模型表现。积分机制激励用户参与,促进AI技术改进。