开源AI语音模型实现90分钟四人中文对话生成
8 月 27 日消息,科技媒体 marktechpost 于 8 月 25 日发布博文,报道称微软发布开源文本转语音(TTS)模型 VibeVoice-1.5B,可一次生成最长 90 分钟、最多 4 位不同说话者的自然语音,并支持跨语言及歌声合成。 在架构方面,VibeVoice...
8 月 27 日消息,科技媒体 marktechpost 于 8 月 25 日发布博文,报道称微软发布开源文本转语音(TTS)模型 VibeVoice-1.5B,可一次生成最长 90 分钟、最多 4 位不同说话者的自然语音,并支持跨语言及歌声合成。 在架构方面,VibeVoice...
OpenAI年收入突破100亿美元,主要得益于消费产品及API收入,但需应对高额人才及基础设施成本。
谷歌AI搜索功能导致新闻网站流量锐减,出版商通过内容合作和广告共享等新商业模式应对AI冲击,寻求可持续发展路径。
扎克伯格亲自组建团队推动超级智能研发,应对AI竞争,挑战通用人工智能实现目标,同时与OpenAI等巨头展开激烈角逐。
文章分析英伟达与英国合作推动AI硬件发展,展现AI性能百万倍飞跃,强调硬件升级与政府产业合作对行业未来的关键影响。
研究证实多模态大语言模型可自发形成类人物体概念表征系统,揭示AI认知新路径,为构建类人智能系统奠定理论基础。
6 月 12 日消息,据彭博社 11 日报道,亚马逊首席安全官史蒂夫・施密特呼吁减少 AI监管,与多家大型科技公司高管立场一致,警告政府过度干预这一快速发展领域可能限制公司业务拓展。 史蒂夫・施密...
6 月 20 日消息,据 The Information 昨日报道,消息人士透露,Meta 公司正与 GitHub 前 CEO Nat Friedman 接触,欲将其招入 AI 团队。 报道补充道...
6 月 21 日消息,据外媒 TechCrunch 今日报道,在数周前发布研究指出其 Claude Opus 4 模型在受控测试中试图通过勒索手段阻止被关闭后,Anthropic 近日再度公布新研...
据“网信中国”公众号消息,“清朗・整治 AI 技术滥用”专项行动自 2025 年 4 月启动以来,中央网信办聚焦 AI 换脸拟声侵犯公众权益、AI 内容标识缺失误导公众等 AI 技术滥用乱象,深入...
6 月 21 日消息,谷歌正利用其庞大的 YouTube 视频库训练 Gemini 和 Veo 3 等 AI模型,这一做法令不少创作者感到震惊。 据美国 CNBC 19 日报道,谷歌正调用 You...
清华大学研究团队 6 月 19 日发布《AI 赋能教育:高考志愿填报工具使用指南》。据悉,该《指南》聚焦高考志愿填报中的十大典型需求,提供了 100 个专业的深度搜索提示语供考生和家长使用。 在工...
6 月 21 日消息,1AI从月之暗面 Kimi 公众号获悉,Kimi 的第一个 Agent(智能体)Kimi-Researcher 于 20 日开启小范围灰度测试。 Kimi-Researche...