开源AI语音模型实现90分钟四人中文对话生成
8 月 27 日消息,科技媒体 marktechpost 于 8 月 25 日发布博文,报道称微软发布开源文本转语音(TTS)模型 VibeVoice-1.5B,可一次生成最长 90 分钟、最多 4 位不同说话者的自然语音,并支持跨语言及歌声合成。 在架构方面,VibeVoice...
8 月 27 日消息,科技媒体 marktechpost 于 8 月 25 日发布博文,报道称微软发布开源文本转语音(TTS)模型 VibeVoice-1.5B,可一次生成最长 90 分钟、最多 4 位不同说话者的自然语音,并支持跨语言及歌声合成。 在架构方面,VibeVoice...
全球人工智能普及度持续提升却伴随信任危机,应用隐患与监管框架需求凸显,中国用户展现出更高的接受度与积极态度,构建跨国治理体系成为迫切议题。
扎克伯格透露Meta将深化AI布局,推动开源模型普及并拓展AR/VR应用,强调AI技术对社交关系与内容生成的深远影响,预示科技行业新发展方向。
苹果开源的FastVLM通过创新混合视觉编码器实现端侧AI高效处理,显著提升图像响应速度并降低计算需求,为智能穿戴设备提供实时视觉交互解决方案。
昆仑万维推出的Matrix-Game大模型突破游戏世界生成技术,通过自主构建数据集与先进框架实现多环境动态控制,结合创新评测体系推动AI在游戏领域的深度应用。
AI智能体平台近期全面开放注册,推出每日积分任务及付费订阅服务,同步深化与阿里战略合作,推动功能全面落地与应用扩展。
近期多起AI生成谣言事件引发关注,网信部门联合平台溯源关闭2210个违规账号。专家指出需完善AI使用规范,公众应提升辨别能力,共同维护网络环境真实性。
Epoch AI指出推理模型性能增长将遇瓶颈,计算资源约束与强化学习高昂成本成关键挑战,AI企业需平衡效率与扩展性以实现可持续发展。
Deep Research通过智能分析与多步骤整合,大幅缩短科研任务耗时,实现从需求理解到成果交付的闭环流程,现对公众免费开放体验。
火山引擎推出AI视频生成模型升级,通过影视级质量与高效生成能力,推动企业智能化应用发展,降低制作成本并拓展多领域场景。
阶跃星辰最新发布的Step1X-3D开源模型,凭借4.8B参数量与先进架构,突破3D生成质量与可控性瓶颈,为创作者提供精准、高效的3D内容生产工具,性能表现领跑同类开源方案。
加州法官对两家律所使用AI生成虚假法律引用的行为处以重罚,强调AI辅助材料需严格验证以避免误导司法程序。
TikTok推出AI Alive功能,用户可将静态照片转化为生动视频并分享至故事。该功能通过AI技术实现创意表达,同时配套AI生成标签和C2PA元数据确保内容真实性,平台还建立多重审核机制防止违规...