一张图片+音频生成电影级数字人?开源模型如何颠覆创作效率
8 月 27 日消息,昨日晚间,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。 据介绍,该模型单次生成的视频时长可达分钟级,大幅提升数字人直播、影视制作、AI 教育等...
8 月 27 日消息,昨日晚间,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。 据介绍,该模型单次生成的视频时长可达分钟级,大幅提升数字人直播、影视制作、AI 教育等...
AI编程工具领域融资热度持续攀升,Anysphere获9亿美元注资推高估值至90亿美元。行业竞争加剧,竞品企业释放融资信号,推动技术发展与市场格局变化。
Recraft凭借精准的品牌图像生成技术完成3000万美元融资,其AI模型在行业基准测试中超越竞品,推动营销素材自动化解决方案革新设计行业。
快手推出的新一代AI笔记管理工具喵记多,内置智能聊天机器人喵仔,实现信息记录、标签分类、内容查找等功能,与百度文库、腾讯ima copilot等AI创作工具形成差异化竞争。
联合国开发计划署报告指出人工智能将为人类发展注入新动能,中国在机器视觉和工业应用领域展现领先地位,海外AI人才回流趋势显著,技术差异化路径助力全球发展突破瓶颈。
近期调查显示,YouTube部分儿童频道借助AI技术生成恐怖内容,伪装成可爱卡通角色,危及儿童安全。尽管平台有内容准则,但执行存在漏洞,评论区机器人评论加剧问题。专家呼吁家长加强监管并积极举报不当...
Anthropic通过AI for Science计划为科研提供免费API资源,聚焦生物学等高影响力领域,以AI技术提升数据解析与实验设计效率,助力突破科学瓶颈。
Windsurf CEO透露AI Agent正重塑软件构建模式,让非技术员工参与代码修改,未来用户仅需提示词即可生成专属软件,开发者角色转向代码评审,推动个性化程序开发成为新趋势。
苹果AI中国版合作进展缓慢,测试版可能于WWDC2025后推出,正式版或将推迟至9月。与阿里、百度协作及Google谈判结果仍存不确定性,未来布局充满变数。
OpenAI 通过海外合作伙伴扩展数据中心项目,助力多国政府及资本布局民主人工智能,预计耗资数万亿美元,衔接先进半导体技术获取通道。
苹果高管披露谷歌搜索流量因AI工具分流出现罕见下降,引发Alphabet市值蒸发及华尔街对盈利能力的重新评估,反垄断诉讼叠加市场份额波动成为市场焦点。
全球首个以人形机器人为核心的综合运动会将在北京举行,通过竞技与表演展示技术多样性,加速产业创新应用。
Mistral Medium 3在多项基准测试中表现领先,成本显著低于 Claude 3.7 与同类开放模型,尤其在编程及专业任务场景中凸显优势,为企业提供高效低成本的AI解决方案。