Loading...

解码AI

解码AI

一张图片+音频生成电影级数字人?开源模型如何颠覆创作效率

8 月 27 日消息,昨日晚间,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。 据介绍,该模型单次生成的视频时长可达分钟级,大幅提升数字人直播、影视制作、AI 教育等...

字节开源 Deep Research 项目

字节跳动推出DeerFlow与Seed-Coder两大开源项目,前者通过Multi-Agent架构实现多轮对话、播客生成及PPT制作功能,后者以极少人工参与方式优化代码能力,Instruct版本在...

Perplexity 新 AI浏览器功能曝光

Perplexity即将推出的Comet浏览器通过AI智能体技术实现自主网页导航,可无需人工操作完成任务,同时内置Operator工具框架,支持标签管理、会话记忆及历史记录功能,重新定义下一代智能...