一张图片+音频生成电影级数字人?开源模型如何颠覆创作效率
8 月 27 日消息,昨日晚间,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。 据介绍,该模型单次生成的视频时长可达分钟级,大幅提升数字人直播、影视制作、AI 教育等...
8 月 27 日消息,昨日晚间,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。 据介绍,该模型单次生成的视频时长可达分钟级,大幅提升数字人直播、影视制作、AI 教育等...
Hugging Face全新推出的免费云端AI智能体工具Open Computer Agent,可实现文本指令操控Linux虚拟机及Firefox等应用,尽管存在性能波动问题,但仍作为开源模型在云...
英国官员警告AI技术将显著提升网络攻击频次与破坏力,近期零售业频遭勒索软件袭击。政府计划推出网络安全战略及新法案,要求企业强化防护措施,提升整体抗风险能力。
NBC通过AI技术重现已故体育解说员Jim Fagan的声音,用于NBA赛事片头及宣传片,旨在以数字方式延续其解说遗产,丰富赛事转播的声效体验。
领英最新AI职位搜索功能通过理解自然语言及用户背景,精准匹配技能与职位需求,助力求职者高效定位合适工作机会,并提供实时招聘状态及响应预估信息,革新传统求职方式。
腾讯混元多模态视频生成工具Hunyuan Custom通过创新技术实现视频创作质变,可精准保持主体一致性,支持图像文本多模态输入生成,覆盖单主体、多主体视频创作及音视频同步编辑场景,为数字内容生产...
AI技术正重塑编程范式,代码逐渐向自然语言靠拢,开发者角色从语法执行者转变为逻辑定义者,推动软件设计门槛降低并提升效率。
杜克大学研究发现,使用AI工具可能面临同事和上司的负面评价,认为不够能干、懒惰,但特定任务中AI应用可提升适配性并缓解偏见。
香港科技大学新设冯诺依曼研究院,融合生成式AI、具身智能及超级计算技术,构建跨学科创新平台,为AI商业化与科技生态发展提供关键支撑。
谷歌旗下AI笔记应用NotebookLM正在测试视频概览功能,或整合Veo 2视频生成技术,实现用户数据向视频的多维度转化,进一步拓展笔记内容呈现形式。
天津35名数字人才获得全国首批人工智能技术等级证书,实现职称晋升与等级认证双向通道,为智能制造、区块链等数字技术领域发展注入新动能。
IBM最新推出的Granite 4.0 Tiny预览版在低显存占用的同时显著提升计算效率,仅需12GB显存即可支持高并发对话,基于混合Mamba-2/Transformer架构,性能媲美更大规模模...
教皇利奥十四世在与枢机主教会晤中强调,人工智能的发展正冲击人类尊严、正义与劳动的核心价值,呼吁社会教义需革新以应对技术革命,与方济各教宗的警示形成呼应,引发全球伦理规范讨论。