一张图片+音频生成电影级数字人?开源模型如何颠覆创作效率
8 月 27 日消息,昨日晚间,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。 据介绍,该模型单次生成的视频时长可达分钟级,大幅提升数字人直播、影视制作、AI 教育等...
8 月 27 日消息,昨日晚间,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。 据介绍,该模型单次生成的视频时长可达分钟级,大幅提升数字人直播、影视制作、AI 教育等...
Anthropic计划为Claude添加记忆功能,通过记住过往对话提升交流准确性,增强与ChatGPT的竞争力。该功能已现社交媒体线索,或将重塑AI对话体验。
美国法官认定Meta使用书籍训练AI属合理使用,强调需结合具体案件分析市场影响,指出原告未能证明版权损害,但裁决不构成全面胜诉。
谷歌DeepMind推出AlphaGenome模型,通过AI技术精准预测DNA序列变异影响,支持长序列分析与多种模式预测,为疾病研究和合成生物学提供新工具,推动基因组学领域发展。
山西临汾医院启动1569万元智慧医疗项目,涵盖智能导诊、病历生成等六大模块,展现AI技术在医疗领域的深度应用,凸显医院数字化转型趋势。
西门子高管指出AI将深度融入工业领域,DeepSeek凭借高效灵活成为关键选择,推动人机协同与智能制造升级。
阿里巴巴达摩院联合浙江省肿瘤医院研发的DAMO GRAPE AI模型,通过平扫CT影像显著提升胃癌早期检出率,为癌症防治提供全新解决方案,有望实现无症状胃癌的早期发现。
法院判定Anthropic通过拆解图书扫描训练AI模型属于合理使用,但盗版行为削弱其合法性,凸显AI训练数据获取的法律争议。
科技公司应将人工智能带来的生产力提升转化为劳动者更多休息时间,而非仅惠及高管。试点案例显示,缩短工作时长可提升效率,同时保障员工福利,呼吁技术惠及所有人。
谷歌推出Gemini CLI工具,集成AI问答与代码生成功能,开发者可便捷使用,支持大模型上下文窗口及搜索,预览版提供免费配额,应用涵盖编程、内容生成等领域。
Solos公司推出新款AI智能眼镜AirGo A5和V2,支持实时直播、AI模型切换及可更换电池等创新功能,满足多样化需求。
Anthropic通过"模型福利"研究探索AI意识可能性,强调伦理设计与安全对齐,分析AI是否具备体验与情感的前沿议题。
WebSSL模型通过纯图像训练在无语言监督下展现卓越性能,尤其在OCR与图表任务中提升显著。实验表明,参数扩展使模型接近对数线性增长,部分场景超越MetaCLIP。集成Hugging Face库,...