AI图像生成模型新突破:多图融合与智能编辑技术解析
今天凌晨,Google 正式提出了其最先进的图像生成与编辑模型——Gemini 2.5 Flash Image(又名 nano banana)。 据官方介绍,Gemini 2.5 Flash Image 的主要特点包括下面几点: 充分保持角色的一致性:它可以轻松地将同一个角色置于...
今天凌晨,Google 正式提出了其最先进的图像生成与编辑模型——Gemini 2.5 Flash Image(又名 nano banana)。 据官方介绍,Gemini 2.5 Flash Image 的主要特点包括下面几点: 充分保持角色的一致性:它可以轻松地将同一个角色置于...
腾讯正式开源混元图像模型2.1,支持2K分辨率图像生成和中英文原生输入,搭配PromptEnhancer文本改写模型,可智能补全描述细节。模型采用双通道编码器、高压缩率VAE等技术,显著提升生成质...
9 月 10 日消息,谷歌为其 Veo 3 AI 视频生成工具新增了 1080P 分辨率与竖屏视频格式支持。据谷歌开发者博客公告显示,Veo 3 及简化版模型 Veo 3 Fast(后者生成速度更...
9 月 10 日消息,据外媒 9to5Google 报道,谷歌今天推出了新的订阅服务“AI Plus”,旨在让新兴市场用户以更低成本更高效地使用谷歌 AI。 AI Plus 位于免费版和 AI P...
9 月 11 日消息,《华尔街日报》当地时间 10 日报道称,OpenAI 已与 Oracle 甲骨文签订了一份价值 3000 亿美元(注:现汇率约合 2.14 万亿元人民币)的算力购买订单,这是...
9 月 10 日,支付宝数字就业团队正式发布 AI就业助手「晓叶」。 官方介绍,晓叶依托人工智能大模型与数字人技术,进一步提升企业招聘与求职者找工的体验,旨在打造 AI 时代高效、智能、可信赖的就...
日前,论文《Attention is All You Need》(提出了 Transformer 架构)的第一作者 Ashish Vaswani 接受了彭博社专访,并提出了深刻反思:当前由少数科技...
9 月 12 日消息,近日,微信搜索界面迎来更新,微信 AI 搜索进入一级入口,首页顶部点击搜索框就能看到相关按钮。 该板块分为深度思考、上传图片、上传文件三个板块。其中,深度思考可选择 Deep...
9 月 12 日消息,谷歌正将广告直接植入其 AI生成的搜索答案中,此举标志着该公司从搜索中介向内容提供商的重大转变,或重塑数字广告格局。 据1AI了解,现在当用户进行对话式搜索(例如询问“如何解...
YouTube正式推出多语言配音功能,创作者可借助AI技术拓展全球观众,试点数据显示非母语观众贡献超四成观看时长,显著提升播放量及用户参与度。
王兴兴直言AI技术突破重塑机器人行业,具身智能面临数据与算法双重挑战,但创新门槛降低使小组织更具爆发力,AI与机器人深度融合将开启新产业格局。
昨天,由多位 OpenAI 前高管创立的 Thinking Machines Lab(TML),终于在成立半年后,发布了其首篇重磅研究论文《Defeating Nondeterminism in ...
今天凌晨,阿里通义发布了下一代基础模型架构 Qwen3-Next,并开源了基于该架构的 Qwen3-Next-80B-A3B 系列模型。 官方表示,其认为 Context Length Scali...