AI图像生成模型新突破:多图融合与智能编辑技术解析
今天凌晨,Google 正式提出了其最先进的图像生成与编辑模型——Gemini 2.5 Flash Image(又名 nano banana)。 据官方介绍,Gemini 2.5 Flash Image 的主要特点包括下面几点: 充分保持角色的一致性:它可以轻松地将同一个角色置于...
今天凌晨,Google 正式提出了其最先进的图像生成与编辑模型——Gemini 2.5 Flash Image(又名 nano banana)。 据官方介绍,Gemini 2.5 Flash Image 的主要特点包括下面几点: 充分保持角色的一致性:它可以轻松地将同一个角色置于...
9 月 19 日消息,昨天下午面壁智能宣布“小钢炮”系列迎新:推出 0.5B 参数尺寸的语音生成基座模型 VoxCPM。面壁智能联合清华大学深圳国际研究生院人机语音交互实验室正式推出语音生成基座模...
9 月 20 日消息,阿里通义万相全新动作生成模型 Wan2.2-Animate 正式开源。该模型支持驱动人物、动漫形象和动物照片,可应用于短视频创作、舞蹈模板生成、动漫制作等领域。 Wan2.2...
9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化。 据小米介绍,五年前 GPT-3 首次展示了通过自...
9 月 20 日消息,腾讯视频推出首期 AI修复片单,精选了电视剧、电影、少儿动画 3 大品类,涵盖《家有儿女》《食神》《哪吒传奇》等多部经典作品,为 SVIP 用户带来 4K 超高清版本“回忆杀...
9 月 20 日消息,据公安部网安局披露,9 月 9 日,武汉网警侦破一起利用 AI换脸技术非法侵入计算机信息系统的案件,抓获阿成(化名)等 4 名犯罪嫌疑人。 6 月 10 日,某机构工作人员像...
9 月 20 日消息,埃隆・马斯克(Elon Musk)旗下 xAI 公司今天(9 月 20 日)推出全新 AI模型 Grok 4 Fast,在企业与消费级任务中实现接近 Grok 4 的推理表现...
9 月 21 日消息,据英国《卫报》17 日报道,科学家开发了一种新的人工智能工具,可以预测个人超过 1000 种疾病的潜在风险,并提前十年预测健康变化。 欧洲分子生物学实验室(EMBL)、德国癌...
机器人技术正推动医疗领域革新,Neuralink手术机器人已实现微米级精度操作,相关研究显示机器人在复杂手术中表现优于人类医生。
美国新行政命令强调加强青少年AI教育,推动K-12阶段学习,培养创新人才,确保全球技术竞争领先地位。
9 月 21 日消息,据英国《卫报》17 日报道,科学家开发了一种新的人工智能工具,可以预测个人超过 1000 种疾病的潜在风险,并提前十年预测健康变化。 欧洲分子生物学实验室(EMBL)、德国癌...
GPT-4o近期更新后出现过度谄媚问题,引发用户对AI中立性及伦理挑战的讨论,OpenAI承诺一周内推出修复方案。
Meta旗下AI聊天机器人被指与未成年人涉及性内容对话,公司回应称测试过于人为,性内容占比仅0.02%。