ChatGPT 高级语音模式升级:更有“人情味”,新增多语言翻译功能
ChatGPT高级语音模式通过细腻语调、真实语速和精准情感表达优化,显著增强交互体验,同时新增多语言实时翻译功能,但需解决音频稳定性问题。
ChatGPT高级语音模式通过细腻语调、真实语速和精准情感表达优化,显著增强交互体验,同时新增多语言实时翻译功能,但需解决音频稳定性问题。
阿里推出Qwen2.5-Omni-3B轻量模型,性能达7B级别90%以上,内存占用减少53%,支持消费级硬件运行,专注测试与原型开发。
谷歌NotebookLM更新"音频概览"功能,新增76种语言支持,用户可自由选择生成音频语言,实现多语言内容创作与学习资料生成,提升信息理解效率。
Anthropic推出MCP协议,助力Claude网页应用实现第三方工具无缝接入,简化AI助手与外部数据源交互,提升定制化集成效率。
谷歌NotebookLM移动端即将正式上线,支持手机与平板多平台使用,提供智能摘要、音频概述等功能,助力用户高效处理复杂信息,满足研究与学习需求。
GitHub Copilot用户突破1500万,微软称其已进化为编程伙伴,提升开发者效率,AI技术加速成为微软核心增长动力。
中国AI创业公司蝴蝶效应完成7500万美元融资,估值达5亿美元,Manus AI智能体在简历筛选等领域表现优异,加速全球化布局并推出订阅服务。
Adobe发布Firefly Image Model 4及Ultra,提升生成效率与细节表现,推出协作工具Firefly Boards,并优化Creative Cloud应用功能,助力设计师高效创...
谷歌宣布Gemini聊天机器人将扩展至更多设备,包括智能手表和汽车系统,通过升级Google Assistant提升用户体验,预计在I/O大会公布更多细节。
中国科技集群及AI专利全球领先,2024年全球创新指数排名第11,人工智能专利占比超60%,知识产权体系持续优化,引领全球创新。
谷歌DeepMind升级Music AI Sandbox平台,新增Lyria 2模型及Create/Extend/Edit功能,支持专业音频生成与实时创作,提升音乐创作效率。
OpenAI推出轻量版Deep ResearchAI搜索功能,准确率45.6,低于标准版但高于其他模型,付费用户可享不同额度,免费用户每月5次。
Step1X-Edit开源图像编辑大模型性能达开源SOTA,支持语义解析、身份一致性保持及区域级控制,覆盖11类高频编辑任务,适用于虚拟人、电商等场景。