ChatGPT 高级语音模式升级:更有“人情味”,新增多语言翻译功能
ChatGPT高级语音模式通过细腻语调、真实语速和精准情感表达优化,显著增强交互体验,同时新增多语言实时翻译功能,但需解决音频稳定性问题。
ChatGPT高级语音模式通过细腻语调、真实语速和精准情感表达优化,显著增强交互体验,同时新增多语言实时翻译功能,但需解决音频稳定性问题。
AI在读取时钟与计算日历任务中表现欠佳,错误率超半数。研究指出其依赖模式识别而非逻辑推理,且训练数据不足导致对复杂场景如闰年处理能力弱。需加强数据多样性和逻辑整合以提升应用可靠性。
抖音近期针对AI起号乱象展开专项治理,清除311条违规内容并封禁15个账号,重点打击AI生成低俗视频及虚拟专家育儿内容等行为,同时规范AI账号交易与规避标注手段,倡导用户合法使用AI技术并参与监督...
谷歌在Nest音箱上测试Gemini AI助手的过程引发用户反馈异常,部分设备在启用后出现无法响应和记录空白等问题,值得关注AI功能稳定性。
微软与OpenAI的AI技术合作出现裂痕,微软正通过自主研发和第三方测试构建技术护城河,同时推进"星际之门"数据中心项目。双方在技术交付效率、知识产权划分和市场布局上产生分歧,反映出科技巨头在AI...
TikTok新推出AI图生视频功能,通过智能算法将静态照片转化为可互动的动态视频,同时引入AI生成标签与C2PA元数据确保内容真实性,并建立多重审核机制维护社区安全。
OpenAI即将推出ChatGPT会议录音转写功能,通过拖动说话实现实时互动,自动生成文字报告与摘要,可能颠覆传统协作工具的语音交互模式。
腾讯混元图像2.0通过毫秒级响应实现边输入边生成,配合多图融合技术大幅提升创作效率,其超写实画质与95%以上生成准确率重塑了AI视觉生成体验。
荣耀400系列海外版将集成Google Veo 2 AI图像生成功能,基于静态照片自动生成5秒视频,但需后续订阅服务。该功能虽具备4K视频生成能力,却存在内容不可控的技术局限性。
阶跃星辰推出的Step1X-3D开源模型,以4.8B参数量重构3D生成标准。通过解耦几何与纹理表征、VAE-DiT架构优化及SD-XL纹理定制,实现高精度结构还原与生动纹理生成,CLIP-Scor...
OpenAI推出的GPT-4.1模型在ChatGPT中上线,显著提升执行效率与结果精确度,尤其在编程任务中表现优异,为用户提供更稳定可靠的AI体验。
研究显示职场人士使用AI工具完成任务时,即便成果优质仍易被贴上能力不足标签,尤其在复杂任务中负面效应更显著,揭示AI对职业形象的潜在影响。
广州海关引入国内首台辐射探测机器狗,实现口岸智能查验与自动巡检功能。该四足机器人已在多地开展多场景测试,涵盖放射性检测、安全巡逻等海关监管任务,助力提升口岸作业效率。