2025年1月21日AI热点新闻速览

  • 字节推出 AI IDE Trae:字节跳动推出全新 AI IDE——Trae,基于 Claude 模型且免费使用。支持 Python、JavaScript、Java 等多种编程语言,能根据自然语言描述自动生成代码,还可对现有代码进行优化并提供改进建议,同时提供多种 IDE 插件,方便在主流开发环境中使用。

  • OpenAI 测试 “Operator” 功能:OpenAI 正在内部测试全新 “Operator” 功能,将深度集成到 ChatGPT 的 macOS 版本中。该功能标志着 AI 从被动助手向主动解决问题的超级智能体转变,预计能独立完成软件开发、复杂财务分析等任务。

  • Kimi 发布 k1.5 多模态模型:Kimi 发布 k1.5 多模态思考模型,性能对标 OpenAI 的 o1,还首次提出 short2long 技术,通过 long cot 模型的 “教学”,让短链思维模式实现长链性能,在 MMLU、IF-Eval 等多个基准测试中表现出色。

  • Google AI 提出扩散模型推理时间缩放框架:来自纽约大学、麻省理工学院和谷歌的研究团队提出扩散模型中推理时间缩放的基本框架,从利用验证器反馈和实施算法发现更优噪声候选两个维度展开,以 256×256 分辨率的预训练 SiT - XL 模型为基础,在 DrawBench 测试中,能持续提升样本质量。

  • MIT 等揭示视觉语言模型问题及提出框架:麻省理工学院、谷歌 DeepMind 和牛津大学的研究人员提出 NegBench 框架,用于评估和改进视觉语言模型(VLMs)对否定的理解能力,通过检索与否定、多项选择题与否定两个基本任务,使用大量合成数据集,有效克服了现有模型的限制,提升了模型性能。

  • 淘天推出创新对齐方法:淘天集团的未来生活实验室团队提出 “令牌偏好优化”(TPO)方法,引入自我校准的视觉锚定奖励机制,能自动识别偏好数据中的视觉锚定令牌,为每个令牌分配反映其与视觉信息依赖程度的奖励,以减轻视觉大模型中的幻觉问题。

© 版权声明

相关文章