-
香港大学与快手推出 GameFactory 框架:香港大学与快手科技合作推出该框架,旨在解决游戏视频生成中的场景泛化难题。它利用预训练的视频扩散模型,通过三阶段训练策略生成多样化游戏场景,还发布了 GF - Minecraft 数据集用于训练和评估。
-
OpenAI 推出 GPT-4b micro:OpenAI 与 Retro Biosciences 合作推出专注于生物数据的大模型 GPT-4b micro,目标是将人类寿命延长 10 年,该模型通过优化山中因子,提升细胞重编程效率,初步实验效果提升 50 倍以上。
-
Mistral AI 的 Codestral 模型更新:Mistral AI 推出 Codestral 25.01 版本,支持超 80 种编程语言,上下文长度提升至 25.6 万个 Token,显著提升代码生成能力和效率,平均准确率达 71.4%。
-
SwiftKV 技术优化大模型推理时间:研究公司 Snowflake 公布 SwiftKV 技术,可优化大模型提示词处理过程,降低 50% 推论时间,提升模型吞吐量和效率,该技术已应用于 Llama 3.1 模型,表现出色。
-
阶跃星辰和清华大学提出新型注意力机制 MFA:阶跃星辰和清华大学提出的 MFA 将 KV 缓存消耗降低 93.7%,同时性能不减反增。该机制通过多矩阵分解和单键值头设计,显著提升大语言模型的推理效率。
-
视觉语言模型 PSA - VLM 安全性能升级:淘天集团联合南京大学等机构推出 PSA - VLM,通过概念瓶颈模型优化视觉语言模型的安全性能,显著提升对有害内容的识别能力,同时保持通用任务性能。
-
Search - o1 框架提升推理模型性能:清华大学和中国人民大学联合推出 Search - o1 框架,通过自主检索知识,显著提升推理模型在复杂任务中的表现,性能优于人类专家。
-
OpenAI 在 ChatGPT 中推出计划任务功能:OpenAI 为 Plus、Pro 和 Team 计划推出了计划任务功能,允许在 Web、iOS、Android 和 MacOS 上自动执行提示和通知。用户可以指定任务并通过推送或电子邮件接收通知,Windows 支持将在第一季度推出,目前每个用户最多可设置 10 个活跃任务。
-
阿里巴巴大幅削减大语言模型价格:阿里巴巴云宣布对其 Qwen - VL 视觉语言模型进行 85% 的降价,突显了中国科技巨头在 AI 领域日益激烈的竞争。
-
谷歌组建新团队开发模拟物理世界的 AI:谷歌在 DeepMind 的领导下,正在组建一个新团队,构建用于模拟物理世界的 AI 模型,并与 Gemini、Veo 和 Genie 团队合作开发 “世界模型”,这些模型有助于视频生成、多模态数据和互动环境的构建。
© 版权声明
本站文章版权归奇想AI导航网所有,未经允许禁止任何形式的转载。