奇想AI导航网

奇想AI导航网 奇想AI导航网 奇想AI导航网 奇想AI导航网
  • AI应用集
  • Al写作工具
  • AI图像工具
    • 常用AI图像工具
    • AI图片插画生成
    • Al图片背景移除
    • Al图片无损放大
    • Al图片优化修复
    • AIl图片物体抹除
    • Al商品图生成
    • AI 3D模型生成
  • AI视频工具
  • Al办公工具
    • AI幻灯片和演示
    • Al表格数据处理
    • Al文档工具
    • AI思维导图
    • AI会议工具
    • AI效率提升
  • AI设计工具
  • Al对话聊天
  • AI编程工具
  • AI搜索引擎
  • Al音频工具
  • Al语言翻译
  • Al法律助手
  • Al内容检测
  • AI提示指令
  • Al训练模型
  • AI模型评测
  • AI学习网站
  • AI开发框架
奇想AI导航网 奇想AI导航网
  • 奇想AI导航网
    • Al写作工具
    • AI图像工具
    • AI视频工具
    • Al办公工具
    • AI设计工具
    • Al对话聊天
    • AI编程工具
    • AI搜索引擎
    • Al音频工具
    • Al语言翻译
    • Al法律助手
    • Al内容检测
    • AI提示指令
    • Al训练模型
    • AI模型评测
    • AI学习网站
    • AI开发框架
  • AI应用集
  • 文章博客
    • Al项目
    • AI教程
    • AI百科
    • Al名人堂
    • Al快讯
  • 关于我们
奇想AI导航网 奇想AI导航网

    AI模型评测

    AGI-Eval
    AGI-Eval

    AI大模型评测社区

    <strong>MMLU</strong>
    MMLU

    大规模多任务语言理解基准

    <strong>C-Eval</strong>
    C-Eval

    一个全面的中文基础模型评估套件

    <strong>Open LLM Leaderboard</strong>
    Open LLM Leaderboard

    Hugging Face推出的开源大模型排行榜单

    <strong>OpenCompass</strong>
    OpenCompass

    上海人工智能实验室推出的大模型开放评测体系

    <strong>SuperCLUE</strong>
    SuperCLUE

    中文通用大模型综合性测评基准

    <strong>FlagEval</strong>
    FlagEval

    智源研究院推出的FlagEval(天秤)大模型评测平台

    <strong>CMMLU</strong>
    CMMLU

    一个综合性的大模型中文评估基准

    <strong>MMBench</strong>
    MMBench

    全方位的多模态大模型能力评测体系

    <strong>HELM</strong>
    HELM

    斯坦福大学推出的大模型评测体系

    <strong>LLMEval3</strong>
    LLMEval3

    由复旦大学NLP实验室推出的大模型评测基准

    <strong>Chatbot Arena</strong>
    Chatbot Arena

    以众包方式进行匿名随机对战的LLM基准平台

    <strong>PubMedQA</strong>
    PubMedQA

    生物医学研究问答数据集和模型得分排行榜

    奇想AI导航网 奇想AI导航网
    奇想AI导航网收录了国内外数百个不同类型的AI工具,每日更新和添加最新AI工具,奇想AI导航网还推荐了AI学习开发的常用网站、框架和模型,帮助你加入人工智能浪潮,自动化高效完成任务! Ctrl + D 或 ⌘ + D 收藏本站到浏览器书签栏。

    奇想AI导航网 广告投放 关于我们 免责声明

    Copyright © 2025 奇想AI导航网 湘ICP备2023001050号-1