模型与基础设施（Infra）

OpenCompass

上海人工智能实验室推出的大模型开放评测体系

模型与基础设施（Infra）

2023-12-14

CMMLU

一个综合性的大模型中文评估基准

模型与基础设施（Infra）

2023-12-14

Evidently AI

开源的机器学习模型监测和测试工具

模型与基础设施（Infra）

2023-12-14

HELM

斯坦福大学推出的大模型评测体系

模型与基础设施（Infra）

2023-12-14

MMBench

全方位的多模态大模型能力评测体系

模型与基础设施（Infra）

2023-12-14

Chatbot Arena

以众包方式进行匿名随机对战的LLM基准平台

模型与基础设施（Infra）

2023-12-14

上一页 1 23

AI导航猿收录了全球数百个不同类型最优质的AI工具和应用，免费分享AI各类教程和工作流，每日更新添加最新AI工具和技术，致力于打造全网最全AI工具集教程，持续分享AI实践干货 Ctrl + D 或 ⌘ + D 收藏本站到浏览器书签栏。

AI导航猿关于我们免责声明

Copyright © AI导航猿琼ICP备2025054846号-2

琼ICP备2025054846号-2