推荐
热门
虚拟模特商贸推广论文学术Office综合办公PPT幻灯片Word文档Excel表格Mind思维导图Meet会议记录数字员工AI大厂
综合服务
AI Agents多模态聚合AI工作AI教育AI生活AI旅行AI搜索AI伴侣AI角色未分主类暂未分类
学习源头
新闻资讯社交社区资源工具课程学习竞赛比赛AI博主AI博客PromptGitHub 项目研究组织
行业相关
整体解决方案导航测评算力开发框架(Framework)算法数据集模型(Model)镜像(Image)接口(API)数字版权咨询服务
插件工具
浏览器插件GPTs应用
设计类
产品摄影装修设计品牌原型平面交互三维场景展示交易设计协作
文字类
聊天对话创作写作归纳摘要知识管理检测内容绕过检测占星算命
图像类
艺术创作人像交换图像调整
音频类
音乐创作语音互动语音生成实时变声音频检测音频编辑
视频类
虚拟数人视频生成视频编辑字幕标记
编程类
编码助手代码生成开发环境
数据类
数据管理研究数据可视展示分析决策预测
古典平台
知名巨头-科技公司Github项目资源-导航资讯-AI资源-主题插件固件资源-教程课程资源-素材资源-Mac资源-IOS资源-百科文库Wiki查测搜-搜索引擎查测搜-监控网站状态查测搜-命盘命理查测搜-货币金融查测搜-影视媒体资料查测搜-LOGO查找查测搜-磁力种子网盘查测搜-网络社群社区-站长资讯社群社区-博客小站社群社区-开发者社群社区-知识问答服务-云服务商服务-网络防御服务-新闻资讯服务-购物租赁服务-视频媒体服务-通讯网络服务-电子邮件服务-支付财务服务-虚拟验证服务-在线工具服务-课程教学服务-云上储存服务-一体化协作办公服务-代码开发服务-设计硬件-电子设备软件-设计创作软件-协作合作软件-网络工具软件-下载储存加密软件-社交聊天软件-远控投屏组网软件-浏览器插件软件-服务器管理软件-图音视影未整理（失效留存）AI类暂无整理

搜索

测评

OpenDigg
3600

人工智能产品推荐和行业新闻的在线平台，旨在为用户提供深入的产品评测和最新的行业动态，帮助用户在快速发展的 AI 领域中做出明智的决策。OpenDigg 由 Synthai Ltd 运营，利用公司在 AI 领域的丰富资源和专业知识，确保内容的高质量和可靠性。

MMLU
3430

大规模多任务语言理解基准

Open LLM Leaderboard
4160

Hugging Face推出的开源大模型排行榜单

C-Eval
2900

一个全面的中文基础模型评估套件

FlagEval
3000

智源研究院推出的FlagEval（天秤）大模型评测平台

SuperCLUE
2870

中文通用大模型综合性测评基准

OpenCompass
2850

上海人工智能实验室推出的大模型开放评测体系

CMMLU
3080

一个综合性的大模型中文评估基准

MMBench
3010

全方位的多模态大模型能力评测体系

HELM
2950

斯坦福大学推出的大模型评测体系

Chatbot Arena
3450

以众包方式进行匿名随机对战的LLM基准平台

LLMEval3
2670

由复旦大学NLP实验室推出的大模型评测基准

H2O EvalGPT
2860

H2O.ai推出的基于Elo评级方法的大模型评估系统

PubMedQA
2520

生物医学研究问答数据集和模型得分排行榜

AI Playground
3340

允许用户并排比较顶级AI模型。用户可以在这里测试不同的AI模型，探索其功能和性能，平台提供了丰富的文档和示例，方便用户快速上手。