项目简介
这是一个基于OpenCompass的模型评测系统,旨在提供一个用户友好的前端页面UI,使用户能够自助开展模型的评测工作。该系统允许用户创建评测任务、查看评测进程和评测结果,极大地提升了评测工作的效率和便利性。
关键特性
- 前端界面: 提供直观的用户界面,方便用户进行操作。
- 任务管理: 支持创建、管理和监控评测任务,用户可以轻松查看任务进展和结果。
- 技术架构: 采用分层架构设计,核心使用FastAPI提供高性能API服务,Celery处理异步任务。
- Docker部署: 方便的快速部署选项,用户可以使用Docker进行一键式环境搭建。
- 数据管理: 能够下载和管理评测需要的数据集,支持数据的增删改查。
优势
- 易用性: 设计上强调用户体验,确保任何用户都能快速上手。
- 高效性: 通过自动化管理评测任务,显著提升评测效率。
- 前沿技术: 集成了最新的AI评测引擎OpenCompass,为用户提供强大模型评估能力。