AI开发平台ModelArts-使用MaaS评测模型:创建评测任务
创建评测任务
- 登录ModelArts管理控制台,在左侧导航栏,选择“ModelArts Studio”进入ModelArts Studio大模型即服务平台。
- 在ModelArts Studio左侧导航栏,单击“模型评测”。
- 在“模型评测”页面右上角,单击“创建评测任务”进入创建页面,配置相关信息。
表1 创建模型评测任务 参数
说明
任务设置
评测任务名称
默认名称为:Eval-当前时间戳-四位随机字符。您可以按需修改。支持100字符。
描述
评测任务简介。支持1000字符。
选择服务
模型类型
默认为“文本生成”。
选择服务
单击“添加服务”,在“选择模型服务”对话框,单击“预置服务”或者“我的服务”页签,选择目标服务,单击“确定”。最多可以添加10个服务。
说明:评测不单独计费,预置服务评测将消耗Token,我的服务评测将以部署计费为准。
API Key
输入API Key。调用模型服务进行评测需要使用API Key鉴权。您可以在ModelArts Studio控制台左侧导航栏的“鉴权管理”页面创建API Key。
评测配置
评测类型
默认为“自动评测”。
资源设置
评测规则
默认为“基于规则”,表示基于相似度或准确率进行打分,对比模型预测结果与标注数据的差异,适合标准选择题或简单问答场景。
评测数据集
单击“添加评测数据集”,选择目标数据集,单击“确定”。最多可以添加10个预置评测数据集。
评测结果保存位置
选择评测结果的OBS存放路径。
- 参数配置完成后,单击“提交”,创建评测任务。
在任务列表,当模型“状态”变成“已完成”时,表示模型评测任务创建完成。
- GaussDB评测_GaussDB数据库评测_高斯数据库评测-华为云
- DeepSeek-R1蒸馏模型部署及体验
- GaussDB快速入手_GaussDB价格_高斯数据库快速入手_华为云
- GaussDB华为进展_华为gaussdb_高斯数据库华为进展_华为云
- GaussDB基于华为云_华为云云数据库_高斯数据库基于华为云-华为云
- GaussDB社区_gaussdb t_高斯数据库社区_华为云
- GaussDB的优缺点_gaussdb基于_高斯数据库优缺点_华为云
- GaussDB存算分离_华为云hcso是什么意思_高斯数据库存算分离_华为云
- GaussDB华为_Gaussdb推广文案_高斯数据库华为_华为云
- ModelArts模型训练_创建训练作业_如何创建训练作业