检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
period String 计费时期。 queries_limit Long 查询次数。 price Float 价格。 请求示例 GET https://{endpoint}/v2/{project_id}/workflows 响应示例 状态码:200 OK { "total" :
精度评测可以在原先conda环境,进入到一个固定目录下,执行如下命令。 rm -rf lm-evaluation-harness/ git clone https://github.com/EleutherAI/lm-evaluation-harness.git cd lm-evaluation-harness
%s", self.model_outputs) def _preprocess(self, data): # https两种请求形式 # 1. form-data文件格式的请求对应:data = {"请求key值":{"文件名":<文件io>}}
”,资源池名称为“pool-001”,资源池类型为“Dedicate”(物理资源池),资源池支持的作业类型为“训练作业”。 POST https://{endpoint}/v2/{project_id}/pools { "kind" : "Pool", "apiVersion"
WorkflowDagPolicies 参数 参数类型 描述 use_cache Boolean 是否使用缓存。 请求示例 查询工作流执行记录列表 GET https://{endpoint}/v2/{project_id}/workflows/{workflow_id}/executions?lim
WorkflowDagPolicies 参数 参数类型 描述 use_cache Boolean 是否使用缓存。 请求示例 启动工作流 POST https://{endpoint}/v2/{project_id}/workflows/{workflow_id}/executions { }
period String 计费时期。 queries_limit Long 查询次数。 price Float 价格。 请求示例 GET https://{endpoint}/v2/{project_id}/workflows/{workflow_id} 响应示例 状态码:200 OK
精度评测可以在原先conda环境,进入到一个固定目录下,执行如下命令。 rm -rf lm-evaluation-harness/ git clone https://github.com/EleutherAI/lm-evaluation-harness.git cd lm-evaluation-harness
密钥id mouthPath 是 String 挂载路径 响应参数 无 请求示例 如下以更新“real-time”类型的服务为例。 PUT https://{endpoint}/v1/{project_id}/services/{service_id} { "description"
参数种类。 请求示例 如下以修改uuid为2e5451fe-913f-4492-821a-2981031382f7的算法为例。 PUT https://endpoint/v2/{project_id}/algorithms/2e5451fe-913f-4492-821a-2981031382f7
String 计费时期。 queries_limit Long 查询次数。 price Float 价格。 请求示例 更新工作流信息 PUT https://{endpoint}/v2/{project_id}/workflows/a8f31367-3534-4644-a2fe-75d187341ae7
创建算法。设置算法名称为“TestModelArtsalgorithm”,描述为“This is a ModelArts algorithm”。 POST https://endpoint/v2/{project_id}/algorithms { "metadata" : { "name"
String 标注成员ID。 workforce_id String 所属标注团队ID。 请求示例 查询数据集的团队标注任务列表 GET https://{endpoint}/v2/{project_id}/datasets/{dataset_id}/workforce-tasks 响应示例
WorkflowDagPolicies 参数 参数类型 描述 use_cache Boolean 是否使用缓存。 请求示例 更新内容 PUT https://{endpoint}/v2/{project_id}/workflows/{workflow_id}/executions/fa4
nt量化或使用GPTQ量化章节对模型做量化处理。 参数定义和使用方式与vLLM0.5.0版本一致,此处介绍关键参数。详细参数解释请参见https://github.com/vllm-project/vllm/blob/main/vllm/engine/arg_utils.py。 Step7
nt量化或使用GPTQ量化章节对模型做量化处理。 参数定义和使用方式与vLLM0.5.0版本一致,此处介绍关键参数。详细参数解释请参见https://github.com/vllm-project/vllm/blob/main/vllm/engine/arg_utils.py。 步骤七
worker_id String 标注成员ID。 workforce_id String 所属标注团队ID。 请求示例 查询团队标注任务详情 GET https://{endpoint}/v2/{project_id}/datasets/{dataset_id}/workforce-tasks/{workforce_task_id}
载后的文件如图2所示,代码所在路径为“./models/official/cv/resnet/”。 # 下载代码 git clone https://gitee.com/mindspore/models.git -b v1.5.0 图2 下载后的模型包文件 下载花卉识别数据集。
"best_of":2, "length_penalty":2 }' 服务的API与vLLM官网相同,此处介绍关键参数。详细参数解释请参见官网https://docs.vllm.ai/en/stable/dev/sampling_params.html。 表1 请求服务参数说明 参数 是否必选
worker_id String 标注成员ID。 workforce_id String 所属标注团队ID。 请求示例 查询数据集详情 GET https://{endpoint}/v2/{project_id}/datasets/{dataset_id} 响应示例 状态码: 200 OK