检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Step1使用tensorRT量化工具进行模型量化 在GPU机器上使用tensorRT 0.9.0版本工具进行模型量化,工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0.9.0。 量化脚本convert_checkpoint
和名称。 task_id 是 String 数据处理任务ID。 请求参数 无 响应参数 无 请求示例 删除数据处理任务 DELETE https://{endpoint}/v2/{project_id}/processor-tasks/{task_id} 响应示例 状态码: 200
数据集版本名称。 with_column_header Boolean 发布的CSV文件的第一行是否为列名,对于表格数据集有效。可选值如下: true:发布的CSV文件的第一行是列名 false:发布的CSV文件的第一行不是列名 表10 LabelStats 参数 参数类型 描述 attributes
execution_id 是 String 工作流执行ID。 请求参数 无 响应参数 无 请求示例 删除Workflow Execution。 DELETE https://{endpoint}/v2/{project_id}/workflows/{workflow_id}/executions/40d
标注团队成员ID。 workforce_id 是 String 标注团队ID。 请求参数 无 响应参数 无 请求示例 删除标注团队成员 DELETE https://{endpoint}/v2/{project_id}/workforces/{workforce_id}/workers/{worker_id}
工作流的ID。 schedule_id 是 String 工作流调度信息ID。 请求参数 无 响应参数 无 请求示例 删除调度信息 DELETE https://{endpoint}/v2/{project_id}/workflows/{workflow_id}/schedules/fa4a
例:pytorch_2_2_ascend:20241106 构建镜像前需保证Dockerfile文件内容中镜像名与本文档镜像保持一致,如不同则需修改为一致。 # 修改以下内容: FROM swr.cn-southwest-2.myhuaweicloud.com/atelier/xxx
扩散模型在噪音和随机数上的生成,本身就有一定的随机性,GPU和NPU(Ascend)硬件由于存在一定细小的差别,很难确保完全一致,较难达成生成图片100%匹配,建议通过盲测的方式对效果进行验证。 模型精度有问题怎么办? 首先考虑通过FP16的方式进行转换和执行,再通过精度诊断工具来进行分析,更进一步可以到华为云官网上提交工单处理。
创建Notebook并执行性能诊断任务 本文介绍如何创建Notebook并执行性能诊断任务。 操作步骤 创建Notebook实例。 在ModelArts控制台创建一个Notebook实例,选择要使用的AI框架,创建Notebook时可以选择任意镜像。具体参见创建Notebook实例。 创建成功后,Not
描述 error_code String ModelArts错误码。 error_msg String 具体错误信息。 请求示例 GET https://{endpoint}//v1/{project_id}/app-auth/{service_id}/apis/{api_id} 响应示例
--calib-data:数据集路径,推荐使用:https://huggingface.co/datasets/mit-han-lab/pile-val-backup,注意需指定到val.jsonl的上一级目录。 详细说明可以参考vLLM官网:https://docs.vllm.ai/en/
--calib-data:数据集路径,推荐使用:https://huggingface.co/datasets/mit-han-lab/pile-val-backup,注意需指定到val.jsonl的上一级目录。 详细说明可以参考vLLM官网:https://docs.vllm.ai/en/
例:pytorch_2_2_ascend:20241106 构建镜像前需保证Dockerfile文件内容中镜像名与本文档镜像保持一致,如不同则需修改为一致。 # 修改以下内容: FROM swr.cn-southwest-2.myhuaweicloud.com/atelier/xxx
subscription_id 是 String 工作流的消息订阅ID。 请求参数 无 响应参数 无 请求示例 删除消息订阅 DELETE https://{endpoint}/v2/{project_id}/workflows/{workflow_id}/subscriptionsu
version_id 是 String 数据处理任务的版本ID。 请求参数 无 响应参数 无 请求示例 停止数据处理任务的版本 POST https://{endpoint}/v2/{project_id}/processor-tasks/{task_id}/versions/{version_id}/stop
请求示例 如下以删除uuid为3faf5c03-aaa1-4cbe-879d-24b05d997347的训练作业为例。 DELETE https://endpoint/v2/{project_id}/training-jobs/3faf5c03-aaa1-4cbe-879d-24b05d997347
消息头中X-Subject-Token的值)。 响应参数 无 请求示例 如下删除服务ID为xxxxxx的模型服务为例。 DELETE https://endpoint/v1/{project_id}/services/xxxxxx 响应示例 状态码: 200 删除服务成功 { }
--calib-data:数据集路径,推荐使用:https://huggingface.co/datasets/mit-han-lab/pile-val-backup,注意需指定到val.jsonl的上一级目录。 详细说明可以参考vLLM官网:https://docs.vllm.ai/en/
请求示例 如下以删除实例ID为“6fa459ea-ee8a-3ca4-894e-db77e160355e”的实例为例。 DELETE https://endpoint/v1/{project_id}/demanager/instances/6fa459ea-ee8a-3ca4-894e-db77e160355e
APP认证鉴权:调用支持APP认证的接口需要进行认证鉴权,支持两种鉴权方式(AppKey+AppSecret或AppCode),您可以选择其中一种进行认证鉴权。 发送预测请求: 方式一:使用Python语言通过AppKey+AppSecret认证鉴权方式发送预测请求 方式二:使用Java语言通过AppK