检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
表4 DescribeSampleResp 参数 参数类型 描述 check_accept Boolean 是否验收通过,用于团队标注。可选值如下: true:验收通过 false:验收不通过 check_comment String 验收意见,用于团队标注。
图2 动态benchmark测试结果(示意图) 父主题: 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导(6.3.910)
labels Map<String,String> k8s标签,格式为key/value键值对。 tags Array of UserTag objects 资源标签,非特权池不能指定。 network NodeNetwork object 网络配置,非特权池不能指定。
表3 响应参数 参数 参数类型 说明 is_success Boolean 请求是否成功。 error_message String 调用失败时的错误信息。 调用成功时无此字段。 error_code String 调用失败时的错误码,具体请参见错误码。 调用成功时无此字段。
表8 Docker部署参数数据结构说明 参数 参数类型 说明 namespace String SWR组织名称,全局唯一。 image_name String 镜像名称。 image_tag String 镜像标签。
请求参数 无 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 check_accept Boolean 是否验收通过,用于团队标注。
可选样本状态如下: __ALL__:已标注 __NONE__:未标注 __UNCHECK__:待验收 __ACCEPTED__:验收通过 __REJECTED__:已驳回 __UNREVIEWED__:待审核 __REVIEWED__:已审核 __WORKFORCE_SAMPLED
GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error 使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed 华为云CCE集群纳管GPU裸金属服务器由于CloudInit
检查是否安装docker。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。
容器环境检测 NpuContainerEnvSystem 重要 Docker不可用 确认docker软件是否正常 无法使用docker软件 重要 容器插件Ascend-Docker-Runtime未安装 安装容器插件Ascend-Docker-Runtime,否则影响容器使用昇腾卡
kubectl delete -f config.yaml 父主题: 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导(6.3.909)
": true } 失败响应示例 { "is_success": false, "error_message": "Error string", "error_code": "ModelArts.0105" } 状态码 状态码请参见表1。
": true } 失败响应示例 { "is_success": false, "error_message": "Error string", "error_code": "ModelArts.0105" } 状态码 状态码请参见状态码。
kubectl delete -f config.yaml 父主题: 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导(6.3.910)
success Boolean 授权或者取消授权是否成功。
deployment_num Integer 部署在该节点上的应用实例个数。 host_name String 节点主机名。
检查是否安装docker。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。
success Boolean 授权或者取消授权是否成功。
检查docker是否安装。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。
准备数据 本教程使用到的训练数据集是Alpaca数据集。您也可以自行准备数据集。 Alpaca数据集 本教程使用Alpaca数据集,数据集的介绍及下载链接如下。 Alpaca数据集是由OpenAI的text-davinci-003引擎生成的包含52k条指令和演示的数据集。这些指令数据可以用来对语言模型进行指令调优