搜索_华为云

删除网络资源 - AI开发平台ModelArts

NetworkMetadataAnnotations 参数参数类型描述 os.modelarts/description String 网络资源描述，用于说明用于某种场景。不能包含字符!<>=&"'。表6 NetworkSpec 参数参数类型描述 cidr String 网络的cidr。取值范围： 172.16

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
分离部署推理服务 - AI开发平台ModelArts

0版本一致，此处介绍关键参数。详细参数解释请参见https://github.com/vllm-project/vllm/blob/main/vllm/engine/arg_utils.py。步骤七启动增量推理实例启动增量推理容器启动容器镜像前请先按照参数说明修改${}中的参数。docker启动失败会有对应的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

python3 python3-pip && \ pip3 install --trusted-host https://repo.huaweicloud.comxxx -i https://repo.huaweicloud.comxxx/repository/pypi/simple

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

2k条指令和演示的数据集。这些指令数据可以用来对语言模型进行指令调优，使语言模型更好地遵循指令。预训练使用的Alpaca数据集下载：https://huggingface.co/datasets/tatsu-lab/alpaca/resolve/main/data/train-

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

创建OBS桶时，桶的存储类别请勿选择“归档存储”，归档存储的OBS桶会导致模型训练失败。上传Step1 准备训练数据中下载的MNIST数据集压缩包文件到OBS的“mnist-data”文件夹中。上传数据到OBS中时，请不要加密，否则会导致训练失败。文件无需解压，直接上传压缩包至OBS中即可。上传训练脚本“train

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/lates

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
Controlnet训练 - AI开发平台ModelArts

Controlnet训练使用文本提示词可以生成一副精美的画作，然而无论再怎么精细地使用提示词来指导模型，也无法描述清楚人物四肢的角度、背景中物体的位置、光线照射的角度，使用Controlnet可以通过图像特征来为扩散模型的生成过程提供更加精细控制的方式。将Controlnet

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
查询专属资源池作业统计信息 - AI开发平台ModelArts

Completed Integer 已完成的作业个数。 Terminated Integer 已终止的作业个数。 Failed Integer 运行失败的作业个数。状态码： 400 表6 响应Body参数参数参数类型描述 error_code String ModelArts错误码。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
创建Standard专属资源池 - AI开发平台ModelArts

买界面可以被选择，但由于没有及时支付和创建资源池，导致该规格售罄创建失败。建议您在创建界面更换规格重新创建资源池。为什么无法使用资源池节点上的全部CPU资源？由于资源池节点上会安装系统、插件等内容，因此不能完全使用所有资源。例如：资源池节点是8U，节点分配给系统组件部分CPU，可用的资源会小于8U。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
团队标注的数据分配机制是什么？ - AI开发平台ModelArts

团队标注的数据分配机制是什么？目前不支持用户自定义成员任务分配，数据是平均分配的。当数量和团队成员人数不成比例，无法平均分配时，则将多余的几张图片，随机分配给团队成员。如果样本数少于待分配成员时，部分成员会存在未分配到样本的情况。样本只会分配给labeler，比如10000

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
镜像方案说明 - AI开发平台ModelArts

注意：该文件夹从Megatron-LM中复制得到 |——... 训练作业的资源池以及ECS都需要连通公网，否则会安装和下载失败。资源池打通公网配置请参见配置Standard专属资源池访问公网，ECS打通公网配置请参见ECS绑定弹性公网IP。父主题：准备镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
镜像方案说明 - AI开发平台ModelArts

注意：该文件夹从Megatron-LM中复制得到 |——... 训练作业的资源池以及ECS都需要连通公网，否则会安装和下载失败。资源池打通公网配置请参见配置Standard专属资源池访问公网，ECS打通公网配置请参见ECS绑定弹性公网IP。父主题：准备镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
镜像方案说明 - AI开发平台ModelArts

注意：该文件夹从Megatron-LM中复制得到 |——... 训练作业的资源池以及ECS都需要连通公网，否则会安装和下载失败。资源池打通公网配置请参见配置Standard专属资源池访问公网，ECS打通公网配置请参见ECS绑定弹性公网IP。父主题：准备镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
镜像方案说明 - AI开发平台ModelArts

注意：该文件夹从Megatron-LM中复制得到 |——... 训练作业的资源池以及ECS都需要连通公网，否则会安装和下载失败。资源池打通公网配置请参见配置Standard专属资源池访问公网，ECS打通公网配置请参见ECS绑定弹性公网IP。父主题：准备镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

docker build -t <镜像名称>:<版本名称> . 若无法访问公网，则可以配置代理，增加`--build-arg`参数指定代理地址，可访问公网。 docker build --build-arg "https_proxy=http://xxx.xxx.xxx.xxx" --build-arg

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
使用AWQ量化工具转换权重 - AI开发平台ModelArts

--calib-data：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val.jsonl的上一级目录。详细说明可以参考vLLM官网：https://docs.vllm.ai/en/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?sort=trending&search=QWEN+AWQ 方式二：使用AutoAWQ量化工具进行量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

Shell”页签，登录训练容器。连接成功后，Cloud Shell界面提示如下。图1 Cloud Shell界面当作业处于非运行状态或权限不足时会导致无法使用Cloud Shell，请根据提示定位原因即可。图2 报错提示部分用户登录Cloud Shell界面时，可能会出现路径显示异常情况，此时在Cloud

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
自动学习模型训练图片异常？ - AI开发平台ModelArts

解决方案字段解决方案说明 1 load failed 图片无法被解码且不能修复 ignore 系统已自动过跳过这张图片，不需要用户处理。 2 tf-decode failed 图片无法被TensorFlow解码且不能修复 ignore 系统已跳过这张图片，不需要用户处理。 3 size

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

业务运行阶段，先将业务系统对接在线服务请求，然后进行业务逻辑处理和监控设置。图1 推理服务的端到端运维流程图整个运维过程会对服务请求失败和资源占用过高的场景进行监控，当超过阈值时发送告警通知。图2 监控告警流程图方案优势通过端到端的服务运维配置，可方便地查看业务运行高

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署

总条数： 1146

上一页
1
...
33
34
35
...
58
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

删除网络资源 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

Controlnet训练 - AI开发平台ModelArts

查询专属资源池作业统计信息 - AI开发平台ModelArts

创建Standard专属资源池 - AI开发平台ModelArts

团队标注的数据分配机制是什么？ - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

自动学习模型训练图片异常？ - AI开发平台ModelArts

端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线