搜索_华为云

在Workflow中更新已部署的服务 - AI开发平台ModelArts

数据格式异常会导致训练失败，建议开启，保证训练稳定性。数据量过大时，数据清洗可能耗时较久，可自行线下清洗（支持BMP.JPEG,PNG格式, RGB三通道）。建议用JPEG格式数据")), wf.AlgorithmParameters(name="use_fp16", value=wf

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

（必须是“迭代次数|loss|吞吐”），才能在此处正常查看吞吐和“训练LOSS”曲线。训练LOSS 训练阶段的LOSS变化，模型在日志里用LOSS关键词记录数据，按照训练迭代周期记录LOSS值。微调产物说明模型微调完成后，会得到一个新模型，即微调产物。在微调大师页面，单击

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
线下容器镜像构建及调试 - AI开发平台ModelArts

需要进入容器看日志。注意：重点对应日志中是否有ERROR（包括，容器启动时、API执行时）。牵扯部分文件用户组不一致的情况，可以在宿主机用root权限执行命令进行修改 docker exec -u root:root 39c9ceedb1f6 bash -c "chown -R

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
分离部署推理服务 - AI开发平台ModelArts

启动服务，并按照global rank_table中的全量实例、增量实例的顺序，对全量推理实例、增量推理实例启动的端口号进行排序，端口之间用`,`分隔开作为该环境变量的输入。 USE_OPENAI：仅在服务入口实例生效，用于配置api-server服务是否使用openai服务，默

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
训练作业卡死检测 - AI开发平台ModelArts

问题现象4 使用pytorch中的dataloader读数据时，作业卡在读数据过程中，日志停在训练的过程中并不再更新日志。解决方案4 用dataloader读数据时，适当减小num_worker。常见案例：训练最后一个epoch卡死问题现象通过日志查看数据切分是否对齐，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
分离部署推理服务 - AI开发平台ModelArts

启动服务，并按照global rank_table中的全量实例、增量实例的顺序，对全量推理实例、增量推理实例启动的端口号进行排序，端口之间用`,`分隔开作为该环境变量的输入。 USE_OPENAI：仅在服务入口实例生效，用于配置api-server服务是否使用openai服务，默

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

启动服务，并按照global rank_table中的全量实例、增量实例的顺序，对全量推理实例、增量推理实例启动的端口号进行排序，端口之间用`,`分隔开作为该环境变量的输入。 USE_OPENAI：仅在服务入口实例生效，用于配置api-server服务是否使用openai服务，默

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
查询数据集的版本列表 - AI开发平台ModelArts

查询数据集的版本列表功能介绍查询指定数据集的版本列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datasets

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
部署模型为在线服务 - AI开发平台ModelArts

部署模型为在线服务模型准备完成后，您可以将模型部署为在线服务，对在线服务进行预测和调用。约束与限制单个用户最多可创建20个在线服务。前提条件数据已完成准备：已在ModelArts中创建状态“正常”可用的模型。由于在线运行需消耗资源，确保账户未欠费。部署服务操作需要镜

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

需要进入容器看日志。注意：重点对应日志中是否有ERROR（包括，容器启动时、API执行时）。牵扯部分文件用户组不一致的情况，可以在宿主机用root权限执行命令进行修改 docker exec -u root:root 39c9ceedb1f6 bash -c "chown -R

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
训练的数据集预处理说明 - AI开发平台ModelArts

assistant_ids input_ids是user_ids和assistant_ids的拼接 labels与input_ids对应，用-100替换user_ids的token，只保留assistant_ids attention_mask是和input_ids等长的全1序列

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

assistant_ids input_ids是user_ids和assistant_ids的拼接 labels与input_ids对应，用-100替换user_ids的token，只保留assistant_ids attention_mask是和input_ids等长的全1序列

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
创建Workflow服务部署节点 - AI开发平台ModelArts

ServiceConfig() # 主要在服务部署节点的输出中使用如果您没有特殊需求，可直接使用内置的默认值。使用案例主要包含三种场景的用例：新增在线服务更新在线服务服务部署输出推理地址新增在线服务 import modelarts.workflow as wf # 通

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
编排Workflow - AI开发平台ModelArts

数据格式异常会导致训练失败，建议开启，保证训练稳定性。数据量过大时，数据清洗可能耗时较久，可自行线下清洗（支持BMP.JPEG,PNG格式, RGB三通道）。建议用JPEG格式数据")), wf.AlgorithmParameters(name="use_fp16", value=wf

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
自定义模型规范 - AI开发平台ModelArts

45--data_demo” ENV_AG_USER_PARAMS 配置的训练超参json字符串。创建训练任务时在算法配置页面设置的超参，用json字符串表示。 {"per_device_eval_batch_size":"32","lr":"0.001","logging_steps":"24"}

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

py文件中注释以下代码。 torch_npu.npu.set_compile_mode(jit_compile=False) 启动服务用ifconfig命令获取容器ip（若无效可使用ip addr，或者自行寻找其他方式获取到容器ip）。首先进入目录。 cd /home/ma-user/ComfyUI

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
创建生产训练作业 - AI开发平台ModelArts

运行训练作业时，当“代码目录”下载完成后，“启动命令”会被自动执行。如果训练启动脚本用的是py文件，例如“train.py”，则启动命令如下所示。 python ${MA_JOB_DIR}/demo-code/train.py 如果训练启动脚本用的是sh文件，例如“main.sh”，则启动命令如下所示。 bash

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
创建Workflow数据集导入节点 - AI开发平台ModelArts

仅支持一个字符，必须为大小写字母，数字和“!@#$%^&*_=|?/':.;,”其中的某一字符。否 str 使用案例主要包含三种场景的用例：场景一：将指定存储路径下的数据导入到目标数据集中。适用于需要对数据集进行数据更新的操作。用户将指定路径下已标注的数据导入到数据集中（

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

S上传至SFS Turbo。检查云服务环境。 ECS服务器和SFS的共享硬盘在相同的VPC或者对应VPC能够互联。 ECS服务器基础镜像用的是Ubuntu 18.04。 ECS服务器和SFS Turbo在同一子网中。在ECS服务器中设置华为云镜像源。 sudo sed -i "s@http://

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
将模型部署为批量推理服务 - AI开发平台ModelArts

输入数据格式为csv时，建议不要包含中文。如需使用中文，请将文件编码格式设置为UTF-8编码。您可以使用代码方式转换文件编码格式，也可以将csv文件用记事本方式打开，在另存为弹出的窗口页面设置编码格式。输入数据格式为csv时，建议文件大小不超过12MB。如果单张图片/csv文件超过文件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测

总条数： 641

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Workflow中更新已部署的服务 - AI开发平台ModelArts

使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

查询数据集的版本列表 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

创建Workflow服务部署节点 - AI开发平台ModelArts

编排Workflow - AI开发平台ModelArts

自定义模型规范 - AI开发平台ModelArts

SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

创建生产训练作业 - AI开发平台ModelArts

创建Workflow数据集导入节点 - AI开发平台ModelArts

在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

将模型部署为批量推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线