搜索_华为云

ModelArts CLI命令参考 - AI开发平台ModelArts

configure鉴权命令 ma-cli image镜像构建支持的命令 ma-cli ma-job训练作业支持的命令 ma-cli dli-job提交DLI Spark作业支持的命令使用ma-cli obs-copy命令复制OBS数据父主题：使用Notebook进行AI开发调试

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

7”，则表示InfiniBand Verbs超时。单击右侧“重建”，重新创建训练作业，设置环境变量“NCCL_IB_TIMEOUT=22”，提交训练作业后等待作业完成。如果出现报错“NCCL WARN Bootstrap : no socket interface found”或“NCCL

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
创建训练任务 - AI开发平台ModelArts

进行授权。在左侧导航栏中选择“模型训练 > 训练作业”，默认进入“训练作业”列表。在“创建训练作业”页面，填写相关参数信息，然后单击“提交”。创建方式：选择“自定义算法”。启动方式：选择“自定义”。镜像：选择上传的自定义镜像。启动命令： cd /home/ma-use

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

脚本中添加收集Summary相关代码。 TensorFlow引擎的训练脚本中添加Summary代码，具体方式请参见TensorFlow官方网站。注意事项运行中的可视化作业不单独计费，当停止Notebook实例时，计费停止。 Summary文件数据如果存放在OBS中，由OBS单

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
注册伙伴 - AI开发平台ModelArts
注册伙伴 - AI开发平台ModelArts

“发布”进入合作伙伴申请页面。如果已经是伙伴用户，则会进入发布解决方案页面。根据界面提示，填写注册成为合作伙伴需要提供的信息。单击“提交”，AI Gallery的运营人员将会审核您的申请，后续您可以在“我的Gallery > 合作伙伴”里查看审核进展以及审核结果。图1 查看审核进度

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 合作伙伴
VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

gz文件重命名为“vscode-server-linux-x64.tar.gz”。 https://update.code.visualstudio.com/commit:<提交的ID码>/server-linux-arm64/stable 例如：commit-id是863d2581ecda6849923a2118

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
预测API的域名停用公告 - AI开发平台ModelArts

API的域名。如果您使用的是VPC内部节点访问ModelArts推理的在线服务，预测API切换域名后，由于内网VPC无法识别公网域名，请提交工单联系华为云技术支持打通网络。父主题：产品变更公告

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品变更公告
数据导入方式介绍 - AI开发平台ModelArts

BS）、数据仓库服务（DWS）、数据湖探索服务（DLI）、MapReduce服务（MRS）和本地上传。数据集中的数据导入入口数据集中的数据导入有5个入口。创建数据集时直接从设置的数据导入路径中自动同步数据。创建完数据集后，在数据集列表页面的操作栏单击“导入”，导入数据。图1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集
从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

“obs://test-modelarts/tensorflow/log/” 用于存储训练日志文件。 Step2 创建数据集并上传至OBS 使用网站https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz，下载“mnist

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
连接远端开发环境时，一直处于"Setting up SSH Host xxx: Downloading VS Code Server locally"超过10分钟以上，如何解决？ - AI开发平台ModelArts

gz文件重命名为“vscode-server-linux-x64.tar.gz”。 https://update.code.visualstudio.com/commit:<提交的ID码>/server-linux-arm64/stable 例如：commit-id是863d2581ecda6849923a2118

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
配置Standard专属资源池可访问公网 - AI开发平台ModelArts

网地址，默认不能转发到用户VPC的SNAT，需要提交工单联系技术支持在专属资源池VPC的路由中添加指向对等连接的默认路由。当您开启默认路由后，在打通VPC时，会给ModelArts网络0.0.0.0/0路由作为默认路由，此时无需提交工单添加默认路由即可完成网络配置。步骤二：配置SNAT

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
SFT全参微调训练 - AI开发平台ModelArts

保存该路径下。提交训练作业，训练完成后，生成的权重文件自动保存在SFS Turbo中，保存路径为：/home/ma-user/work/llm_train/saved_dir_for_output/llama2-13b/saved_models/。最后，提交训练作业，训练完成

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
LoRA微调训练 - AI开发平台ModelArts

保存该路径下。提交训练作业，训练完成后，生成的权重文件自动保存在SFS Turbo中，保存路径为：/home/ma-user/work/llm_train/saved_dir_for_output/llama2-13b/saved_models/。最后，提交训练作业，训练完成

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
升级模型服务 - AI开发平台ModelArts

在服务升级页面，配置升级参数。 “模型设置”：单击“更换”，选择原模型下的其他模型版本。其他参数不可修改，但可以了解原模型服务的配置。配置完成后，单击“提交”启动服务升级。父主题：管理我的服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

保存该路径下。提交训练作业，训练完成后，生成的权重文件自动保存在SFS Turbo中，保存路径为：/home/ma-user/work/llm_train/saved_dir_for_output/llama2-13b/saved_models/。最后，提交训练作业，训练完成

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
PD分离部署使用说明 - AI开发平台ModelArts

可选输入，当存在该输入时，表示分离部署的服务入口在该机器。注意，在多台机器启动分离部署时，只能有一台机器存在服务入口。当存在该输入时，会生成local_ranktable_xx_host.json文件，用于在启动推理服务时确定服务入口实例。 --prefill-server-li

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
Notebook使用场景 - AI开发平台ModelArts

odelArts Notebook及线下虚拟机中与云端服务交互，使用ma-cli命令可以实现命令自动补全、鉴权、镜像构建、提交ModelArts训练作业、提交DLI Spark作业、OBS数据复制等，具体参见ModelArts CLI命令参考。 ModelArts Notebook内置MoXing

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

VPC访问通道访问在线服务操作步骤如下：获取ModelArts终端节点服务地址购买连接ModelArts终端节点创建DNS内网域名 VPC访问在线服务提交工单，提供账号ID给华为云技术支持，用于获取ModelArts终端节点服务地址。购买连接ModelArts终端节点登录虚拟私有云（VP

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

灰度发布您可以设置两个版本的流量占比，服务调用请求根据该比例分配。其他设置可参考参数说明。完成设置后，单击下一步。确认信息无误后，单击“提交”部署在线服务。父主题： Standard推理部署

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
扩缩容模型服务实例数 - AI开发平台ModelArts

选择模型服务，单击操作列的“更多 > 扩缩容”，进入扩缩容页面。在扩缩容页面，根据业务需要增删模型服务的实例数，配置完成后，单击“确认”提交扩缩容任务。在我的服务列表，单击服务名称，进入服务详情页，可以查看修改后的实例数是否生效。父主题：管理我的服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务

总条数： 255

上一页
1
2
3
4
5
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts CLI命令参考 - AI开发平台ModelArts

训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

注册伙伴 - AI开发平台ModelArts

VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

预测API的域名停用公告 - AI开发平台ModelArts

数据导入方式介绍 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Downloading VS Code Server locally"超过10分钟以上，如何解决？ - AI开发平台ModelArts

配置Standard专属资源池可访问公网 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

升级模型服务 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

Notebook使用场景 - AI开发平台ModelArts

通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

扩缩容模型服务实例数 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线