搜索_华为云

使用Cloud Shell登录训练容器 - AI开发平台ModelArts

trainJob:exec并选中，所有资源选择默认值。图1 创建自定义策略在统一身份认证服务页面的左侧导航选择“用户组”，在用户组页面查找待授权的用户组名称，在右侧的操作列单击“授权”，勾选步骤2创建的自定义策略，单击“下一步”，选择授权范围方案，单击“确定”。此时，该用户组下的所有用户均有权限通过Cloud

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
TensorFlow - AI开发平台ModelArts
TensorFlow - AI开发平台ModelArts

not os.path.exists(work_directory): os.mkdir(work_directory) filepath = os.path.join(work_directory, filename) if not os.path

帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 推理规范说明 > 自定义脚本代码示例
预训练任务 - AI开发平台ModelArts

执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入最后，请参考查看日志和性能章节查看预训练的日志和性能。父主题：主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
LoRA微调训练 - AI开发平台ModelArts

scripts/llama2/0_pl_lora_13b.sh 或者： sh scripts/llama2/0_pl_lora_13b.sh 最后，请参考查看日志和性能章节查看LoRA微调的日志和性能。父主题：主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
预训练任务 - AI开发平台ModelArts

执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入更多查看训练日志和性能操作，请参考查看日志和性能章节。如果需要使用断点续训练能力，请参考断点续训练章节修改训练脚本。父主题：预训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

行以下命令构建自定义镜像“test:v1”。 docker build -t test:v1 . 您可以使用“docker images”查看您构建的自定义镜像。本地验证镜像并上传镜像至SWR服务在本地环境执行以下命令启动自定义镜像 docker run -it -p 8080:8080

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
创建并管理工作空间 - AI开发平台ModelArts

管理工作空间配额工作空间创建成功后，可以查看配额信息或修改配额值。在ModelArts管理控制台的左侧导航栏中，选择“工作空间”进入工作空间列表。在工作空间列表，单击操作列的“配额管理”进入工作空间详情页。在配额信息页面可以查看工作空间设置的配额值、已用的配额、最后修改时间等配额信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
SFT全参微调权重转换 - AI开发平台ModelArts

权重转换完成后，在/home/ma-user/ws/processed_for_ma_input/BaiChuan2-13B/converted_weights目录下查看转换后的权重文件。父主题： SFT全参微调

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调
服务启动失败 - AI开发平台ModelArts

模型推理代码customize_service.py编写有问题如果模型推理代码customize_service.py编写有误，可以通过查看服务运行日志，定位具体原因进行修复。拉取镜像失败服务启动失败，提示拉取镜像失败，请参考服务部署、启动、升级和修改时，拉取镜像失败如何处理？

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
从0-1制作自定义镜像并创建AI应用 - AI开发平台ModelArts

行以下命令构建自定义镜像“test:v1”。 docker build -t test:v1 . 您可以使用“docker images”查看您构建的自定义镜像。本地验证镜像并上传镜像至SWR服务在本地环境执行以下命令启动自定义镜像 docker run -it -p 8080:8080

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
升级Lite Cluster资源池驱动 - AI开发平台ModelArts

隔离节点并滚动升级。无业务节点定义：在资源池详情“节点管理”页签下，如果GPU/Ascend的可用数等于总数，则为无业务节点。图1 查看无业务节点滚动驱动升级时，驱动异常的节点对升级无影响，会和驱动正常的节点一起升级。图2 驱动升级选择完成后，单击“确定”开始驱动升级。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
SFT全参微调权重转换 - AI开发平台ModelArts

权重转换完成后，在/home/ma-user/ws/processed_for_ma_input/Llama2-70B/converted_weights目录下查看转换后的权重文件。图1 转换后的权重文件父主题： SFT全参微调训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调训练
SFT微调权重转换 - AI开发平台ModelArts

权重转换完成后，在/home/ma-user/ws/processed_for_ma_input/Qwen-14B/converted_weights目录下查看转换后的权重文件。图1 转换后的权重文件父主题： SFT微调训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT微调训练
SFT微调训练任务 - AI开发平台ModelArts

填；TRAIN_ITERS、MBS、GBS、TP、PP、WORK_DIR、SEQ_LEN为非必填，有默认值。训练完成后，请参考查看日志和性能章节，查看SFT微调的日志和性能。父主题： SFT微调训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT微调训练
SFT全参微调任务 - AI开发平台ModelArts

填；TRAIN_ITERS、MBS、GBS、TP、PP、WORK_DIR、SEQ_LEN为非必填，有默认值。训练完成后，请参考查看日志和性能章节查看日志和性能。父主题： SFT全参微调训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调训练
SFT全参微调权重转换 - AI开发平台ModelArts

权重转换完成后，在/home/ma-user/ws/processed_for_ma_input/GLM3-6B/converted_weights目录下查看转换后的权重文件。图1 转换后的权重文件父主题： SFT全参微调训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调训练
设置告警规则 - AI开发平台ModelArts

在左侧导航栏，选择“云服务监控 > ModelArts”。单击在线服务名称或单击在线服务名称前面的小三角，展示模型版本列表，单击模型版本名称，查看告警规则详情。在告警规则详情页，单击单个指标右上角的加号按钮，对服务或模型版本的单个指标设置告警规则。父主题：云监控平台ModelArts监控

 帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 云监控平台ModelArts监控
升级Standard专属资源池驱动 - AI开发平台ModelArts

节点，隔离节点并滚动升级。无业务节点定义：在资源池详情“节点”页签下，如果GPU/Ascend的可用数等于总数，则为无业务节点。图1 查看无业务节点滚动驱动升级时，驱动异常的节点对升级无影响，会和驱动正常的节点一起升级。图2 驱动升级选择完成后，单击“确定”开始驱动升级。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

文件，OBS接口不支持直接调用，需要分多个线程分段拷贝，目前OBS侧服务端超时时间是30S，可以通过如下设置减少进程数。 # 设置进程数 os.environ['MOX_FILE_LARGE_FILE_TASK_NUM']=1 import moxing as mox # 拷贝文件

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

cn-southwest-2.myhuaweicloud.com/os-public-repo/bert_pretrain_mindspore:v1 docker tag swr.cn-southwest-2.myhuaweicloud.com/os-public-repo/bert_pretrain_mindspore:v1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用

总条数： 1250

上一页
1
...
58
59
60
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Cloud Shell登录训练容器 - AI开发平台ModelArts

TensorFlow - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

创建并管理工作空间 - AI开发平台ModelArts

SFT全参微调权重转换 - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

从0-1制作自定义镜像并创建AI应用 - AI开发平台ModelArts

升级Lite Cluster资源池驱动 - AI开发平台ModelArts

SFT全参微调权重转换 - AI开发平台ModelArts

SFT微调权重转换 - AI开发平台ModelArts

SFT微调训练任务 - AI开发平台ModelArts

SFT全参微调任务 - AI开发平台ModelArts

SFT全参微调权重转换 - AI开发平台ModelArts

设置告警规则 - AI开发平台ModelArts

升级Standard专属资源池驱动 - AI开发平台ModelArts

OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线