搜索_华为云

查询节点池的节点列表 - AI开发平台ModelArts

Abnormal：节点不正常 Checking: 节点自检中 az String 节点所在的可用区。 privateIp String 节点的IP地址。 resources NodeResource object 节点资源量信息。 availableResources NodeResource

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
预训练任务 - AI开发平台ModelArts

n/AscendSpeed/model/llama2-70B 必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。对于ChatGLMv3-6B和Qwen系列模型，还需要手动修改tokenizer文件，具体请参见训练tokenizer文件说明。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
LoRA微调训练 - AI开发平台ModelArts

n/AscendSpeed/model/llama2-70B 必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。对于ChatGLMv3-6B、ChatGLMv4-9B和Qwen系列模型，还需要手动修改tokenizer文件，具

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
使用Advisor工具分析生成调优建议 - AI开发平台ModelArts

P优化方式（修改点：注释第161和167行，增加第168~170行）。二进制调优使能，减少算子编译耗时，在train.py头文件导入之后添加（修改点：增加第37行）。 torch_npu.npu.set_compile_mode(jit_compile=False) AICPU算子调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型Pytorch迁移与精度性能调优 > 性能调优
快速配置ModelArts委托授权 - AI开发平台ModelArts

elArts会提醒您当前用户未配置授权，需联系此IAM用户的管理员账号进行委托授权。添加授权登录ModelArts管理控制台，在左侧导航栏选择“权限管理”，进入“权限管理”页面。单击“添加授权”，进入“访问授权”配置页面，根据参数说明进行配置。表1 参数说明参数说明 “授权对象类型”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
更新服务配置 - AI开发平台ModelArts

p4(需申请)/modelarts.vm.ai1.a310(需申请)，需申请权限才能使用的规格请在华为云创建工单，由ModelArts运维工程师添加权限。 instance_count 是 Integer 模型部署的实例数，当前限制最大实例数为128，如需使用更多的实例数，需提交工单申请。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
复制数据至容器中空间不足 - AI开发平台ModelArts

请排查是否使用的是GPU资源。如果使用的是CPU规格的资源，“/cache”与代码目录共用10G，会造成内存不足，请更改为使用GPU资源。请在代码中添加环境变量来解决。 import os os.system('export TMPDIR=/cache') 父主题：硬盘限制故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
认证鉴权 - AI开发平台ModelArts
认证鉴权 - AI开发平台ModelArts

"name": "project_name" } } } } 获取Token后，再调用其他接口时，您需要在请求消息头中添加“X-Auth-Token”，其值即为Token。例如Token值为“ABCDEFJ....”，则调用接口时将“X-Auth-Token:

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
预训练任务 - AI开发平台ModelArts

n/AscendSpeed/model/llama2-70B 必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。对于ChatGLMv3-6B和Qwen系列模型，还需要手动修改tokenizer文件，具体请参见训练tokenizer文件说明。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

读写权限：readwrite（创建开发环境实例modelarts:notebook:create仅支持配置readwrite）如果需要在一个自定义策略中添加多个不同的sfsOption，需要“Statement”中新增JSON结构体，例如： { "Version": "1.1",

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
查询资源池列表，可通过标签、资源池状态筛选查询资源池列表 - AI开发平台ModelArts

用户在cbc选择的折扣信息。 os.modelarts/service.console.url String 订购订单支付完成后跳转的url地址。 os.modelarts/order.id String 订单id，包周期资源池创建或者计费模式变更的时候该参数必需。 os.modelarts/flavor

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
Pytorch Mox日志反复输出 - AI开发平台ModelArts

就会不断的被导入，导致打印很多Mox的版本信息。处理方法为避免训练作业Pytorch Mox日志反复输出的问题，需要您在“启动文件”中添加如下代码，当“MOX_SILENT_MODE = “1””时，可在日志中屏蔽mox的版本信息： import os os.environ["MOX_SILENT_MODE"]

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
监控资源 - AI开发平台ModelArts
监控资源 - AI开发平台ModelArts

操作二：单击图例“cpuUsage”、“gpuMemUsage”、“gpuUtil”、“memUsage”“npuMemUsage”、“npuUtil”、可以添加或取消对应参数的使用情况图。操作三：鼠标悬浮在图片上的时间节点，可查看对应时间节点的占用率情况。表1 参数说明参数说明 cpuUsage

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
终止训练作业 - AI开发平台ModelArts

String 训练作业选择的引擎版本名称。如果填入engine_id，则无需填写。 image_url String 训练作业选择的自定义镜像地址。表25 TaskResponse 参数参数类型描述 role String 异构训练作业的任务角色。枚举值： learner（支持GPU\CPU规格）

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
不允许子账号使用公共资源池创建作业 - AI开发平台ModelArts

tebook:create”和“modelarts:service:create”并选中。“所有资源”选择“默认值”。“请求条件”中单击“添加条件”，设置“条件键”为“modelarts:poolType”，“运算符”为“StringEquals”，“值”为“public”。 JSON视图的策略内容如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

0” 原因分析出现该问题的可能原因如下： pytorch1.4引擎与之前pytorch1.3版本兼容性问题。处理方法在images之后添加contigous。 images = images.cuda() pred = model(images.permute(0, 3,

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
如何安装第三方包，安装报错的处理方法 - AI开发平台ModelArts

该样例已将安装包上传至“obs://cnnorth4-test/codes/mox_benchmarks/apex-master/”中，将在启动文件中添加以下代码进行安装。 try: import apex except Exception: import os import

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
创建数据集导出任务 - AI开发平台ModelArts

索引，此处可以根据此时间进行搜索。可选值如下： month：搜索往前30天至今天内添加的样本 day：搜索昨天(往前1天)至今天内添加的样本 yyyyMMdd-yyyyMMdd：搜索指定时间段内添加的样本，格式为“起始日期-结束日期”，查询天数不能超过30天。例如：“201909

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练tokenizer文件说明 - AI开发平台ModelArts

型中的tokenizer文件，需要修改代码。修改文件chatglm3-6b/tokenization_chatglm.py 。 271行要添加注释，修改后如图1所示。图1 修改ChatGLMv3-6B tokenizer文件（1） 291至300行要修改，修改后如图2所示。图2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
训练tokenizer文件说明 - AI开发平台ModelArts

型中的tokenizer文件，需要修改代码。修改文件chatglm3-6b/tokenization_chatglm.py 。 271行要添加注释，修改后如图1所示。图1 修改ChatGLMv3-6B tokenizer文件（1） 291至300行要修改，修改后如图2所示。图2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明

总条数： 1157

上一页
1
...
44
45
46
...
58
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询节点池的节点列表 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

使用Advisor工具分析生成调优建议 - AI开发平台ModelArts

快速配置ModelArts委托授权 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

复制数据至容器中空间不足 - AI开发平台ModelArts

认证鉴权 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

查询资源池列表，可通过标签、资源池状态筛选查询资源池列表 - AI开发平台ModelArts

Pytorch Mox日志反复输出 - AI开发平台ModelArts

监控资源 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

不允许子账号使用公共资源池创建作业 - AI开发平台ModelArts

日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

如何安装第三方包，安装报错的处理方法 - AI开发平台ModelArts

创建数据集导出任务 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线