搜索_华为云

训练tokenizer文件说明 - AI开发平台ModelArts

件chatglm3-6b/tokenization_chatglm.py 。文件最后几处代码中需要修改，具体位置可根据上下文代码信息进行查找，修改后如图所示。图1 修改ChatGLMv3-6B tokenizer文件图2 修改ChatGLMv3-6B tokenizer文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练tokenizer文件说明 - AI开发平台ModelArts

件chatglm3-6b/tokenization_chatglm.py 。文件最后几处代码中需要修改，具体位置可根据上下文代码信息进行查找，修改后如图所示。图1 修改ChatGLMv3-6B tokenizer文件图2 修改ChatGLMv3-6B tokenizer文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
IEF节点边缘服务部署失败 - AI开发平台ModelArts

处理方法1 在ModelArts管理控制台，选择“权限管理”。在用户名对应的“授权内容”列，单击“查看权限”，确认用户的委托权限是否已包含Tenant Administrator。图1 查看委托权限详情是，重新“启动”边缘服务，若还是“异常”则联系技术支持处理。否，执行下一步，给用户添加委托权限。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
使用自定义引擎在ModelArts Standard创建AI应用 - AI开发平台ModelArts

其他参数保持默认值。单击“立即创建”，跳转到AI应用列表页，查看AI应用状态，当状态变为“正常”，AI应用创建成功。图1 创建AI应用单击AI应用名称，进入AI应用详情页面，查看AI应用详情信息。部署服务并查看详情在AI应用详情页面，单击右上角“部署>在线服务”，进入服

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

原因分析用户选择的训练规格资源和算法不匹配。例如：算法支持的是GPU规格，创建训练作业时选择了ASCEND规格的资源类型。处理方法查看算法代码中设置的训练资源规格。检查创建训练作业时所选的资源规格是否正确，重新创建训练作业选择正确的资源规格。父主题：云上迁移适配故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
训练作业的日志出现detect failed（昇腾预检失败） - AI开发平台ModelArts

通过给训练作业加环境变量“MA_DETECT_TRAIN_INJECT_CODE”并将对应的值设置成0，就可以将预检功能关闭。环境变量说明参考查看训练容器环境变量。父主题： Ascend相关问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > Ascend相关问题
在MaaS中创建模型 - AI开发平台ModelArts

Studio左侧导航栏中，选择“我的模型”进入模型列表。单击模型名称，进入模型详情页面，可以查看模型“基本信息”和“作业记录”。基本信息：可以查看模型名称、ID、来源模型等信息。作业记录：可以查看该模型被用于哪些作业类型，以及当前作业的状态等信息。删除我的模型删除操作无法恢复，请谨慎操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
配置ModelArts委托权限 - AI开发平台ModelArts

rts服务声明》”，然后单击“创建”。图1 配置委托访问授权完成配置后，在ModelArts控制台的权限管理列表，可查看到此账号的委托配置信息。图2 查看委托配置信息父主题：权限配置

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
训练作业性能降低 - AI开发平台ModelArts

通过CloudShell登录到Linux工作页面，检查GPU工作情况：通过输入“nvidia-smi”命令，查看GPU工作是否异常。通过输入“nvidia-smi -q -d TEMPERATURE”命令，查看TEMP参数是否存在异常，如果温度过高，会导致训练性能下降。父主题：训练作业性能问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业性能问题
昇腾迁移融合算子API替换样例 - AI开发平台ModelArts

cuda() result = fast_gelu_module(input_data) torch_npu.npu_rms_norm 输入数据dtype仅支持float16、bfloat16、float。 torch原生代码示例如下： import torch class TorchRMSNorm(torch

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移性能调优 > 自动诊断工具MA-Advisor使用指导
管理AI Gallery中的AI应用 - AI开发平台ModelArts

在AI应用详情页，选择“设置”页签。在“环境变量管理”处，可以查看、新增、修改、删除环境变量。最多支持创建100个环境变量。变量名称不可重复，只能由下划线、字母与数字组成且不能以数字开头。查看环境变量的值：单击，可以查看当前环境变量的值。新增环境变量：单击“新增”，在编辑环境变

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
自定义引擎创建模型规范 - AI开发平台ModelArts

其他参数保持默认值。单击“立即创建”，跳转到AI应用列表页，查看AI应用状态，当状态变为“正常”，AI应用创建成功。图1 创建AI应用单击AI应用名称，进入AI应用详情页面，查看AI应用详情信息。部署服务并查看详情在AI应用详情页面，单击右上角“部署>在线服务”，进入服

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

er服务可以使单节点GPU卡间互联，在多卡GPU机器上，出现这种问题可能是nvidia-fabricmanger异常导致。执行以下命令，查看NVIDIA和CUDA的版本，以及nvidia-fabricmanager的状态。 systemctl status nvidia-fabricmanager

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

问题现象 VS Code SSH连接后，长时间未操作，窗口未关闭，再次使用发现VS Code在重连环境，无弹窗报错。左下角显示如下图：查看VS Code Remote-SSH日志发现，连接在大约2小时后断开了：原因分析用户SSH交互操作停止后一段时间，防火墙对空闲链接进行

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

问题现象 VS Code SSH连接后，长时间未操作，窗口未关闭，再次使用发现VS Code在重连环境，无弹窗报错。左下角显示如下图：查看VS Code Remote-SSH日志发现，连接在大约2小时后断开了：原因分析用户SSH交互操作停止后一段时间，防火墙对空闲链接进行

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

userdata机制拉取cce-agent，但是在服务器上查看没有拉cce-agent的动作，理论上该动作是cloudinit中的脚本在创建时自动执行的，可能是由于安装脚本没有注入userdata或者注入了但未执行。经查看是由于userdata未执行，可能原因为服务器A制作镜像时没有清理残留目录导致，即：

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
训练tokenizer文件说明 - AI开发平台ModelArts

件chatglm3-6b/tokenization_chatglm.py 。文件最后几处代码中需要修改，具体位置可根据上下文代码信息进行查找，修改后如图所示。图2 修改ChatGLMv3-6B tokenizer文件图3 修改ChatGLMv3-6B tokenizer文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
训练tokenizer文件说明 - AI开发平台ModelArts

件chatglm3-6b/tokenization_chatglm.py 。文件最后几处代码中需要修改，具体位置可根据上下文代码信息进行查找，修改后如图所示。图2 修改ChatGLMv3-6B tokenizer文件图3 修改ChatGLMv3-6B tokenizer文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 训练脚本说明
训练tokenizer文件说明 - AI开发平台ModelArts

件chatglm3-6b/tokenization_chatglm.py 。文件最后几处代码中需要修改，具体位置可根据上下文代码信息进行查找，修改后如图2所示。图2 修改ChatGLMv3-6B tokenizer文件图3 修改ChatGLMv3-6B tokenizer文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
训练tokenizer文件说明 - AI开发平台ModelArts

件chatglm3-6b/tokenization_chatglm.py 。文件最后几处代码中需要修改，具体位置可根据上下文代码信息进行查找，修改后如图所示。图2 修改ChatGLMv3-6B tokenizer文件图3 修改ChatGLMv3-6B tokenizer文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明

总条数： 1754

上一页
1
...
83
84
85
...
88
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

IEF节点边缘服务部署失败 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建AI应用 - AI开发平台ModelArts

创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

训练作业的日志出现detect failed（昇腾预检失败） - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

配置ModelArts委托权限 - AI开发平台ModelArts

训练作业性能降低 - AI开发平台ModelArts

昇腾迁移融合算子API替换样例 - AI开发平台ModelArts

管理AI Gallery中的AI应用 - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线