搜索_华为云

代码运行故障 - AI开发平台ModelArts

Notebook运行代码报错，在'/tmp'中到不到文件 Notebook无法执行代码，如何处理？运行训练代码，出现dead kernel，并导致实例崩溃如何解决训练过程中出现的cudaCheckError错误？如何处理使用opencv.imshow造成的内核崩溃？使用Windows下生成的文本文件时报错找不到路径？

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
配置IAM权限 - AI开发平台ModelArts

"Action": [ "vpc:*:*", "ecs:*:get*", "ecs:*:list*" ], "Effect": "Allow"

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
发布和管理AI Gallery项目 - AI开发平台ModelArts

性。编辑Notebook介绍在Notebook详情页，单击“项目介绍”。在基础设置中设置“许可证”、“语言”、“框架”、“任务类型”和“硬件资源”等信息。单击“确定”。编辑设置基本设置单击右侧的，可以更改Notebook名称和描述。编辑完成之后单击“确定”。关联资产

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
权限相关 - AI开发平台ModelArts
权限相关 - AI开发平台ModelArts

权限相关使用ModelArts时提示“权限不足”，如何解决？在Notebook中如何实现IAM用户隔离？如何获取访问密钥？

帮助中心 > AI开发平台ModelArts > 常见问题
附录：rank_table_file.json文件 - AI开发平台ModelArts

device_ip：当前卡的IP地址，2台机器共16张卡。device_ip查询命令 for i in {0..7};do hccn_tool -i $i -ip -g; done server_id：当前Server节点的IP地址，涉及2台机器。 container_ip：容器IP地址，无特殊配置时与server_id保存一致。

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
依赖和委托 - AI开发平台ModelArts

等。 ECS BMS EVS DEW ecs:cloudServers:create ecs:cloudServers:delete ecs:cloudServers:get ecs:cloudServers:start ecs:cloudServers:stop ecs:cloudServers:reboot

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

在ModelArts管理控制台，使用创建好的模型部署为在线服务。登录云监控服务CES管理控制台，设置ModelArts服务的告警规则并配置主题订阅方式发送通知。具体操作请参考设置告警规则。当配置完成后，在左侧导航栏选择“云服务监控 > ModelArts”即可查看在线服务的请求情况和资源占用情况，如下图所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
在MaaS中创建模型 - AI开发平台ModelArts

在generation_config.json中没有将do_sample的值设置为true，与配置的temperature、top_p、top_k等采样参数矛盾。将“generation_config.json”文件中的“do_sample”的值设置为“true”。 Failed to read user

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

添加部署上线使用权限。在统一身份认证服务页面的左侧导航选择“权限管理 > 权限”，单击右上角的“创建自定义策略”，设置策略。添加部署上线使用权限。 “策略名称”：设置自定义策略名称，例如：service。 “策略配置方式”：选择JSON视图。 “策略内容”：填入如下内容。 {

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
实例故障 - AI开发平台ModelArts
实例故障 - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？使用pip install时出现“没有空间”的错误出现“save error”错误，可以运行代码，但是无法保存出现ModelArts.6333错误，如何处理？打开Notebook实例提示token不存在或者token丢失如何处理？父主题：开发环境

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

创建桶的区域需要与ModelArts所在的区域一致。例如：当前ModelArts在华北-北京四区域，在对象存储服务创建桶时，请选择华北-北京四。如何查看OBS桶与ModelArts的所处区域，请参见查看OBS桶与ModelArts是否在同一区域。请勿开启桶加密，ModelArts不支

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
训练启动脚本说明和参数配置 - AI开发平台ModelArts

（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。 SN 1200 必须修改。指定的输入数据集中数据的总数量。更换数据集时，需要修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。 SN 1200 必须修改。指定的输入数据集中数据的总数量。更换数据集时，需要修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
训练启动脚本说明和参数配置 - AI开发平台ModelArts

（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。 SN 1200 必须修改。指定的输入数据集中数据的总数量。更换数据集时，需要修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
Notebook使用场景 - AI开发平台ModelArts

远程使用Notebook实例、通过VS Code远程使用Notebook实例、通过SSH工具远程使用Notebook。在AI开发过程中，如何将文件方便快速地上传到Notebook几乎是每个开发者都会遇到的问题。ModelArts提供了多种文件上传方式，在文件上传过程中，可以查看上传进度和速度。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
MoXing - AI开发平台ModelArts
MoXing - AI开发平台ModelArts

使用MoXing复制数据报错如何关闭Mox的warmup Pytorch Mox日志反复输出 moxing.tensorflow是否包含整个TensorFlow，如何对生成的checkpoint进行本地Fine Tune？训练作业使用MoXing复制数据较慢，重复打印日志 MoXing如何访问文件

 帮助中心 > AI开发平台ModelArts > 故障排除
模型训练存储加速 - AI开发平台ModelArts

Turbo存储加速的具体方案请查看：面向AI场景使用OBS+SFS Turbo的存储加速实践。设置训练存储加速当完成上传数据至OBS并预热到SFS Turbo中步骤后，在ModelArts Standard中创建训练作业时，设置训练“SFS Turbo”，在“文件系统”中选择SFS Turbo实例名

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
查询AI应用详情 - AI开发平台ModelArts

execution_code String 执行代码存放的OBS地址，名称固定为“customize_service.py”。 schema_doc String 模型schema文档的下载地址。 image_address String 模型打包后的镜像地址。 output_params Array

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
在ECS中创建ma-user和ma-group - AI开发平台ModelArts

在ECS中创建ma-user和ma-group 在ModelArts训练平台使用的自定义镜像时，默认用户为ma-user、默认用户组为ma-group。如果在训练时调用ECS中的文件，需要修改文件权限改为ma-user可读，否则会出现Permission denied错误，因此需

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
训练启动脚本说明和参数配置 - AI开发平台ModelArts

（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。 SN 1200 必须修改。指定的输入数据集中数据的总数量。更换数据集时，需要修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明

总条数： 1492

上一页
1
...
49
50
51
...
75
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

代码运行故障 - AI开发平台ModelArts

配置IAM权限 - AI开发平台ModelArts

发布和管理AI Gallery项目 - AI开发平台ModelArts

权限相关 - AI开发平台ModelArts

附录：rank_table_file.json文件 - AI开发平台ModelArts

依赖和委托 - AI开发平台ModelArts

端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

实例故障 - AI开发平台ModelArts

创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

Notebook使用场景 - AI开发平台ModelArts

MoXing - AI开发平台ModelArts

模型训练存储加速 - AI开发平台ModelArts

查询AI应用详情 - AI开发平台ModelArts

在ECS中创建ma-user和ma-group - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线