搜索_华为云

编排Workflow - AI开发平台ModelArts

depend_steps=[job_step] ) # 服务部署 service_step = wf.steps.ServiceStep( name="service_step", title="服务部署", inputs=[wf.steps.Servic

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
文生图模型训练推理 - AI开发平台ModelArts

1基于DevSever适配PyTorch NPU Finetune&Lora训练指导（6.3.911） Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） SD3.5基于Lite Server适配PyTorch NPU的推理指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践
启动/停止/删除实例 - AI开发平台ModelArts

“/home/ma-user/work”目录以及动态挂载在“/data”下的目录下的数据会保存，其余目录下内容会被清理。例如：用户在开发环境中的其他目录下安装的外部依赖包等，在Notebook停止后会被清理。您可以通过保存镜像的方式保留开发环境设置，具体操作请参考保存Notebook实例。 No

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
Standard资源池节点故障定位 - AI开发平台ModelArts

驱动升级 NPU升级。节点正在执行NPU驱动升级。 A200008 节点管理节点准入准入检测。节点正在进行节点准入检测，包括基本的节点配置检查和简单的业务验证。 A050933 节点管理容错Failover 当节点具有该污点时，会将节点上容错（Failover）业务迁移走。

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
分页查询智能任务列表 - AI开发平台ModelArts

专属集群ID，默认为空，不使用专属集群；使用专属集群部署服务时需确保集群状态正常；配置此参数后，则使用集群的网络配置，vpc_id参数不生效。 inf_config_list Array of InfConfig objects 运行推理任务需要的配置列表，可选填，默认为空。 inf_output

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询算法列表 - AI开发平台ModelArts

metadata metadata object 算法的元数据，描述算法基本信息。 job_config job_config object 算法配置信息，如启动文件等。 resource_requirements Array of resource_requirements objects

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

i是 Hugging Face 官方提供的命令行工具，自带完善的下载功能。具体步骤可参考：HF-Mirror中的使用教程。完成依赖安装和环境变量配置后，以Llama2-70B为例： huggingface-cli download --resume-download meta-l

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
服务管理权限 - AI开发平台ModelArts

服务管理权限表1 服务管理细化权限说明权限对应API接口授权项依赖的授权项 IAM项目企业项目部署模型服务 POST /v1/{project_id}/services modelarts:service:create - √ √ 查询模型服务列表 GET /v1/

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
训练作业进程异常退出 - AI开发平台ModelArts

atch_size，优化代码，合理聚合、复制数据。请注意，数据文件大小不等于内存占用大小，需仔细评估内存使用情况。退出码139 请排查安装包的版本，可能存在包冲突的问题。排查办法根据错误信息判断，报错原因来源于用户代码。您可以通过以下两种方式排查：线上环境调试代码（仅适用于非分布式代码）

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
修改Standard专属资源池支持的作业类型 - AI开发平台ModelArts

设置某一作业类型后，即可在此专属资源池中下发此种类型的作业，没有设置的作业类型不能下发。为了支持不同的作业类型，后台需要在专属资源池上进行不同的初始化操作，例如安装插件、设置网络环境等。其中部分操作需要占据资源池的资源，导致用户实际可用资源减少。因此建议用户按需设置，避免不必要的资源浪费。约束限制专属资源池状态处于“运行中”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
查看Notebook实例事件 - AI开发平台ModelArts

重要实例扩容完成（User %s updated storage size successfully）重要 UpdateKeyPair 配置实例密钥对（User %s updated the instance keypair to "{%s}"）重要更新实例密钥对（User

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
在ModelArts的Notebook中使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

当数据集中的标签发生变化时，需要执行如下语句。此语句需在“mox.run”之前运行。语句中的“logits”，表示根据不同网络中分类层权重的变量名，配置不同的参数。此处填写其对应的关键字。 mox.set_flag('checkpoint_exclude_patterns', 'logits')

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

userdata机制拉取cce-agent，但是在服务器上查看没有拉cce-agent的动作，理论上该动作是cloudinit中的脚本在创建时自动执行的，可能是由于安装脚本没有注入userdata或者注入了但未执行。经查看是由于userdata未执行，可能原因为服务器A制作镜像时没有清理残留目录导致，即：

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
附录：大模型推理常见问题 - AI开发平台ModelArts

self.inv_freq.npu() 问题6：使用Qwen2-7B、Qwen2-72B模型有精度问题，重复输出感叹号检查步骤六中4. 配置环境变量章节中，高精度模式的环境变量是否开启。问题7：使用autoAWQ进行qwen-7b模型量化时报错使用autoAWQ进行qwen

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
创建诊断任务 - AI开发平台ModelArts

output_path /home/ma-user/work 否 advisor分析结果输出路径，包含html和xlsx两个文件。如果您想修改参数配置，可以点开Advanced Settings选项开关，然后对参数进行新增或修改。界面参考下图。图7 修改高级参数查看性能诊断任务结果。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

i是 Hugging Face 官方提供的命令行工具，自带完善的下载功能。具体步骤可参考：HF-Mirror中的使用教程。完成依赖安装和环境变量配置后，以Llama2-70B为例： huggingface-cli download --resume-download meta-l

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
附录：大模型推理常见问题 - AI开发平台ModelArts

self.inv_freq.npu() 问题6：使用Qwen2-7B、Qwen2-72B模型有精度问题，重复输出感叹号检查步骤六中4. 配置环境变量章节中，高精度模式的环境变量是否开启。问题7：使用autoAWQ进行qwen-7b模型量化时报错使用autoAWQ进行qwen

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
附录：大模型推理常见问题 - AI开发平台ModelArts

self.inv_freq.npu() 问题6：使用Qwen2-7B、Qwen2-72B模型有精度问题，重复输出感叹号检查步骤六中4. 配置环境变量章节中，高精度模式的环境变量是否开启。问题7：使用autoAWQ进行qwen-7b模型量化时报错使用autoAWQ进行qwen

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

i是 Hugging Face 官方提供的命令行工具，自带完善的下载功能。具体步骤可参考：HF-Mirror中的使用教程。完成依赖安装和环境变量配置后，以Llama2-70B为例： huggingface-cli download --resume-download meta-l

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

i是 Hugging Face 官方提供的命令行工具，自带完善的下载功能。具体步骤可参考：HF-Mirror中的使用教程。完成依赖安装和环境变量配置后，以Llama2-70B为例： huggingface-cli download --resume-download meta-l

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作

总条数： 1513

上一页
1
...
70
71
72
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

编排Workflow - AI开发平台ModelArts

文生图模型训练推理 - AI开发平台ModelArts

启动/停止/删除实例 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

分页查询智能任务列表 - AI开发平台ModelArts

查询算法列表 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

服务管理权限 - AI开发平台ModelArts

训练作业进程异常退出 - AI开发平台ModelArts

修改Standard专属资源池支持的作业类型 - AI开发平台ModelArts

查看Notebook实例事件 - AI开发平台ModelArts

在ModelArts的Notebook中使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

创建诊断任务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线