搜索_华为云

增加AppCode - AI开发平台ModelArts
增加AppCode - AI开发平台ModelArts

增加AppCode 功能介绍为指定API网关应用创建新的AppCode，只有APP的创建用户才可以创建AppCode，且只有共享/专享版APIG的APP才能创建AppCode。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
ModelArts训练作业无法解析参数，日志报错 - AI开发平台ModelArts

运行参数中未定义该参数。在训练环境中，系统可能会传入在Python脚本里没有定义的其他参数名称，导致参数无法解析，日志报错。处理方法参数定义中增加该参数的定义，代码示例如下： parser.add_argument('--init_method', default='tcp://xxx'

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
如何切分ModelArts数据集？ - AI开发平台ModelArts

于1。 “训练集比例”即用于训练模型的样本数据比例；“验证集比例”即用于验证模型的样本数据比例。“训练验证比例”会影响训练模板的性能。父主题： Standard数据准备

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
自动续费 - AI开发平台ModelArts
自动续费 - AI开发平台ModelArts

自动续费可以减少手动续费的管理成本，避免因忘记手动续费而导致ModelArts中专属资源池不能使用。自动续费的规则如下所述：以专属资源池的到期日计算第一次自动续费日期和计费周期。专属资源池自动续费周期以您选择的续费时长为准。例如，您选择了3个月，专属资源池即在每次到期前自动续费3个月。在专属资源池到

 帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
日志文件的大小达到限制 - AI开发平台ModelArts

silently 原因分析根据报错信息，可以判断是日志文件的大小已达到限制。出现该报错之后，日志不再增加，后台将继续运行。处理方法请您在启动文件中减少无用日志输出。父主题：硬盘限制故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
DockerFile构建镜像（可选） - AI开发平台ModelArts

n/LLaMAFactory 构建新镜像： docker build -t <镜像名称>:<版本名称> . 如无法访问公网则需配置代理，增加`--build-arg`参数指定代理地址确保访问公网。 docker build --build-arg "https_proxy=http://xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 准备工作
DockerFile构建镜像（可选） - AI开发平台ModelArts

/AscendFactory 构建新镜像： docker build -t <镜像名称>:<版本名称> . 如无法访问公网则需配置代理，增加`--build-arg`参数指定代理地址确保访问公网。 docker build --build-arg "https_proxy=http://xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作
报错“Host key verification failed.'或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

UserKnownHostsFile=/dev/null ForwardAgent yes 提示：增加参数后SSH登录时会忽略known_hosts文件，有安全风险。父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
在ModelArts训练得到的模型欠拟合怎么办？ - AI开发平台ModelArts

模型复杂化。对同一个算法复杂化。例如回归模型添加更多的高次项，增加决策树的深度，增加神经网络的隐藏层数和隐藏单元数等。弃用原来的算法，使用一个更加复杂的算法或模型。例如用神经网络来替代线性回归，用随机森林来代替决策树。增加更多的特征，使输入数据具有更强的表达能力。特征挖掘十分重

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
通过Function Calling扩展大语言模型对外部环境的理解 - AI开发平台ModelArts

通过Function Calling扩展大语言模型对外部环境的理解本示例将展示如何定义一个获取送货日期的函数，并通过LLM来调用外部API来获取外部信息。操作步骤设置Maas的api key和模型服务地址。 import requests from openai import

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 通过Function Calling扩展大语言模型交互能力
保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

对于OBS连接不稳定的现象，通过增加代码来解决。您可以在代码最前面增加如下代码，让TensorFlow对ckpt和summary的读取和写入可以通过本地缓存的方式中转解决： import moxing.tensorflow as mox mox.cache() 父主题： OBS操作相关故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
显存溢出错误 - AI开发平台ModelArts

可调整参数：TP张量并行（tensor-model-parallel-size）和PP流水线并行（pipeline-model-parallel-size），可以尝试增加 TP和PP的值，一般TP×PP≤NPU数量，并且要被整除，具体调整值可参照表2进行设置。可调整参数：MBS指最小batch处理的样本量

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 常见错误原因和解决方法
显存溢出错误 - AI开发平台ModelArts

可调整参数：TP张量并行（tensor-model-parallel-size）和PP流水线并行（pipeline-model-parallel-size），可以尝试增加 TP和PP的值，一般TP×PP≤NPU数量，并且要被整除，具体调整值可参照表2进行设置。可调整参数：MBS指最小batch处理的样本量

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 常见错误原因和解决方法
显存溢出错误 - AI开发平台ModelArts

可调整参数：TP张量并行（tensor-model-parallel-size）和PP流水线并行（pipeline-model-parallel-size），可以尝试增加TP和PP的值，一般TP×PP≤NPU数量，并且要被整除，具体调整值可参照表2进行设置。可调整参数：MBS指最小batch处理的样本量（

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 常见错误原因和解决方法
显存溢出错误 - AI开发平台ModelArts

可调整参数：TP张量并行（tensor-model-parallel-size）和PP流水线并行（pipeline-model-parallel-size），可以尝试增加TP和PP的值，一般TP×PP≤NPU数量，并且要被整除，具体调整值可参照表1进行设置。可调整参数：MBS指最小batch处理的样本量（

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910） > 常见错误原因和解决方法
Loss对齐结果 - AI开发平台ModelArts

0003，Loss结果对齐。需要注意训练引入随机性的目的是为了增加结果的鲁棒性，理论上不会对训练模型的收敛与否造成影响。此处做随机性固定主要的目的是为了训练结果可完全复现，从而实现NPU和标杆的精度对齐。父主题：精度对齐

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 精度对齐
通过API接口查询模型详情，model_name返回值出现乱码 - AI开发平台ModelArts

原因分析当模型名称包含下划线时，下划线涉及转义处理。处理方法需要在请求中增加exact_match参数，且参数值设置为true，确保model_name返回值正确。父主题：模型管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

Shell界面提示如下。图1 Cloud Shell界面当作业处于非运行状态或权限不足时会导致无法使用Cloud Shell，请根据提示定位原因即可。图2 报错提示部分用户登录Cloud Shell界面时，可能会出现路径显示异常情况，此时在Cloud Shell中单击回车键即可恢复正常。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

1434 SQL Server的TCP端口，用于返回SQLServer使用了哪个TCP/IP端口。 Oracle 1521 Oracle通信端口，弹性云服务器上部署了Oracle SQL需要放行的端口。 MySQL 3306 MySQL数据库对外提供服务的端口。 Windows Server

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
推理专属预置镜像列表 - AI开发平台ModelArts

libgoogle-glog-dev liblmdb-dev libatlas-base-dev librdmacm1 libcap2-bin libpq-dev mysql-common net-tools nginx openslide-tools openssh-client openssh-server

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表

总条数： 2522

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

增加AppCode - AI开发平台ModelArts

ModelArts训练作业无法解析参数，日志报错 - AI开发平台ModelArts

如何切分ModelArts数据集？ - AI开发平台ModelArts

自动续费 - AI开发平台ModelArts

日志文件的大小达到限制 - AI开发平台ModelArts

DockerFile构建镜像（可选） - AI开发平台ModelArts

DockerFile构建镜像（可选） - AI开发平台ModelArts

报错“Host key verification failed.'或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

在ModelArts训练得到的模型欠拟合怎么办？ - AI开发平台ModelArts

通过Function Calling扩展大语言模型对外部环境的理解 - AI开发平台ModelArts

保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

Loss对齐结果 - AI开发平台ModelArts

通过API接口查询模型详情，model_name返回值出现乱码 - AI开发平台ModelArts

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

推理专属预置镜像列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线