搜索_华为云

Msprobe精度比对 - AI开发平台ModelArts

Thousandth Err Ratio（双千分之一）和Five Thousandths Err Ratio（双千分之五）这几种评价指标，工具通过阈值过滤筛选出不达标API的输入输出提示用户进行重点关注。使用步骤如下：通过pip安装Msprobe工具。 # shell pip install

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优 > Msprobe工具使用指导
基于ModelArts performance advisor插件的昇腾PyTorch性能调优步骤 - AI开发平台ModelArts

stage的计算量存在差异，advisor会自动对不同stage进行计算维度的分析，因此在Advanced Setting中设置分析进程为2（不建议设置太大，避免占用过多CPU资源导致OOM类问题）使能并行分析，加快分析速度，如下图4所示。图4 基于performance advisor进行性能劣化分析

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

Arts监控服务。设置告警规则有多种方式。您可以根据实际应用场景，选择设置告警规则的方式。对ModelArts服务设置告警规则对单个服务设置告警规则对模型版本设置告警规则对服务或模型版本的单个指标设置告警规则方式一：对整个ModelArts服务设置告警规则登录管理控制台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
创建可视化作业 - AI开发平台ModelArts

Object 自动停止设置。参见表4。表3 flavor属性列表参数是否必选参数类型说明 code 是 String 可视化作业选择的资源规格编码。通过flavor接口获得。表4 schedule属性列表参数是否必选参数类型说明 type 是 String 设置为stop。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
自动学习训练作业失败 - AI开发平台ModelArts

数据源”，将OBS中的数据重新同步至ModelArts中。检查OBS的访问权限如果OBS桶的访问权限设置无法满足训练要求时，将会出现训练失败。请排查如下几个OBS的权限设置。当前账号具备OBS桶的读写权限（桶ACLs）进入OBS管理控制台，选择当前自动学习项目使用的OBS桶，单击桶名称进入概览页。

帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
Standard资源池节点故障定位 - AI开发平台ModelArts

${device_id} -link_stat -g”查看24小时内闪断5次以上。 A050951 NPU 显存 NPU ECC次数达到维修阈值。 NPU的HBM Double Bit Isolated Pages Count值大于等于64。 A050146 Runtime 其他 ntp异常。

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

格”提高预测速度。例如使用GPU资源代替CPU资源。部署在线服务时，您可以增加“计算节点个数”。如果节点个数设置为1，表示后台的计算模式是单机模式；如果节点个数设置大于1，表示后台的计算模式为分布式的。您可以根据实际需求进行选择。推理速度与模型复杂度强相关，您可以尝试优化模型提高预测速度。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

device 原因分析因为编译的时候需要设置setup.py中编译的参数arch和code和电脑的显卡匹配。解决方法对于GP Vnt1的显卡，GPU算力为-gencode arch=compute_70,code=[sm_70,compute_70]，设置setup.py中的编译参数即可解决。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 代码运行常见错误
如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

device 原因分析因为编译的时候需要设置setup.py中编译的参数arch和code和电脑的显卡匹配。解决方法对于GP Vnt1的显卡，GPU算力为-gencode arch=compute_70,code=[sm_70,compute_70]，设置setup.py中的编译参数即可解决。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
如何解决“在IOS系统里打开ModelArts的Notebook，字体显示异常”的问题？ - AI开发平台ModelArts

的Notebook，字体显示异常”的问题？问题现象在IOS系统里打开ModelArts的Notebook时，字体显示异常。解决方法设置Terminal的“fontFamily”为“Menlo”。操作步骤登录ModelArts管理控制台，选择“开发空间>Notebook”。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 环境配置相关
在Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

昇腾多卡训练任务是多进程多卡模式，跑几卡需要起几个python进程。昇腾底层会读取环境变量：RANK_TABLE_FILE，开发环境已经设置，用户无需关注。比如跑八卡，可以如下片段代码： export RANK_SIZE=8 current_exec_path=$(pwd)

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
日志提示“UnboundLocalError: local variable 'epoch'” - AI开发平台ModelArts

录为“obs://my_bucket/train_url”，则设置参数“checkpoint_url=obs://my_bucket/train_url/last.pt”，并设置参数epochs=80（如果第二次设置参数epochs=30则增量训练只会训练29个epochs）。父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
日志提示“no socket interface found” - AI开发平台ModelArts

原因分析可能原因如下：原因1：未设置环境变量NCCL_IB_TC、NCCL_IB_GID_INDEX、NCCL_IB_TIMEOUT，因此会导致通信速度慢且不稳定，最后造成IB通信断连，偶发上述现象。原因2：NCCL_SOCKET_IFNAME设置错误。当用户的NCCL版本低于2

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
PyCharm ToolKit工具中Edit Credential时，出现错误 - AI开发平台ModelArts

在本地PC的hosts文件中配置域名和IP地址的对应关系。三、网络代理设置如果用户使用的网络有代理设置要求，请检查代理配置是否正确。也可以使用手机热点网络连接进行测试排查。检查代理配置是否正确。图2 PyCharm网络代理设置四、AK/SK不正确获取到的AK/SK信息不正确，请确认

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > PyCharm Toolkit使用
配置授权 - AI开发平台ModelArts
配置授权 - AI开发平台ModelArts

配置ModelArts授权。若没有授权，ModelArts训练管理、开发环境、数据管理、在线服务等功能将不能正常使用。该API支持管理员给IAM子用户设置委托，支持设置当前用户的访问密钥。调用该API需要在IAM系统里配置Security Administrator权限。调试您可以在API Ex

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

8中会出现的情况，该日志是Info级别的，并不是错误信息，可以通过设置环境变量来屏蔽INFO级别的日志信息。环境变量的设置一定要在import tensorflow或者import moxing之前。处理方法您需要通过在代码中设置环境变量“TF_CPP_MIN_LOG_LEVEL”来屏

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
在Dify中配置支持Function Calling的模型使用 - AI开发平台ModelArts

calling 设置为“Tool Call”。在Dify中创建Agent进行编配，在右上角单击“Agent 设置”，选择上一步配置好的模型进行使用。在Agent设置中可以看到Dify已自动将Agent Mode切换到了Function Calling模式。图1 Agent设置在“编

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 通过Function Calling扩展大语言模型交互能力
在JupyterLab中创建定时任务 - AI开发平台ModelArts

功能亮点一键运行：允许用户一键运行Notebook文件，无需逐个执行Cell。定时任务调度：允许用户设置定时执行代码块的时间和频率。支持秒、分钟、小时和每天/每周/月的时间设置。支持参数化执行：允许用户在运行时向Notebook传递参数，使得Notebook能根据不同需求调整行为。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
VS Code自动升级后，导致远程连接时间过长 - AI开发平台ModelArts

r。解决方法禁止VS Code自动升级。单击左下角选择Settings项，搜索Update: Mode，将其设置为none。图1 打开Settings 图2 设置“Update: Mode”为“none” 父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

run”中，修改“log_dir”参数，并新增“checkpoint_path”参数。其中“log_dir”参数建议设置为一个新的目录，“checkpoint_path”参数设置为上一次训练结果输出路径，如果是OBS目录，路径填写时建议使用“obs://”开头。如果标注数据中的标签发生了变化，在运行“mox

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询

总条数： 767

上一页
1
2
3
4
5
...
39
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Msprobe精度比对 - AI开发平台ModelArts

基于ModelArts performance advisor插件的昇腾PyTorch性能调优步骤 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

创建可视化作业 - AI开发平台ModelArts

自动学习训练作业失败 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

如何解决“在IOS系统里打开ModelArts的Notebook，字体显示异常”的问题？ - AI开发平台ModelArts

在Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

日志提示“UnboundLocalError: local variable 'epoch'” - AI开发平台ModelArts

日志提示“no socket interface found” - AI开发平台ModelArts

PyCharm ToolKit工具中Edit Credential时，出现错误 - AI开发平台ModelArts

配置授权 - AI开发平台ModelArts

TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

在Dify中配置支持Function Calling的模型使用 - AI开发平台ModelArts

在JupyterLab中创建定时任务 - AI开发平台ModelArts

VS Code自动升级后，导致远程连接时间过长 - AI开发平台ModelArts

使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线