搜索_华为云

使用SmoothQuant量化 - AI开发平台ModelArts

定为0.5，后续可以根据推理效果进行调整。 --per-token：激活值量化方法，如果指定则为per-token粒度量化，否则为per-tensor粒度量化。 --per-channel：权重量化方法，如果指定则为per-channel粒度量化，否则为per-tensor粒度量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

定为0.5，后续可以根据推理效果进行调整。 --per-token：激活值量化方法，若指定则为per-token粒度量化，否则为per-tensor粒度量化。 --per-channel：权重量化方法，若指定则为per-channel粒度量化，否则为per-tensor粒度量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
日志提示“Out of bounds nanosecond timestamp” - AI开发平台ModelArts

nanosecond timestamp: 1-01-02 13:20:00 原因分析出现该问题的可能原因如下：时间值越界，请参考官方文档。处理方法校验时间数据，pandas以纳秒表示时间戳。最小时间：1677-09-22 00:12:43.145225 最大时间：2262-04-11

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

model stream execute failed] 原因分析出现该问题的可能原因如下：数据读入的速度跟不上模型迭代的速度。处理方法减少预处理shuffle操作。 dataset = dataset.shuffle(buffer_size=x) 关闭数据预处理开关，可能会影响性能。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
创建新版Notebook无法使用已购买的专属资源池，如何解决？ - AI开发平台ModelArts

提示当前专属资源池未初始化开发环境，请到专属资源池页面初始化开发环境。原因分析新购买的专属资源池，需要初始化环境才能用于创建Notebook。解决方法请到专属资源池页面初始化开发环境。进入“专属资源池”页面，单击目标资源池“操作”列的“更多 > 设置作业类型”。在“设置作业类型”页

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 其他故障
创建AI应用失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

完成构建任务，构建超时中断，即会出现“Model image build task timed out”提示，不显示详细的构建日志。处理方法预先准备需要编译下载的依赖包，减少依赖包下载和编译的时间。可通过线下wheel包方式安装运行环境依赖。线下wheel包安装，需确保wheel包与模型文件放在同一目录。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
配置仪表盘查看指标数据 - AI开发平台ModelArts

s-sdk.obs.cn-north-4.myhuaweicloud.com/metrics/grafana/dashboards/ModelArts-Cluster-View.json 节点视图 https://cnnorth4-modelarts-sdk.obs.cn-north-4

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
修改工作空间 - AI开发平台ModelArts

参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workspace_id 是 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
修改工作空间配额 - AI开发平台ModelArts

参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workspace_id 是 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
认证鉴权 - AI开发平台ModelArts
认证鉴权 - AI开发平台ModelArts

修改。使用AK/SK认证时，您可以基于签名算法使用AK/SK对请求进行签名，也可以使用专门的签名SDK对请求进行签名。详细的签名方法和SDK使用方法请参见API签名指南。签名SDK只提供签名功能，与服务提供的SDK不同，使用时请注意。父主题：如何调用API

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
如何关闭Mox的warmup - AI开发平台ModelArts

训练。原因分析 Tensorflow分布式有多种执行模式，mox会通过4次执行50 step记录执行时间，选择执行时间最少的模型。处理方法创建训练作业时，在“运行参数”中增加参数“variable_update=parameter_server”来关闭Mox的warmup。

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

does not exist. The operation, 'images', does not exist in the graph。处理方法如果切分了数据集，需要删除推理代码中“Yolov3Service”类中的如下代码： self.model_inputs = {'images':

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
删除Workflow工作流 - AI开发平台ModelArts

s/{workflow_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是 String 工作流的ID。请求参数无响应参数无请求示例删除Workflow工作流

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
Notebook运行代码报错，在'/tmp'中到不到文件 - AI开发平台ModelArts

'home/ma-user/work/SR/RDN_train_base'] 图1 运行代码报错原因分析根据报错提示，需要排查是否将大量数据被保存在“/tmp”中。处理方法进入到“Terminal”界面。在“/tmp”目录下，执行命令du -sh *，查看该目录下的空间占用情况。 sh-4.3$cd /tmp

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

in a non-contiguous input. 原因分析出现该问题的可能原因如下：数据输入不连续，cuDNN不支持的类型。处理方法禁用cuDNN，在训练前加入如下代码。 torch.backends.cudnn.enabled = False 将输入数据转换成contiguous。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
服务部署、启动、升级和修改时，容器健康检查失败如何处理？ - AI开发平台ModelArts

原因分析容器提供的健康检查接口调用失败。容器健康检查接口调用失败，原因可能有两种：镜像健康检查配置问题 AI应用健康检查配置问题解决方法根据容器日志进行排查，查看健康检查接口失败的具体原因。镜像健康检查配置问题，需修复代码后重新制作镜像创建AI应用后部署服务。了解镜像健

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
MXNet创建kvstore时程序被阻塞，无报错 - AI开发平台ModelArts

kv.create('dist_async') print('end') 原因分析 worker阻塞的原因可能是连不上server。处理方法将如下代码放在“启动文件”里“import mxnet”之前可以看到节点间相互通信状态，同时ps能够重新发送。 import os os

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
删除算法 - AI开发平台ModelArts
删除算法 - AI开发平台ModelArts

/{algorithm_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 algorithm_id 是 String 算法ID。请求参数无响应参数无请求示例如下以修改uui

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
删除数据集 - AI开发平台ModelArts

是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数无请求示例删除数据集 DELETE https://{endpoint}/v2/{

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

/user/config/jobstart_hccl.json 多卡训练时，需要依赖“rank_table_file”做卡间通信的配置文件，该文件自动生成，pod启动之后文件地址。为“/user/config/jobstart_hccl.json”，“/user/config/jobstart_hccl

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用

总条数： 1739

上一页
1
...
71
72
73
...
87
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

日志提示“Out of bounds nanosecond timestamp” - AI开发平台ModelArts

MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

创建新版Notebook无法使用已购买的专属资源池，如何解决？ - AI开发平台ModelArts

创建AI应用失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

配置仪表盘查看指标数据 - AI开发平台ModelArts

修改工作空间 - AI开发平台ModelArts

修改工作空间配额 - AI开发平台ModelArts

认证鉴权 - AI开发平台ModelArts

如何关闭Mox的warmup - AI开发平台ModelArts

使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

删除Workflow工作流 - AI开发平台ModelArts

Notebook运行代码报错，在'/tmp'中到不到文件 - AI开发平台ModelArts

日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

服务部署、启动、升级和修改时，容器健康检查失败如何处理？ - AI开发平台ModelArts

MXNet创建kvstore时程序被阻塞，无报错 - AI开发平台ModelArts

删除算法 - AI开发平台ModelArts

删除数据集 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线