搜索_华为云

Msprobe梯度监控 - AI开发平台ModelArts

将两份梯度数据进行相似度对比。在有标杆问题中，可以确认训练过程中精度问题出现的Step，以及抓取反向过程中的问题。使用步骤如下：通过pip安装msprobe工具。 # shell pip install mindstudio-probe 创建配置文件config.json。 { "task": "grad_probe"

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优 > Msprobe工具使用指导
ModelArts最佳实践案例列表 - AI开发平台ModelArts

数字人场景样例场景说明 Wav2Lip推理基于DevServer适配PyTorch NPU推理指导 Wav2Lip训练基于DevServer适配PyTorch NPU训练指导 Wav2Lip，人脸说话视频模型，训练、推理 Wav2Lip是一种基于对抗生成网络的由语音驱动的人脸

 帮助中心 > AI开发平台ModelArts > 最佳实践
查询插件模板 - AI开发平台ModelArts

npuDriver：NPU驱动 gpuDriver：GPU驱动 ccePlugin：CCE插件 helm：Helm模板 icAgent：ICAgent工具 description String 插件模板描述。 versions Map<String,PluginTemplateVersion> 插件模板版本描述信息。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询APP的API认证信息 - AI开发平台ModelArts

String API的认证方式。枚举值如下： NONE：无认证 APP：APP认证 IAM：IAM认证 predict_url String 预测地址。 service_id String 服务编号。 service_name String 服务名称。 support_app_code Boolean

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
创建Workflow数据集节点 - AI开发平台ModelArts

数据集创建相关的配置信息。是 DatasetProperties title title信息，主要用于前端的名称展示。否 str description 数据集创建节点的描述信息。否 str policy 节点执行的policy。否 StepPolicy depend_steps

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
修复Standard专属资源池故障节点 - AI开发平台ModelArts

Standard专属资源池支持对故障节点进行修复操作，目前提供了替换节点、高可用冗余节点、重置节点和重启节点等方式。华为云技术支持在故障定位和性能诊断时，部分运维操作需要用户授权才可进行，本章节同时也介绍了如何进行授权操作。故障节点处理方式替换节点：替换节点后，节点名称会发生变化。原有节点会被释放掉。在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
镜像保存时报错“BuildImage,True,Commit successfully|PushImage,False,Task is running.” - AI开发平台ModelArts

镜像过大Push任务一直在运行，或实例节点有问题。解决方法以对应租户的华为云账号登录SWR服务，查看镜像是否已经Push成功。如果Push成功，请重新注册镜像。如果未Push成功，联系SRE查看对应实例的节点是否有问题。父主题：自定义镜像故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
是否支持Keras引擎？ - AI开发平台ModelArts

镜像选择“TensorFlow-1.13”或“TensorFlow-1.15”。打开Notebook，在JupyterLab中执行!pip list查看Keras的版本。图1 查看Keras引擎版本父主题：规格限制

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 规格限制
查询AI应用列表 - AI开发平台ModelArts

published：已发布 failed：发布失败 building：构建镜像中 building_failed：构建失败 description 否 String 描述信息，可支持模糊匹配。 offset 否 Integer 指定要查询页的索引，默认为“0”。 limit 否

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
执行训练任务 - AI开发平台ModelArts

可修改。指定梯度累积的步数，这可以增加批次大小而不增加内存消耗。可根据自己要求适配。取值可参考表1中梯度累积值列。 num_train_epochs 5 表示训练轮次，根据实际需要修改。一个Epoch是将所有训练样本训练一次的过程。可根据自己要求适配 cutoff_len 4096 文本处理时的最大长度，此处为4096，用户可根据自己要求适配

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911）
保存镜像时报错“too many layers in your image”如何解决？ - AI开发平台ModelArts

many layers in your image”。原因分析用户创建Notebook时所选用的镜像是经过多次保存的自定义镜像或用户自行注册的镜像，基于该镜像所创建的Notebook已经无法再执行镜像保存的操作了。解决方法使用公共镜像或其他的自定义镜像来创建Notebook，完成镜像保存操作。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
新建Workflow Execution - AI开发平台ModelArts

String 创建时间。 name 否 String 执行记录名称。 execution_id 否 String 工作流执行ID。 description 否 String 执行记录描述。 status 否 String 执行记录状态。 workspace_id 否 String 工作空间ID。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
推理场景介绍 - AI开发平台ModelArts

具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化是否支持W8A8量化是否支持W8A16量化是否支持 kv-cache-int8量化开源权重获取地址 1 llama-7b √ √ √ √ √ https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
管理Workflow StepExecution - AI开发平台ModelArts

停止 continue 继续 data_requirements 否 Array of DataRequirement objects 工作流需要的数据。 parameters 否 Array of WorkflowParameter objects 参数。表3 DataRequirement

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
执行训练任务 - AI开发平台ModelArts

可修改。指定梯度累积的步数，这可以增加批次大小而不增加内存消耗。可根据自己要求适配。取值可参考表1中梯度累积值列。 num_train_epochs 5 表示训练轮次，根据实际需要修改。一个Epoch是将所有训练样本训练一次的过程。可根据自己要求适配 cutoff_len 4096 文本处理时的最大长度，此处为4096，用户可根据自己要求适配

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
查询模型列表 - AI开发平台ModelArts

model_status 否 String 模型状态，可根据模型的“publishing”、“published”、“failed”三种状态执行查询。 description 否 String 描述信息，可支持模糊匹配。 offset 否 Integer 指定要查询页的索引，默认为“0”。 limit 否

 帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
查询数据集的版本列表 - AI开发平台ModelArts

Integer 已删除的样本数量。 deletion_stats Map<String,Integer> 删除原因统计信息。 description String 版本描述信息。 export_images Boolean 发布时是否导出图片到版本输出目录。可选值如下： true：导出图片到版本输出目录

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询训练作业镜像保存任务 - AI开发平台ModelArts

镜像所属组织，可以在SWR控制台“组织管理”创建和查看。 tag String 镜像tag，长度限制64个字符，支持大小写字母、数字、中划线、下划线和点。 description String 该镜像所对应的描述信息，长度限制512个字符。 status String 镜像状态。枚举值如下： INIT：初始化。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
更新团队标注任务 - AI开发平台ModelArts

团队标注任务ID。请求参数表2 请求Body参数参数是否必选参数类型描述 dataset_id 否 String 数据集ID。 description 否 String 团队标注任务描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 task_id 否 String 团队标注任务ID。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
单模型性能测试工具Mindspore lite benchmark - AI开发平台ModelArts

否有所提升。 # shell cd /home_host/work benchmark --modelFile=diffusers/scripts/mindir_models/text_encoder.mindir --device=Ascend 上述命令中：modelFile指

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优

总条数： 1631

上一页
1
...
65
66
67
...
82
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Msprobe梯度监控 - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

查询插件模板 - AI开发平台ModelArts

查询APP的API认证信息 - AI开发平台ModelArts

创建Workflow数据集节点 - AI开发平台ModelArts

修复Standard专属资源池故障节点 - AI开发平台ModelArts

镜像保存时报错“BuildImage,True,Commit successfully|PushImage,False,Task is running.” - AI开发平台ModelArts

是否支持Keras引擎？ - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

保存镜像时报错“too many layers in your image”如何解决？ - AI开发平台ModelArts

新建Workflow Execution - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

管理Workflow StepExecution - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

查询模型列表 - AI开发平台ModelArts

查询数据集的版本列表 - AI开发平台ModelArts

查询训练作业镜像保存任务 - AI开发平台ModelArts

更新团队标注任务 - AI开发平台ModelArts

单模型性能测试工具Mindspore lite benchmark - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线