搜索_华为云

创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

支持多卡训练），对应值可选择multiple（支持）、singular（不支持）； host_distributed_mode（是否支持分布式训练），对应值可选择multiple（支持）、singular（不支持）。 values 否 Array of strings 资源约束键对应值。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询训练作业详情 - AI开发平台ModelArts

表36 flavor_info 参数参数类型描述 max_num Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。 cpu cpu object cpu规格信息。 gpu gpu object gpu规格信息。 npu npu object Ascend规格信息。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

支持多卡训练），对应值可选择multiple（支持）、singular（不支持）； host_distributed_mode（是否支持分布式训练），对应值可选择multiple（支持）、singular（不支持）。 values 否 Array of strings 资源约束键对应值。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

URL：在线服务的URL为服务详情页，调用指南页签中获取的“API接口公网地址”截取域名之后的地址部分。图1 获取URL 使用图形界面的软件、curl命令、Python语言等多种方式访问在线服务。可参考通过Token认证的方式访问在线服务。父主题：访问在线服务支持的访问通道

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

的基础上，融入了对于昇腾硬件的适配与支持。对AI有使用诉求的企业、NLP领域开发者，可以借助这个库，便捷地使用昇腾算力进行自然语言理解（NLU）和自然语言生成（NLG）任务的SOTA模型开发与应用。支持的模型结构框架 AI Gallery的Transformers库支持的开源模型结构框架如表1所示。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
精度问题概述 - AI开发平台ModelArts

精度问题的异常差异，本指南提供了算子问题定位工具集详细的使用场景和使用步骤，方便用户自行或在支持下排查可能的数值计算精度问题。当用户将大语言模型或者其他类型深度神经网络的训练从GPU迁移到昇腾AI处理器时，可能出现以下不同现象的模型精度问题。一般包括： Loss曲线与CPU/GPU差异不符合预期。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
Lite Cluster资源开通 - AI开发平台ModelArts

选择多个规格的CPU架构必须相同。例如都是X86，或者都是ARM。如果选择了多个GPU或NPU规格，由于不同规格的参数网络平面不互通，分布式训练时训练速度会受到影响。如果您要做分布式训练，建议您只选择一个GPU或NPU规格。一个资源池中，最多可添加10种规格。资源调度与切分自定义驱动默认关

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
MaaS使用场景和使用流程 - AI开发平台ModelArts

Studio大模型即服务平台的“模型广场”中选择大模型模板后，需要先创建自定义大模型，才能进行模型训练和推理，才能获得更适合特定领域或任务的大语言模型。在MaaS中创建模型 3 模型调优完成数据集的准备后，可以在ModelArts Studio大模型即服务平台开始模型调优。模型调

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
Lite Cluster资源配置流程 - AI开发平台ModelArts

5 （可选）配置镜像预热 Lite Cluster资源池支持镜像预热功能，镜像预热可实现将镜像提前在资源池节点上拉取好，在推理及大规模分布式训练时有效缩短镜像拉取时间。快速配置Lite Cluster资源案例下文提供一个快速配置的案例，配置完成后您可登录到节点查看加速卡信息

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
查询训练作业列表 - AI开发平台ModelArts

表38 flavor_info 参数参数类型描述 max_num Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。 cpu cpu object cpu规格信息。 gpu gpu object gpu规格信息。 npu npu object Ascend规格信息。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
查询算法详情 - AI开发平台ModelArts

是否支持多卡训练（device_distributed_mode），对应值可选择支持（multiple）、不支持（singular）；是否支持分布式训练（host_distributed_mode），对应值可选择支持（multiple）、不支持（singular）。 value Array

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
在MaaS中创建模型 - AI开发平台ModelArts

通义千问文本生成对话问答、智能创作、文本摘要、翻译、代码生成、数学推理中文、英文通义千问2 文本生成多语言处理、数学推理、对话问答英文通义千问2.5 文本生成多语言处理、数学推理、对话问答中文、英文 DeepseekCoder 文本生成对话问答、文本推理中文、英文

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

WebSocket客户端和服务端双向传输数据连接建立后，WebSocket使用TCP完成全双工通信。WebSocket的客户端可以往服务端发送数据，客户端有不同的实现，同一种语言也存在不同的lib包的实现，这里不考虑实现的不同种类。客户端发送的内容在协议的角度不限定格式，Postman支持Text/Json/XM

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
终止训练作业 - AI开发平台ModelArts

FlavorInfoResponse 参数参数类型描述 max_num Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。 cpu Cpu object cpu规格信息。 gpu Gpu object gpu规格信息。 npu Npu object Ascend规格信息。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询训练作业详情 - AI开发平台ModelArts

FlavorInfoResponse 参数参数类型描述 max_num Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。 cpu Cpu object cpu规格信息。 gpu Gpu object gpu规格信息。 npu Npu object Ascend规格信息。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询算法列表 - AI开发平台ModelArts

是否支持多卡训练（device_distributed_mode），对应值可选择支持（multiple）、不支持（singular）；是否支持分布式训练（host_distributed_mode），对应值可选择支持（multiple）、不支持（singular）。 value Array

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
获取训练作业事件列表 - AI开发平台ModelArts

指定返回的事件来源，取值范围为[K8S Job Task]。请求参数表3 请求Header参数参数是否必选参数类型描述 X-Language 否 String 语言。响应参数状态码： 200 表4 响应Body参数参数参数类型描述 total String 总条数。 limit String

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
训练作业卡死检测 - AI开发平台ModelArts

日志中还未出现NCCL DEBUG信息时已卡死。解决方案1 检查代码，检查是否有参数中未传入“master_ip”和“rank”参数等问题。问题现象2 分布式训练的日志中，发现有的节点含有GDR信息，而有的节点无GDR信息，导致卡死的原因可能为GDR。 # 节点A日志 modelarts-job

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
如何将Keras的.h5格式的模型导入到ModelArts中？ - AI开发平台ModelArts

如何将Keras的.h5格式的模型导入到ModelArts中？ ModelArts不支持直接导入“.h5”格式的模型。您可以先将Keras的“.h5”格式转换为TensorFlow的格式，然后再导入ModelArts中。从Keras转TensorFlow操作指导请参见其官网指导。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

oints?type=host_endpoints 方式一：图形界面的软件获取服务的IP和端口号图6 接口返回示例方式二：Python语言获取IP和端口号 Python代码如下，下述代码中以下参数需要手动修改： project_id：用户项目ID，获取方法请参见获取项目ID和名称。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署

总条数： 1181

上一页
1
...
54
55
56
...
60
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建算法 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

精度问题概述 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

MaaS使用场景和使用流程 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

查询算法详情 - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

查询算法列表 - AI开发平台ModelArts

获取训练作业事件列表 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

如何将Keras的.h5格式的模型导入到ModelArts中？ - AI开发平台ModelArts

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线