搜索_华为云

查询服务详情 - AI开发平台ModelArts

必须大于0，不配置默认值为1。当小于1时，代表滚动升级时增加的实例数的百分比；当大于1时，代表滚动升级时最大扩容的实例数。 max_unavailable Float 必须大于0，不配置默认值为0。当小于1时，代表滚动升级时允许缩容的实例数的百分比；当大于1时，代表滚动升级时允许缩容的实例数。 terminati

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
服务管理权限 - AI开发平台ModelArts

/v1/{project_id}/services/{service_id} modelarts:service:update - √ √ 删除模型服务 DELETE /v1/{project_id}/services/{service_id} modelarts:service:delete - √ √ 启动停止服务

 帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
非分离部署推理服务 - AI开发平台ModelArts

开启图模式后，服务第一次响应请求时会有一个较长时间的图编译过程，并且会在当前目录下生成.torchair_cache文件夹来保存图编译的缓存文件。当服务第二次启动时，可通过缓存文件来快速完成图编译的过程，避免长时间的等待，并且基于图编译缓存文件来启动服务可获得更优的推理性能，因此请在有图编译缓存文件的前提下启动服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
非分离部署推理服务 - AI开发平台ModelArts

开启图模式后，服务第一次响应请求时会有一个较长时间的图编译过程，并且会在当前目录下生成.torchair_cache文件夹来保存图编译的缓存文件。当服务第二次启动时，可通过缓存文件来快速完成图编译的过程，避免长时间的等待，并且基于图编译缓存文件来启动服务可获得更优的推理性能，因此请在有图编译缓存文件的前提下启动服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

/etc/profile # 注意这里的echo 要使用单引号，单引号会原样输出，双引号会解析变量 source /etc/profile # 使刚才配置生效创建buildkitd的启动服务。其中都是buildkitd.service的内容。复制以下全部命令并运行即可。 cat

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
查询服务日志 - AI开发平台ModelArts

Predictor(session, service_id="your_service_id") predictor_log = predictor_instance.get_service_logs() print(predictor_log) 方式2：根据查询服务对象列表返回的服务对象进行查询服务日志

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
查询服务监控信息 - AI开发平台ModelArts

用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。响应参数状态码：200 表4 响应Body参数参数参数类型描述 service_name String 服务名称。 service_id String 服务ID。 monitors Array of

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询服务更新日志 - AI开发平台ModelArts

必须大于0，不配置默认值为1。当小于1时，代表滚动升级时增加的实例数的百分比；当大于1时，代表滚动升级时最大扩容的实例数。 max_unavailable Float 必须大于0，不配置默认值为0。当小于1时，代表滚动升级时允许缩容的实例数的百分比；当大于1时，代表滚动升级时允许缩容的实例数。 terminati

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

个组织。创建组织的详细操作请参见创建组织。同一个组织内的用户可以共享使用该组织内的所有镜像。镜像会以快照的形式保存，保存过程约5分钟，请耐心等待。此时不可再操作实例（对于打开的JupyterLab界面和本地IDE仍可操作）。快照中耗费的时间仍占用实例的总运行时长，如果在快照

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

/etc/profile # 注意这里的echo 要使用单引号，单引号会原样输出，双引号会解析变量 source /etc/profile # 使刚才配置生效创建buildkitd的启动服务。其中都是buildkitd.service的内容。复制以下全部命令并运行即可。 cat

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 准备工作
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

top_k 否 -1 Int 控制要考虑的前几个tokens的数量的整数。设置为-1表示考虑所有tokens。适当降低该值可以减少采样时间。 top_p 否 1.0 Float 控制要考虑的前几个tokens的累积概率的浮点数。必须在 (0, 1] 范围内。设置为1表示考虑所有tokens。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
Standard资源池节点故障定位 - AI开发平台ModelArts

通过nvidia-smi -a查询到存在Pending Page Blacklist为Yes的记录，或多比特Register File大于0。对于Ampere架构的GPU，存在以下场景：存在不可纠正的SRAM错误。存在Remapping Failure记录。 dmsg中存在Xid 95事件。

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Optimization)：是一种在强化学习中广泛使用的策略优化算法。它属于策略梯度方法的一种，旨在通过限制新策略和旧策略之间的差异来稳定训练过程。PPO通过引入一个称为“近端策略优化”的技巧来避免过大的策略更新，从而减少了训练过程中的不稳定性和样本复杂性。指令监督式微调(Self-training

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
查询服务监控信息 - AI开发平台ModelArts

predictor_instance.get_service_monitor() print(predictor_monitor) 参数说明表1 get_service_monitor返回参数说明参数参数类型描述 service_id String 服务ID。 service_name String

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
重试/停止/运行Workflow节点 - AI开发平台ModelArts

动工作流。在当前节点的运行状况页面，单击“重试”。在重试之前您也可以前往权限管理页面修改配置，节点重试启动后新修改的配置信息可以在当前执行中立即生效。停止单击指定节点查看详情，可以对运行中的节点进行停止操作。继续运行对于单个节点中设置了需要运行中配置的参数时，节点运行会处

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
构建条件节点控制分支执行 - AI开发平台ModelArts

if_then_steps表示的是当Condition比较的结果为true时允许执行的节点列表，存储的是节点名称；此时else_then_steps中的step跳过不执行。 else_then_step表示的是当Condition比较的结果为false时允许执行的节点列表，存储的是节点名称；此时

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

开启图模式后，服务第一次响应请求时会有一个较长时间的图编译过程，并且会在当前目录下生成.torchair_cache文件夹来保存图编译的缓存文件。当服务第二次启动时，可通过缓存文件来快速完成图编译的过程，避免长时间的等待，并且基于图编译缓存文件来启动服务可获得更优的推理性能，因此请在有图编译缓存文件的前提下启动服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
管理Workflow Execution - AI开发平台ModelArts

String Workflow工作流配置参数的描述。 example 否 Object Workflow工作流配置参数的样例。 delay 否 Boolean 是否为延迟输入的参数，默认为否。 default 否 Object 配置参数的默认值。 value 否 Object 参数值。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
使用Msprobe工具分析偏差 - AI开发平台ModelArts

__mul__.2在forward计算阶段的第一个input存在偏差。追溯代码实现是下图中noise变量使用torch.rand_like ()作noise变量的初始化 (下图第730行)。由于torch.rand_like()该函数会根据输入的input构造同样size、dtype

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 精度对齐
查询数据处理任务的版本详情 - AI开发平台ModelArts

处理后删除的图片数量。 description String 数据处理任务的版本描述。 duration_seconds Integer 数据处理任务的运行时间，单位秒。 inputs Array of ProcessorDataSource objects 数据处理任务的输入通道。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 2313

上一页
1
...
6
7
8
...
116
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询服务详情 - AI开发平台ModelArts

服务管理权限 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

查询服务日志 - AI开发平台ModelArts

查询服务监控信息 - AI开发平台ModelArts

查询服务更新日志 - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

查询服务监控信息 - AI开发平台ModelArts

重试/停止/运行Workflow节点 - AI开发平台ModelArts

构建条件节点控制分支执行 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

管理Workflow Execution - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

查询数据处理任务的版本详情 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线