搜索_华为云

查询作业资源规格 - AI开发平台ModelArts

调用失败时的错误码，具体请参见错误码。调用成功时无此字段。 spec_total_count Integer 作业资源规格总数。 specs specs结构数组资源规格参数列表，如表4所示。表4 specs属性列表说明参数参数类型说明 spec_id Long 资源规格的ID。 core

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 资源和引擎规格接口
在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

在使用ModelArts进行自定义深度学习训练时，训练数据通常存储在对象存储服务（OBS）中，且训练数据较大时（如200GB以上），每次都需要使用GPU资源池进行训练，且训练效率低。希望提升训练效率，同时减少与对象存储OBS的交互。可通过如下方式进行调整优化。优化原理对于Mo

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
查询专属资源池列表 - AI开发平台ModelArts

object 集群节点配置。 allocatable_cpu_cores Float 可使用的CPU核数。 product_id String 产品ID，仅当集群为包周期类型时返回。 allocatable_gpus Float 可使用的GPU核数。 order_id String 购买产品

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

适当降低该值可以减少采样时间。 top_p 否 1.0 Float 控制要考虑的前几个tokens的累积概率的浮点数。必须在 (0, 1] 范围内。设置为1表示考虑所有tokens。 temperature 否 1.0 Float 控制采样的随机性的浮点数。较低的值使模型更加确定性，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
停止计费 - AI开发平台ModelArts
停止计费 - AI开发平台ModelArts

Notebook：删除Notebook实例。删除存储到OBS中的数据及OBS桶。停止Notebook实例时，EVS还会持续计费。如果要停止计费，需删除Notebook实例。训练作业：停止训练作业。删除存储到OBS中的数据及OBS桶。在线服务：停止在线服务。删除存储到OBS中的数据及OBS桶。

帮助中心 > AI开发平台ModelArts > 计费说明
部署推理服务 - AI开发平台ModelArts

适当降低该值可以减少采样时间。 top_p 否 1.0 Float 控制要考虑的前几个tokens的累积概率的浮点数。必须在 (0, 1] 范围内。设置为1表示考虑所有tokens。 temperature 否 1.0 Float 控制采样的随机性的浮点数。较低的值使模型更加确定性，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
使用kv-cache-int8量化 - AI开发平台ModelArts

抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。当前社区vllm只支持float8的kv_cache量化，抽取脚本中dtype类型是"float8_e4m3fn"。dtype类型不影响int8的scale系数的抽取和加载。启动kv-cache-int8-per-tensor量化服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
ModelArts的API或SDK支持模型下载到本地吗？ - AI开发平台ModelArts

ModelArts的API或SDK支持模型下载到本地吗？ ModelArts的API和SDK不支持模型下载到本地，但训练作业输出的模型是存放在对象存储服务（OBS）里面的，您可以通过OBS的API或SDK下载存储在OBS中的文件，具体请参见从OBS下载文件。父主题： API/SDK

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
查询模型对象列表 - AI开发平台ModelArts

total_count Integer 不分页的情况下，符合查询条件的总模型数量。 count Integer 模型数量。 models model结构数组模型元数据信息。表3 model结构参数参数类型描述 model_id String 模型ID。 model_name String

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
发布Workflow到AI Gallery - AI开发平台ModelArts

发布Workflow到AI Gallery Workflow支持发布到AI Gallery，分享给其他用户使用，执行如下代码即可完成发布。 workflow.release_to_gallery() 发布完成后可前往gallery查看相应的资产信息，资产权限默认为private，可在资产的console页面自行修改。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
推理专属预置镜像列表 - AI开发平台ModelArts

libgoogle-glog-dev liblmdb-dev libatlas-base-dev librdmacm1 libcap2-bin libpq-dev mysql-common net-tools nginx openslide-tools openssh-client openssh-server

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
kv-cache-int8量化 - AI开发平台ModelArts

抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。当前社区vllm只支持float8的kv_cache量化，抽取脚本中dtype类型是"float8_e4m3fn"。dtype类型不影响int8的scale系数的抽取和加载。启动kv-cache-int8-per-tensor量化服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
advisor调优总体步骤 - AI开发平台ModelArts

准确采集性能劣化时刻的profiling数据。存储profiling数据。创建advisor分析环境。操作步骤明确性能问题类型，准确采集性能劣化时刻的profiling数据。对于固定step出现性能劣化，如固定在16步出现性能劣化，则需要合理配置profiling参数，确保能采集到16步的数据。对

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
使用Advisor工具分析生成调优建议 - AI开发平台ModelArts

torch_npu.npu.set_compile_mode(jit_compile=False) AICPU算子调优，Double类型输入切换成为Float减少cast算子调用耗时，修改diffusion/gaussian_diffusion.py (修改点：注释第871行，增加第872行)。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 性能调优
获取Workflow工作流列表 - AI开发平台ModelArts

描述 total Integer 查询到当前用户名下的所有Workflow总数。 count Integer 查询到当前用户名下的所有符合查询条件的Workflow总数。 items Array of Workflow objects 查询到当前用户名下的所有符合查询条件的Workflow详情。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
部署推理服务 - AI开发平台ModelArts

适当降低该值可以减少采样时间。 top_p 否 1.0 Float 控制要考虑的前几个tokens的累积概率的浮点数。必须在 (0, 1] 范围内。设置为1表示考虑所有tokens。 temperature 否 1.0 Float 控制采样的随机性的浮点数。较低的值使模型更加确定性，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
业务代码问题 - AI开发平台ModelArts

None))' is an invalid key” 日志报错“DataFrame.dtypes for data must be int, float or bool” 日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” 日志提示“Out of bounds nanosecond

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
启动推理服务 - AI开发平台ModelArts

适当降低该值可以减少采样时间。 top_p 否 1.0 Float 控制要考虑的前几个tokens的累积概率的浮点数。必须在 (0，1] 范围内。设置为1表示考虑所有tokens。 temperature 否 1.0 Float 控制采样的随机性的浮点数。较低的值使模型更加确定性，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
通过patch操作对服务进行更新 - AI开发平台ModelArts

user id。 X-Auth-Token 是 String 用户token。表3 请求Body参数参数是否必选参数类型描述 [数组元素] 是 Array of PatchServiceV2RequestBody objects 服务PATCH操作请求体。表4 Pat

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询训练作业参数详情 - AI开发平台ModelArts

volumes属性列表参数参数类型说明 nfs Object 共享文件系统类型的存储卷。仅支持运行于已联通共享文件系统网络的资源池的训练作业。具体请参见表6。 host_path Object 主机文件系统类型的存储卷。仅支持运行于专属资源池中的训练作业。具体请参见表7。表6 nfs属性列表

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置

总条数： 1089

上一页
1
...
6
7
8
...
55
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询作业资源规格 - AI开发平台ModelArts

在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

查询专属资源池列表 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

停止计费 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

ModelArts的API或SDK支持模型下载到本地吗？ - AI开发平台ModelArts

查询模型对象列表 - AI开发平台ModelArts

发布Workflow到AI Gallery - AI开发平台ModelArts

推理专属预置镜像列表 - AI开发平台ModelArts

kv-cache-int8量化 - AI开发平台ModelArts

advisor调优总体步骤 - AI开发平台ModelArts

使用Advisor工具分析生成调优建议 - AI开发平台ModelArts

获取Workflow工作流列表 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

业务代码问题 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

通过patch操作对服务进行更新 - AI开发平台ModelArts

查询训练作业参数详情 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线