搜索_华为云

入门案例：快速创建一个物体检测的数据集 - AI开发平台ModelArts

OBS目录中的文件创建训练作业。如果选择通过数据集作为训练作业的数据源，则需要指定数据集及特定的版本。因此，用户需要为准备好的数据发布一个版本，具体操作参考发布ModelArts数据集中的数据版本。为了便于后期的模型构建和开发，对同一数据源来说，将其不同时间对数据的处理和标注按

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
在推理生产环境中部署推理服务 - AI开发平台ModelArts

开启图模式后，服务第一次响应请求时会有一个较长时间的图编译过程，并且会在当前目录下生成.torchair_cache文件夹来保存图编译的缓存文件。当服务第二次启动时，可通过缓存文件来快速完成图编译的过程，避免长时间的等待，并且基于图编译缓存文件来启动服务可获得更优的推理性能，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
创建AI应用 - AI开发平台ModelArts

执行代码、模型需先上传至OBS（训练作业生成的模型已默认存储到OBS）。接口约束使用模板导入模型与不使用模板导入这两类导入方式的Body参数要求不一样。以下Body参数说明中以模板参数表示适合使用模板导入模型时填写的参数，非模板参数表示适合不使用模板导入时填写的参数，公共参数表示与导入方式无关的参数。使用

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

控制等功能，可以帮助您安全的控制云服务资源的访问。如果华为账号已经能满足您的要求，不需要通过IAM对用户进行权限管理，您可以跳过本章节，不影响您使用ModelArts服务的其他功能。 IAM是提供权限管理的基础服务，无需付费即可使用，您只需要为您账号中的资源进行付费。通过IAM

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
查询模型对象列表 - AI开发平台ModelArts

]，列表中元素model_instance对象即为本章节描述的模型管理，可调用模型接口。支持按照检索参数查询模型列表，返回满足检索条件的模型list，检索参数如表1所示。在查询列表时，返回list的同时，会打印模型列表的详细信息，如表2和表3所示。当前支持最大获取150个模型对象。

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
数据管理计费项 - AI开发平台ModelArts

创建数据清洗、数据校验、数据选择和数据增强的数据处理任务时，不收费。但是存储到OBS中的数据会收取费用。具体内容如表1所示。表1 存储计费项计费项计费项说明适用的计费模式计费公式存储资源对象存储OBS 用于存储训练和推理的输入数据和输出结果数据。具体费用可参见对象存储价格详情。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
创建自动模型优化的训练作业 - AI开发平台ModelArts

设置自动化搜索参数从已设置的“超参”中选择可用于搜索优化的超参。优化的超参仅支持float类型，选中自动化搜索参数后，需设置取值范围。搜索算法配置 ModelArts内置三种超参搜索算法，用户可以根据实际情况选择对应的算法，支持多选。对应的算法和参数解析请参考以下： ba

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 自动模型优化（AutoSearch）
推理精度测试 - AI开发平台ModelArts

service_url：成功部署推理服务后的服务预测地址，示例：http://${docker_ip}:8080/generate。此处的${docker_ip}替换为宿主机实际的IP地址，端口号8080来自前面配置的服务端口。 few_shot：开启少量样本测试后添加示例样本的个数。默认为3，取值范围为0~5整数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
ModelArts权限管理基本概念 - AI开发平台ModelArts

如无特殊情况，建议优先使用严格授权模式。在严格授权模式下，子账号要使用ModelArts的功能都需经过授权，可以更精确的控制子账号的权限范围，达成权限最小化的安全策略。用工作空间限制资源访问工作空间是ModelArts面向企业用户提供的一个高阶功能，用于进一步将用户的资源划分在多个逻辑隔离的空间中，并支持以空

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理
扩缩容Lite Cluster资源池 - AI开发平台ModelArts

修改驱动版本。在“驱动版本”下拉列表中指定驱动版本。指定节点计费模式。用户增加节点数量时，可以打开“节点计费模式”开关，为资源池新扩容的节点设置不同于资源池的计费模式、购买时长和开启自动续费功能。例如用户可以在包周期的资源池中创建按需的节点。如果用户不指定该参数，则新扩容的节点计费模式和资源池保持一致。单击“提交

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
查询训练作业列表 - AI开发平台ModelArts

total Integer 查询到当前用户名下的所有作业总数。 count Integer 查询到当前用户名下的所有符合查询条件的作业总数。 limit Integer 查询作业的限制量。最小为1，最大为50。 offset Integer 查询作业的偏移量，最小为0。例如设置为1，则表示从第二条开始查。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
在推理生产环境中部署推理服务 - AI开发平台ModelArts

开启图模式后，服务第一次响应请求时会有一个较长时间的图编译过程，并且会在当前目录下生成.torchair_cache文件夹来保存图编译的缓存文件。当服务第二次启动时，可通过缓存文件来快速完成图编译的过程，避免长时间的等待，并且基于图编译缓存文件来启动服务可获得更优的推理性能，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
创建节点池 - AI开发平台ModelArts

String 用户在运营平台选择的折扣信息。 os.modelarts/service.console.url 否 String 订购订单支付完成后跳转的url地址。 os.modelarts/order.id 否 String 订单id，包周期资源创建或者计费模式变更的时候该参数必需。表5

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
查询数据集导出任务的状态 - AI开发平台ModelArts

strings 导出的样本ID列表。 search_conditions Array of SearchCondition objects 导出的筛选条件，多个条件之间是或(OR)关系。 train_sample_ratio String 指定发布版本时训练集-验证集的切分比例，默认为1

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询数据集的版本列表 - AI开发平台ModelArts

数据集版本名称。 with_column_header Boolean 发布的CSV文件的第一行是否为列名，对于表格数据集有效。可选值如下： true：发布的CSV文件的第一行是列名 false：发布的CSV文件的第一行不是列名表5 LabelStats 参数参数类型描述 attributes

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询数据处理任务版本的结果展示 - AI开发平台ModelArts

signed_new_source String 签名后的处理后样本地址。 signed_origin_source String 签名后的原样本地址。 version_id String 数据处理任务的版本ID。请求示例查询数据处理任务版本的结果展示 GET https://{endpoint}/

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
非分离部署推理服务 - AI开发平台ModelArts

开启图模式后，服务第一次响应请求时会有一个较长时间的图编译过程，并且会在当前目录下生成.torchair_cache文件夹来保存图编译的缓存文件。当服务第二次启动时，可通过缓存文件来快速完成图编译的过程，避免长时间的等待，并且基于图编译缓存文件来启动服务可获得更优的推理性能，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

动态分档模型转换（可选）如果迁移的模型有多个shape档位的需求，可以通过如下方式对模型进行分档转换。动态分档是指将模型输入的某一维或者某几维设置为“动态”可变，但是需要提前设置可变维度的“档位”范围。即转换得到的模型能够在指定的动态轴上使用预设的几种shape（保证模型支持的shape），相

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
模型的自定义镜像制作流程 - AI开发平台ModelArts

甚至会有服务业务中断的风险，预测请求时延超过60s时，建议制作异步请求模式的模型。自定义镜像的配置规范镜像对外接口设置镜像的对外服务接口，推理接口需与config.json文件中apis定义的url一致，当镜像启动时可以直接访问。下面是mnist镜像的访问示例，该镜像内含m

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

设置动态分档位后，在PTA模式下不支持接收超过最大档的并发请求，超过后会导致推理服务终止。请将最大档（PTA_TORCHAIR_DECODE_GEAR_LIST参数的中设置的最大值）与模型启动时的max-num-seqs保持一致来进行规避。在MoE模型上推荐使用图模式部署，包括mixt

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）

总条数： 1632

上一页
1
...
7
8
9
...
82
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

入门案例：快速创建一个物体检测的数据集 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

查询模型对象列表 - AI开发平台ModelArts

数据管理计费项 - AI开发平台ModelArts

创建自动模型优化的训练作业 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

ModelArts权限管理基本概念 - AI开发平台ModelArts

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

创建节点池 - AI开发平台ModelArts

查询数据集导出任务的状态 - AI开发平台ModelArts

查询数据集的版本列表 - AI开发平台ModelArts

查询数据处理任务版本的结果展示 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

模型的自定义镜像制作流程 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线