搜索_华为云

调用MaaS部署的模型服务 - AI开发平台ModelArts

Int 返回多条正常结果。不使用beam_search场景下，n取值建议为1≤n≤10。如果n>1时，必须确保不使用greedy_sample采样，也就是top_k > 1，temperature > 0。使用beam_search场景下，n取值建议为1<n≤10。如果n=1，会导致推理请求失败。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
PD分离部署使用说明 - AI开发平台ModelArts

及Decode阶段的访存密集型特性，通过调节PD节点数量配比来提升Decode节点的batch size来充分发挥NPU卡的算力，进而提升集群整体吞吐。此外，在Decode平均低时延约束场景，PD分离相比PD混合部署，更加能够发挥性能优势。分离部署的实例类型启动分为以下三个阶段：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
总览Workflow工作流 - AI开发平台ModelArts

String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 search_type 否 String 过滤方式。可选值如下： equal表示精确匹配。 contain表示模糊匹配。具体过滤的字段，由各个接

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

[ModelArts Service Log]2021-01-21 11:35:42,178 - file_io.py[line:658] - ERROR: stat:503 errorCode:None errorMessage:None reason:Service Unavailable

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
自定义镜像使用场景 - AI开发平台ModelArts

Storage Service，OBS）是一个基于对象的海量存储服务，为客户提供海量、安全、高可靠、低成本的数据存储能力。在使用ModelArts时存在与OBS的数据交互，您需要使用的数据可以存储至OBS。弹性云服务器弹性云服务器（Elastic Cloud Server，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
导入模型 - AI开发平台ModelArts
导入模型 - AI开发平台ModelArts

json，只允许放置一个 │ │ ├──customize_service.py 必选：模型推理代码，文件名称固定为customize_service.py，只允许放置一个，customize_service.py依赖的文件可以直接放model目录下示例代码在ModelArts

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
更新API授权 - AI开发平台ModelArts

/v1/{project_id}/services/{service_id}/app-auth-apis/{api_id}/app-auth-api 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 service_id 是 String

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
创建自动模型优化的训练作业 - AI开发平台ModelArts

据实际情况选择对应的算法，支持多选。对应的算法和参数解析请参考以下： bayes_opt_search：贝叶斯优化（SMAC） tpe_search：TPE算法 anneal_search：模拟退火算法（Anneal）提交创建算法完成后即可执行下一步，创建训练作业。创建训练作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 自动模型优化（AutoSearch）
新建Workflow Execution - AI开发平台ModelArts

deployed service will stop in hours, where -1 means the service will always run", "delay" : true, "used_steps" : [ "service_step" ]

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询推理服务标签 - AI开发平台ModelArts

https://{endpoint}/v1/{project_id}/services/tms/tags 响应示例状态码： 200 查询项目下service资源类型的所有标签，正常返回。 { "tags" : [ { "key" : "model_version", "values"

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

返回多条正常结果。约束与限制：不使用beam_search场景下，n取值建议为1≤n≤10。如果n>1时，必须确保不使用greedy_sample采样。也就是top_k > 1; temperature > 0。使用beam_search场景下，n取值建议为1<n≤10。如果n=1，会导致推理请求失败。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
授权API至APP - AI开发平台ModelArts

/v1/{project_id}/services/{service_id}/app-auth-apis/{api_id}/app-auth-api 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 service_id 是 String

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
推理精度测试 - AI开发平台ModelArts

修改参数。请确保${work_dir} 已经通过export设置。 vllm_path=${vllm_path} \ service_port=${service_port} \ max_out_len=${max_out_len} \ batch_size=${batch_size}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
推理精度测试 - AI开发平台ModelArts

修改参数。请确保${work_dir} 已经通过export设置。 vllm_path=${vllm_path} \ service_port=${service_port} \ max_out_len=${max_out_len} \ batch_size=${batch_size}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
添加资源标签 - AI开发平台ModelArts

String 具体错误信息。请求示例为指定的Notebook添加资源标签。例如设置TMS标签的key为“test”，value为“service-gpu”。 https://{endpoint}/v1/{project_id}/notebooks/a55eba18-1ebf-4

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

返回多条正常结果。约束与限制：不使用beam_search场景下，n取值建议为1≤n≤10。如果n>1时，必须确保不使用greedy_sample采样。也就是top_k > 1; temperature > 0。使用beam_search场景下，n取值建议为1<n≤10。如果n=1，会导致推理请求失败。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
查询可视化作业详情 - AI开发平台ModelArts

error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。 job_name String 可视化作业的名称。 service_url String 可视化作业的endpoint。 resource_id String 可视化作业的计费资源ID。 job_id

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
添加资源标签 - AI开发平台ModelArts

具体错误信息。请求示例为指定服务添加标签。设置TMS标签的key为“test”和“model_version”，TMS标签的value为“service-gpu”和“0.1”。 https://{endpoint}/v1/{project_id}/services/a55eba18-1

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

示例如下： package com.apig.sdk.demo; import com.cloud.apigateway.sdk.utils.Client; import com.cloud.apigateway.sdk.utils.Request; import org.apache

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
查询用户镜像组列表 - AI开发平台ModelArts

"create_at" : 1671093486722, "name" : "mock-service-python", "namespace" : "mock-service1", "update_at" : 1671093486722, "version_count"

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理

总条数： 518

上一页
1
...
16
17
18
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

调用MaaS部署的模型服务 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

总览Workflow工作流 - AI开发平台ModelArts

OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

自定义镜像使用场景 - AI开发平台ModelArts

导入模型 - AI开发平台ModelArts

更新API授权 - AI开发平台ModelArts

创建自动模型优化的训练作业 - AI开发平台ModelArts

新建Workflow Execution - AI开发平台ModelArts

查询推理服务标签 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

授权API至APP - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

添加资源标签 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

查询可视化作业详情 - AI开发平台ModelArts

添加资源标签 - AI开发平台ModelArts

通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

查询用户镜像组列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线