搜索_华为云

使用MaaS部署模型服务 - AI开发平台ModelArts

自动停止当使用付费资源时，可以选择是否打开“自动停止”开关。开关关闭（默认关闭）：表示服务将一直运行。开关打开：表示启用自动停止功能，此时必须配置自动停止时间，支持设置为“1小时”、“2小时”、“4小时”、6小时或“自定义”。启用该参数并设置时间后，运行时长到期后将会自动终止服务，准备排队等状态不扣除运行时长。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
启动Notebook实例 - AI开发平台ModelArts

描述 create_at Long 实例创建的时间，UTC毫秒。 duration Long 实例运行时长，以创建时间为起点计算，即“创建时间+duration > 当前时刻”时，系统会自动停止实例。 enable Boolean 是否启用自动停止功能。 type String 自动停止类别。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
资源池统计 - AI开发平台ModelArts

/v2/{project_id}/statistics/pools 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 workspaceId 否 String 工作空间，默认值为0。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
非分离部署推理服务 - AI开发平台ModelArts

评估推理资源。运行如下命令，返回NPU设备信息可用的卡数。 npu-smi info # 启动推理服务之前检查卡是否被占用、端口是否被占用，是否有对应运行的进程如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
重置AppCode - AI开发平台ModelArts
重置AppCode - AI开发平台ModelArts

bounded_api_count Integer APP绑定API数量。 created_at Long APP创建时间。 project_id String 项目ID。 updated_at Long APP更新时间。 user_id String APP创建用户ID。状态码：401 表6 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

TMOUT=0这个命令在SSH连接Linux服务器时的作用是设置会话的空闲超时时间为0，意味着不会因为空闲而自动断开连接。默认情况下，SSH连接可能会在一段时间没有操作后自动断开，这是为了安全考虑。但是，如果您正在进行需要长时间保持连接的任务，可以使用这个命令来防止连接因为空闲而断开。您可以在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
查询DevServer实例详情 - AI开发平台ModelArts

描述 create_at Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式 PRE_PAID：包周期 cloud_server CloudServer

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
查询工作流定时调度详情 - AI开发平台ModelArts

/v2/{project_id}/workflows/{workflow_id}/schedules/{schedule_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
删除DevServer实例 - AI开发平台ModelArts

描述 create_at Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式 PRE_PAID：包周期 cloud_server CloudServer

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
停止DevServer实例 - AI开发平台ModelArts

描述 create_at Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式 PRE_PAID：包周期 cloud_server CloudServer

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
部署推理服务 - AI开发平台ModelArts

评估推理资源。运行如下命令，返回NPU设备信息可用的卡数。 npu-smi info # 启动推理服务之前检查卡是否被占用、端口是否被占用，是否有对应运行的进程如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
查询训练作业详情 - AI开发平台ModelArts

参数参数类型描述 type String 参数种类。 editable Boolean 是否可编辑。 required Boolean 是否必须。 sensitive Boolean 是否敏感。 valid_type String 有效种类。 valid_range Array

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
终止训练作业 - AI开发平台ModelArts

参数参数类型描述 type String 参数种类。 editable Boolean 是否可编辑。 required Boolean 是否必须。 sensitive Boolean 是否敏感。 valid_type String 参数有效种类。 valid_range Array

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
在推理生产环境中部署推理服务 - AI开发平台ModelArts

-e . 开启图模式后，服务第一次响应请求时会有一个较长时间的图编译过程，并且会在当前目录下生成.torchair_cache文件夹来保存图编译的缓存文件。当服务第二次启动时，可通过缓存文件来快速完成图编译的过程，避免长时间的等待，并且基于图编译缓存文件来启动服务可获得更优的推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
查询工作空间详情 - AI开发平台ModelArts

enterprise_project_id String 企业项目ID。 update_time Integer 最后修改时间，UTC。 create_time Integer 创建时间，UTC。 enterprise_project_name String 企业项目名称。 name String

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
Paraformer基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

AscendCloud-6.3.911软件包中的AscendCloud-CV-6.3.911-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E，登录后在此路径中查找下载ModelArts 6.3.911 版本。说明：如果没有下载

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

客户端须注意本地时间与时钟服务器的同步，避免请求消息头X-Sdk-Date的值出现较大误差。因为API网关除了校验时间格式外，还会校验该时间值与网关收到请求的时间差，如果时间差超过15分钟，API网关将拒绝请求。约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
查询服务详情 - AI开发平台ModelArts

project String 服务归属项目。 owner String 服务归属用户。 publish_at Number 服务最新的发布时间，距'1970.1.1 0:0:0 UTC'的毫秒数。 infer_type String 推理方式，取值为real-time/batch/edge。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
调用MaaS部署的模型服务 - AI开发平台ModelArts

调用”弹出调用页面。选择是否启用内容审核，默认启用。是，内容审核可以阻止模型推理中的输入输出中出现不合规的内容，但可能会对接口性能产生较大影响。否，停用内容审核服务，将不会审核模型推理中的输入输出，模型服务可能会有违规风险，请谨慎关闭。关闭“内容审核”开关，需要在弹窗中确认是否停用内容审核服务，勾选后，单击“确定”关闭。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
服务启动失败 - AI开发平台ModelArts

个方面进行排查：健康检查端口是否可以正常工作自定义镜像中配置了健康检查，需要在测试镜像时，同步测试健康检查接口是否可以正常工作，具体参考从0-1制作自定义镜像并创建AI应用中的本地验证镜像方法。创建模型界面上配置的健康检查地址与实际配置的是否一致如果使用的是ModelAr

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署

总条数： 511

上一页
1
...
16
17
18
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用MaaS部署模型服务 - AI开发平台ModelArts

启动Notebook实例 - AI开发平台ModelArts

资源池统计 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

重置AppCode - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

查询DevServer实例详情 - AI开发平台ModelArts

查询工作流定时调度详情 - AI开发平台ModelArts

删除DevServer实例 - AI开发平台ModelArts

停止DevServer实例 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

查询工作空间详情 - AI开发平台ModelArts

Paraformer基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线