搜索_华为云

使用自动分组智能标注作业 - AI开发平台ModelArts

精度。ModelArts内置了分组算法，您可以针对您选中的数据，执行自动分组，提升您的数据标注效率。自动分组可以理解为数据标注的预处理，先使用聚类算法对未标注图片进行聚类，再根据聚类结果进行处理，可以分组打标或者清洗图片。例如，用户通过搜索引擎搜索XX，将相关图片下载并上传到

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过智能标注方式标注数据
查询APP详情 - AI开发平台ModelArts

String APP类型。枚举值如下： APIC：该APP注册在roma connect网关上 APIG：该APP注册在共享API网关上 DEDICATE_APIG：该APP注册在专享API网关上 bounded_api_count Integer APP绑定API数量。 created_at

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

kubectl delete pod -n kube-system ${pod_scheduler_name} 图3 scheduler 如果重启后，还是会Pending，建议多重复重启几次。其他实例调度失败问题首先通过打印Pod日志信息。根据错误信息，可通过访问官网链接：工作负载异常：实例调度失败，进行查找。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

kubectl delete pod -n kube-system ${pod_scheduler_name} 图3 scheduler 若重启后，还是会Pending，建议多重复重启几次。其他实例调度失败问题首先通过打印Pod日志信息。根据错误信息，可通过访问官网链接：工作负载异常：实例调度失败，进行查找。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

kubectl delete pod -n kube-system ${pod_scheduler_name} 图3 scheduler 若重启后，还是会Pending，建议多重复重启几次。其他实例调度失败问题首先通过打印Pod日志信息。根据错误信息，可通过访问官网链接：工作负载异常：实例调度失败，进行查找。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
查询API和APP - AI开发平台ModelArts

String APP类型。枚举值如下： APIC：该APP注册在roma connect网关上 APIG：该APP注册在共享API网关上 DEDICATE_APIG：该APP注册在专享API网关上 bounded_api_count Integer APP绑定API数量。 created_at

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
更新管理 - AI开发平台ModelArts
更新管理 - AI开发平台ModelArts

推理服务有三种升级模式：全量升级、滚动升级（扩实例）和滚动升级（缩实例）。了解三种升级模式的流程，请参见图1。全量升级需要额外的双倍的资源，先全量创建新版本实例，然后再下线旧版本实例。滚动升级（扩实例）需额外消耗部分实例资源用于滚动升级，扩实例越大，升级速度越快。滚动升级（缩实例）

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
获取API授权关系列表 - AI开发平台ModelArts

String APP类型。枚举值如下： APIC：该APP注册在roma connect网关上 APIG：该APP注册在共享API网关上 DEDICATE_APIG：该APP注册在专享API网关上 bounded_api_count Integer APP绑定API数量。 created_at

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
获取APP列表 - AI开发平台ModelArts

String APP类型。枚举值如下： APIC：该APP注册在roma connect网关上 APIG：该APP注册在共享API网关上 DEDICATE_APIG：该APP注册在专享API网关上 bounded_api_count Integer APP绑定API数量。 created_at

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

启动探针，则默认状态为成功Success。就绪探针：用于检测应用实例是否已经准备好接收流量。如果就绪探针失败，即实例未准备好，会从服务负载均衡的池中剔除该实例，不会将流量路由到该实例，直到探测成功。存活探针：用于检测应用实例内应用程序的健康状态。如果存活探针失败，即应用程序不健康，将会自动重启实例。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

启动探针，则默认状态为成功Success。就绪探针：用于检测应用实例是否已经准备好接收流量。如果就绪探针失败，即实例未准备好，会从服务负载均衡的池中剔除该实例，不会将流量路由到该实例，直到探测成功。存活探针：用于检测应用实例内应用程序的健康状态。如果存活探针失败，即应用程序不健康，将会自动重启实例。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
推理精度测试 - AI开发平台ModelArts

opencompass/opencompass/models/vllm_api.py 中，可以适当调整 gpu_memory_utilization。如果还是 oom，建议适当往下调整。最后，如果执行报错提示oom，建议修改数据集的shot配置。例如mmlu，可以修改文件 opencompas

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

的APP信息。创建APP 创建API网关应用（简称APP）。查询APP详情查询指定的APP详情。删除APP 删除指定的APP。增加AppCode 为指定API网关应用创建新的AppCode。重置AppCode 重置指定API网关应用的指定的AppCode。删除AppCode

帮助中心 > AI开发平台ModelArts > API参考
PD分离部署使用说明 - AI开发平台ModelArts

确保scheduler实例和P、D实例之间网络通畅，检查代理设置例如no_proxy环境变量，避免scheduler访问P、D实例时走不必要的网关。前提条件已完成推理环境镜像制作，具体参见准备推理环境。步骤一：生成ranktable 介绍如何生成ranktable，以1p1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

只支持自定义镜像导入模型部署的在线服务。调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。 SSE在线服务调用 SSE协议本身不提供额外的认证方式，和HTTP请求方式一致。可以使用ModelArts提供的以下认证方式：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

your service is able to process the request without timeout. "} 因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。数据从平台发送到服务，服务预测推理，再将结果返回的时间不超过限制，可以成功返回预测结果。当服务

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

scend Snt9B硬件，完成Open-Sora 1.2 训练和推理。方案概览本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。适配的Cann版本是cann_8.0.rc3。约束限制本方案目前仅适用于企业客户。本文档适配昇腾云ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
身份认证与访问控制 - AI开发平台ModelArts

odelArts创建训练作业，则该用户必须拥有 "modelarts:trainJob:create" 的权限才可以完成操作（无论界面操作还是API调用）。管理员新创建的用户在没有配置细粒度授权策略时，默认具有ModelArts所有权限。如果需要控制用户的详细权限，管理员可以通

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

800 训练服务器 1.0.11 HCCN Tool接口参考主要介绍集群网络工具hccn_tool对外接口说明，包括配置RoCE网卡的IP、网关，配置网络检测对象IP和查询LLDP信息等。 Atlas 800训练服务器备件查询助手备件查询助手可以帮助您查询服务器的所有部件、规格描述，数量等详细信息。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
推理精度测试 - AI开发平台ModelArts

opencompass/opencompass/models/vllm_api.py 中，可以适当调整 gpu_memory_utilization。如果还是 oom，建议适当往下调整。最后，如果执行报错提示oom，建议修改数据集的shot配置。例如mmlu，可以修改文件 opencompas

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）

总条数： 337

上一页
1
2
3
4
5
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用自动分组智能标注作业 - AI开发平台ModelArts

查询APP详情 - AI开发平台ModelArts

附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

查询API和APP - AI开发平台ModelArts

更新管理 - AI开发平台ModelArts

获取API授权关系列表 - AI开发平台ModelArts

获取APP列表 - AI开发平台ModelArts

从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

身份认证与访问控制 - AI开发平台ModelArts

哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线