搜索_华为云

准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

修改Dockerfile，增加如下命令： RUN source /home/ma-user/.bashrc && \ git config --global http.sslVerify false && \ cd ./AscendCloud-LLM/llm_inference/ascend_vllm/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 准备工作
ModelArts在线服务处于运行中时，如何填写request header和request body？ - AI开发平台ModelArts

模型为从对象存储(OBS)导入的：此时对body的要求会在推理代码中体现，具体在推理代码的_preprocess方法中，该方法将输入的http body转换成模型期望的输入，具体的指导可以查看文档：模型推理代码编写说明。模型从AI Gallery中获取的：请查看AI Gall

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
附录：部署常见问题 - AI开发平台ModelArts

enough“的问题问题：容器共享内存不足解决方法：在启动docker的命令中增加“--shm-size=${memSize}“，其中memSize为要设置的共享内存大小，如2g。 --shm-size 2g \ 如何解决MindIE服务已退出情况下显存依然占用的问题问题：服务退出显存未完全释放

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

Arts监控服务。设置告警规则有多种方式。您可以根据实际应用场景，选择设置告警规则的方式。对ModelArts服务设置告警规则对单个服务设置告警规则对模型版本设置告警规则对服务或模型版本的单个指标设置告警规则方式一：对整个ModelArts服务设置告警规则登录管理控制台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
在ModelArts中物体检测标注时能否自定义标签？ - AI开发平台ModelArts

在ModelArts中物体检测标注时能否自定义标签？可以通过修改数据集给标签添加自定义属性来设置一些自定义的属性。图1 修改数据集父主题： Standard数据准备

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
多模态 - AI开发平台ModelArts
多模态 - AI开发平台ModelArts

VLLM_ENGINE_ITERATION_TIMEOUT_S=600 # PYTORCH_NPU_ALLOC_CONF优先设置为expandable_segments:True # 如果有涉及虚拟显存相关的报错，可设置为expandable_segments:False export PYTORCH_NPU_

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

原因分析该报错说明预测使用的数据行数小于window超参值。在使用订阅算法时序预测-time_series_v2训练时，超参：window设置为60。训练完成并创建模型后，部署在线服务，进行预测，当预测的数据行数小于window超参值时，日志中有报错信息：ERROR: data is

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在线服务鉴权 - AI开发平台ModelArts

响应参数状态码：201 表4 响应Body参数参数参数类型描述 result String 认证结果。请求示例对在线服务进行鉴权。设置付费工作流计费周期为“day”，付费工作流可使用的时间为“100”。 POST https://{endpoint}/v2/{projec

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
Step3 为用户配置ModelArts的委托访问授权 - AI开发平台ModelArts

Step3 为用户配置ModelArts的委托访问授权配置完IAM权限之后，需要在ModelArts页面为子账号设置ModelArts访问授权，允许ModelArts访问OBS、SWR、IEF等依赖服务。此方式只允许主用户为子账号进行配置。因此，本示例中，管理员账号需为所有用户完成访问授权的配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
安装Gallery CLI配置工具 - AI开发平台ModelArts

CLI配置工具下载文件，如果在资产详情页有“复制完整资产名称”按钮即表示该资产支持使用Gallery CLI配置工具下载，如图1所示。图1 复制完整资产名称 “运行平台”设置为“Pangu Studio”的数据集，不支持使用CLI工具下载。下载Gallery CLI配置工具包（本地）如果是在本地服务器安装Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

8中会出现的情况，该日志是Info级别的，并不是错误信息，可以通过设置环境变量来屏蔽INFO级别的日志信息。环境变量的设置一定要在import tensorflow或者import moxing之前。处理方法您需要通过在代码中设置环境变量“TF_CPP_MIN_LOG_LEVEL”来屏

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
自动学习/Workflow计费项 - AI开发平台ModelArts

具体计费可见消息通知服务价格详情。按实际用量付费发送短信通知费用构成：短信通知条数发送电子邮件费用构成：电子邮件+外网下行流量发送HTTP(S)费用构成：HTTP(S)+外网下行流量计费示例以下案例中出现的费用价格仅供参考，实际价格请参见各服务价格详情。示例：使用公共资源池运行自

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

GPU A系列裸金属服务器如何进行RoCE性能带宽测试？场景描述本文主要指导如何在GPU A系列裸金属服务器上测试RoCE性能带宽。前提条件 GPU A系列裸金属服务器已经安装了IB驱动。（网卡设备名称可以使用ibstatus或者ibstat获取。华为云Ant8裸金属服务器使用Ubuntu20

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

模型基本信息参数说明参数名称说明名称模型名称。支持1～64位可见字符（含中文），名称可以包含字母、中文、数字、中划线、下划线。版本设置所创建模型的版本。第一次导入时，默认为0.0.1。说明：模型创建完成后，可以通过创建新版本，导入不同的元模型进行调优。描述模型的简要描述。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
guided-decoding - AI开发平台ModelArts

在线推理使用Guided Decoding时，在发送的请求中包含上述guided_json架构，具体示例可参考以下代码。 curl -X POST http://${docker_ip}:8080/v1/completions \ -H "Content-Type: application/json"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
场景描述 - AI开发平台ModelArts
场景描述 - AI开发平台ModelArts

子账号的权限，由主用户来控制，主用户通过IAM的权限配置功能设置用户组的权限，从而控制用户组内的子账号的权限。此处的授权列表均按照ModelArts和其他服务的系统预置策略来举例。表1 服务授权列表待授权的服务授权说明 IAM权限设置是否必选 ModelArts 授予子账号使用ModelArts服务的权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

如上发现reboot后内核为4.18.0-147.5.1.6.h998.eulerosv2r9.x86_64，和当前内核版本h934不一致，则需要重新设置内核版本与当前版本一致。查看当前内核版本，并且锁定reboot后默认启动的内核版本，执行如下命令： grub2-set-default 'EulerOS

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

IAM 介绍ModelArts所有功能涉及到的IAM权限配置。 IAM权限简介如果您需要为企业中的员工设置不同的权限访问ModelArts资源，以达到不同员工之间的权限隔离，您可以使用统一身份认证服务（Identity and Access Management，简称IAM）进

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
FlUX.1基于Lite Server适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

则首次推理时间较长，请耐心等待。浏览器启动浏览器启动时，需要使用宿主机IP，在浏览器中输入 http://${host_ip_address}:${port} ,例如：http://7.216.55.96:8585/ 参数说明： host_ip_address：为宿主机IP地址

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

举例如下（#开头为注释，非必需）： # HELP http_requests_total The total number of HTTP requests. # TYPE http_requests_total gauge html_http_requests_total{method="post"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源

总条数： 1021

上一页
1
...
8
9
10
...
52
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备镜像 - AI开发平台ModelArts

ModelArts在线服务处于运行中时，如何填写request header和request body？ - AI开发平台ModelArts

附录：部署常见问题 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

在ModelArts中物体检测标注时能否自定义标签？ - AI开发平台ModelArts

多模态 - AI开发平台ModelArts

时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

在线服务鉴权 - AI开发平台ModelArts

Step3 为用户配置ModelArts的委托访问授权 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

自动学习/Workflow计费项 - AI开发平台ModelArts

GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

guided-decoding - AI开发平台ModelArts

场景描述 - AI开发平台ModelArts

GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

FlUX.1基于Lite Server适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线