搜索_华为云

Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

配置CES云监控和SMN消息通知使用权限。ModelArts推理部署的在线服务详情页面内有调用次数详情，单击可查看该在线服务的调用次数随时间详细分布的情况。如果想进一步通过CES云监控查看ModelArts的在线服务和对应模型负载运行状态的整体情况，需要给子账号授予CES权限。如果只是查看监控，给子账号授予CES

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
计费概述 - AI开发平台ModelArts
计费概述 - AI开发平台ModelArts

具体计费请以ModelArts价格计算器中的价格为准。 ModelArts Standard专属资源池、自动学习、Workflow、Notebook、训练作业、在线/批量/边缘服务 ModelArts Lite Cluster资源池 ModelArts弹性集群Server ModelArts Studio（MAAS）

帮助中心 > AI开发平台ModelArts > 计费说明
Ascend相关问题 - AI开发平台ModelArts

Ascend相关问题 Cann软件与Ascend驱动版本不匹配训练作业的日志出现detect failed（昇腾预检失败）父主题：训练作业

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
AI Gallery（新版） - AI开发平台ModelArts

发布和管理AI Gallery镜像发布和管理AI Gallery中的AI应用使用AI Gallery微调大师训练模型使用AI Gallery在线推理服务部署模型 Gallery CLI配置工具指南计算规格说明

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery）
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

口，监听在localhost上。避免通过环境变量传递敏感信息，需要通过加密组件进行加密后再通过环境变量配置。部署在线服务，当打开APP认证时，app认证密钥是在线服务的另一个访问凭据，需要妥善保存app密钥，防止泄露。父主题：安全

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
管理员和开发者权限分离 - AI开发平台ModelArts

”。管理员不做权限控制，此处默认使用普通用户委托即可。勾选“我已经详细阅读并同意《 ModelArts服务声明》”，单击“创建”。测试管理员用户权限。使用管理员用户登录ModelArts管理控制台。在登录页面，请使用“IAM用户登录”方式进行登录。首次登录会提示修改密码，请根据界面提示进行修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

练。 - 自定义算子是否有自定义算子，CPU还是CUDA，复杂程度。例如：有5个CUDA自定义算子。1个高复杂度算子，基于C++开发2000行代码。4个中等复杂度算子，基于C++开发，平均每个自定义算子约500行代码。 - 动态shape 是否需要支持动态shape。例如：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
约束与限制 - AI开发平台ModelArts

一个账号最多创建10个Notebook。否更多信息，请参见创建Notebook实例。 Standard推理部署在线服务单个账号最多可创建20个在线服务。是提交工单申请提升配额更多信息，请参见部署在线服务。 Standard推理部署批量服务单个账号最多可创建1000个批量服务。否更多信息，请参见部署批量服务。

帮助中心 > AI开发平台ModelArts > 产品介绍
非分离部署推理服务 - AI开发平台ModelArts

(Press CTRL+C to quit) Step7 推理请求使用命令测试推理服务是否正常启动。服务启动命令中的参数设置请参见表1。方式一：通过OpenAI服务API接口启动服务使用以下推理测试命令。${docker_ip}替换为实际宿主机的IP地址。如果启动服务未添加s

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
ModelArts Standard资源监控概述 - AI开发平台ModelArts

Standard训练作业：用户在运行训练作业时，可以查看训练作业占用的CPU、GPU或NPU资源使用情况。具体请参见训练资源监控章节。 Standard在线服务：用户将模型部署为在线服务后，可以通过监控功能查看该推理服务的CPU、内存或GPU等资源使用统计信息和模型调用次数统计，具体参见查看推理服务详情章节。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
查询模型runtime - AI开发平台ModelArts

04-x86_64 request_mode Array of strings 请求模式，AI引擎支持部署为同步在线服务或异步在线服务。 sync：同步在线服务 async：异步在线服务 accelerators Array of Accelerator objects AI引擎可使用的加速卡。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
总览Workflow工作流 - AI开发平台ModelArts

建并使用的工作空间，以实际取值为准。 search_type 否 String 过滤方式。可选值如下： equal表示精确匹配。 contain表示模糊匹配。具体过滤的字段，由各个接口额外定义参数。例如Workflow支持按照名称（name）进行过滤，则相应的过滤字段为name

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

目录下存在dockerfile文件。图2 构建日志：dockerfile文件目录有问题 pip软件包版本不匹配，需要修改为日志中打印的存在的版本。图3 pip版本不匹配构建日志中出现报错：“exec /usr/bin/sh: exec format error”。这种报错

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
预测API的域名停用公告 - AI开发平台ModelArts

即切换使用新域名。为保障持续提供推理服务，请您及时更新业务中的预测API的域名。如果您使用的是VPC内部节点访问ModelArts推理的在线服务，预测API切换域名后，由于内网VPC无法识别公网域名，请提交工单联系华为云技术支持打通网络。父主题：产品变更公告

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品变更公告
advisor分析报告html文件详解 - AI开发平台ModelArts

analysis中对应维度的各项分析及其优先级。红色为高优先级，黄色为中等优先级，绿色为低优先级。参考html进行分析调优时，请按照优先级从高到低依次进行并测试调优后性能，快速解决重点问题。图1 html报告总览-三大模块当前advisor的performance problem analysis中包含如下分析项。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

3-cudnn8-ubuntu18.04:v1 . 调试镜像建议把调试过程中的修改点通过Dockerfile固化到容器构建正式流程，并重新测试。确认对应的脚本、代码、流程在linux服务器上运行正常。如果在linux服务器上运行就有问题，那么先调通以后再做容器镜像。确认打入

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
guided-decoding - AI开发平台ModelArts

print(outputs[0].outputs[0].text) MODEL_NAME表示对应模型路径。在线推理使用Guided Decoding 启动推理服务请参考启动推理服务章节。在线推理使用Guided Decoding时，在发送的请求中包含上述guided_json架构，具体示例可参考以下代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
更新管理 - AI开发平台ModelArts
更新管理 - AI开发平台ModelArts

更新管理 ModelArts在线服务更新对于已部署的推理服务，ModelArts支持通过更换模型的版本号，实现服务升级。推理服务有三种升级模式：全量升级、滚动升级（扩实例）和滚动升级（缩实例）。了解三种升级模式的流程，请参见图1。全量升级需要额外的双倍的资源，先全量创建新版本实例，然后再下线旧版本实例。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
执行训练任务（历史版本） - AI开发平台ModelArts

sh; sh ./scripts_modellink/dev_pipeline.sh 命令详解如下： <cfgs_yaml_file>：性能测试配置的yaml文件地址，如代码目录中performance_cfgs.yaml相对或绝对路径。 <model_name>：训练模型名，如qwen2-7b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法 > 工作负载Pod异常 > 执行训练任务
非分离部署推理服务 - AI开发平台ModelArts

0:8080 (Press CTRL+C to quit) 步骤七推理请求使用命令测试推理服务是否正常启动。服务启动命令中的参数设置请参见表1。方式一：通过OpenAI服务API接口启动服务使用以下推理测试命令。${docker_ip}替换为实际宿主机的IP地址。如果启动服务未添加s

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务

总条数： 647

上一页
1
...
21
22
23
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

计费概述 - AI开发平台ModelArts

Ascend相关问题 - AI开发平台ModelArts

AI Gallery（新版） - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

管理员和开发者权限分离 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

ModelArts Standard资源监控概述 - AI开发平台ModelArts

查询模型runtime - AI开发平台ModelArts

总览Workflow工作流 - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

预测API的域名停用公告 - AI开发平台ModelArts

advisor分析报告html文件详解 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

guided-decoding - AI开发平台ModelArts

更新管理 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线