搜索_华为云

通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

细介绍如何通过APIG SDK访问在线服务，具体操作流程如下：获取AK/SK 获取在线服务信息发送预测请求方式一：使用Python语言发送预测请求方式二：使用Java语言发送预测请求 AK/SK签名认证方式，仅支持Body体12M以内，12M以上的请求，需使用Token认证。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
步骤总览 - AI开发平台ModelArts
步骤总览 - AI开发平台ModelArts

线下容器镜像构建及调试上传镜像上传数据和算法至OBS（首次使用时需要）使用Notebook进行代码调试创建训练任务单机多卡资源购买：购买虚拟私有云VPC 购买弹性文件服务SFS 购买容器镜像服务SWR 创建网络购买ModelArts专属资源池购买弹性云服务器ECS 基本配置：

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
推理精度测试 - AI开发平台ModelArts

eval_test.py # 启动脚本，建立线程池发送请求，并汇总结果 ├── readme.md # 说明文档 ├── requirements.txt # 第三方依赖 ├── service_predict.py # 发送请求的服务上传精度测试代码到推理容器中。如果在Step5

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
推理精度测试 - AI开发平台ModelArts

ceval-exam, ceval数据集 ├── eval_test.py # 启动脚本，建立线程池发送请求，并汇总结果 ├── service_predict.py # 发送请求的服务执行精度测试启动脚本eval_test.py，具体操作命令如下，可以根据参数说明修改参数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

目录用于后续存储代码使用，例如：training_data。创建VPC 虚拟私有云（Virtual Private Cloud）可以为您构建隔离的、用户自主配置和管理的虚拟网络环境，操作指导请参考创建虚拟私有云和子网。创建SFS Turbo SFS Turbo HPC型文件系

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

目录用于后续存储代码使用，例如：training_data。创建VPC 虚拟私有云（Virtual Private Cloud）可以为您构建隔离的、用户自主配置和管理的虚拟网络环境，操作指导请参考创建虚拟私有云和子网。创建SFS Turbo SFS Turbo HPC型文件系

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
推理场景介绍 - AI开发平台ModelArts

├── model.py # 发送请求的模块，在这里修改请求响应。目前支持vllm.openai，atb的tgi模板 ├── ... ├── eval_test.py # 启动脚本，建立线程池发送请求，并汇总结果

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
多模态 - AI开发平台ModelArts
多模态 - AI开发平台ModelArts

T_S=600 # PYTORCH_NPU_ALLOC_CONF优先设置为expandable_segments:True # 如果有涉及虚拟显存相关的报错，可设置为expandable_segments:False export PYTORCH_NPU_ALLOC_CONF=e

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
部署在线服务 - AI开发平台ModelArts

子网的网络ID，默认为空，当配置了vpc_id则此参数必填。需填写虚拟私有云控制台子网详情中显示的“网络ID”。通过子网可提供与其他网络隔离的、可以独享的网络资源。 security_group_id 否 String 安全组，默认为空，当配置了vpc_id则此参数必填。安全组起着虚拟防火墙的作用，为服务实例提供安

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

可能是亚健康，建议先重启节点，如果重启节点后未恢复，发起维修流程。配置节点告警通知节点故障指标(nt_npg)默认会上报到AOM，您可以在AOM配置短信、邮件等通知方式。以下步骤基于AOM2.0配置。登录AOM控制台。在左侧导航栏选择“告警管理 > 告警规则”，单击“创建”，创建告警规则。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
Lite Server资源开通 - AI开发平台ModelArts

追加授权步骤5：创建虚拟私有云创建虚拟私有云需要登录管理员账号，IP地址段请根据现网情况合理规划。登录虚拟私有云VPC管理控制台。在“虚拟私有云 > 我的VPC”页面，单击右上角“创建虚拟私有云”后，根据界面提示配置虚拟私有云参数，然后单击“立即创建”。创建虚拟私有云参数介绍可参考此处。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

returned Connection refused, retrying”。原因分析 NCCL是一个提供GPU间通信原语的库，实现集合通信和点对点发送/接收原语。当训练作业出现NCCL的报错时，可以通过调整NCCL的环境变量尝试解决问题。处理步骤进入状态“运行失败”的训练作业详情页，单击“日志”页签，查看NCCL报错。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
专属资源池VPC打通 - AI开发平台ModelArts

C和子网。需要打通的对端网络不能和当前网段重叠。图2 打通VPC参数选择如果没有VPC可选，可以单击右侧的“创建虚拟私有云”，跳转到网络控制台，申请创建虚拟私有云。如果没有子网可选，可以单击右侧的“创建子网”，跳转到网络控制台，创建可用的子网。支持1个VPC下多个子网的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
配置Lite Server网络 - AI开发平台ModelArts

登录华为云管理控制台。在左侧服务列表中，单击“网络 > NAT网关 NAT”，进入公网NAT网关页面。单击“购买公网NAT网关”。选择Server所使用“虚拟私有云”和“子网”，计费模式根据实际需求选择。其余参数配置可使用默认值，单击“立即购买”。图3 购买公网NAT网关在产品配置信息确认页面，再次核对弹性公网IP信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
团队成员查询团队标注任务列表 - AI开发平台ModelArts

团队标注成员邮箱。 email_status Integer 团队标注成员任务邮件通知状态。可选值如下： 0：表示未发送过 1：表示邮箱格式错误 2：表示邮箱地址不可达， 3：表示发送成功 last_notify_time Long 团队标注成员任务邮件最近一次通知时间戳。 pass_rate

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

on-alive.html），后台的实例运行是一直稳定的，重连即可再次连上。解决方法如果想保持长时间连接不断开，可以通过配置SSH定期发送通信消息，避免防火墙认为链路空闲而关闭。客户端配置（用户可根据需要自行配置，不配置默认是不给服务端发心跳包），如图1，图2所示。图1 打开VS

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
使用PyCharm手动连接Notebook - AI开发平台ModelArts

配置SSH Step2 获取开发环境预置虚拟环境路径单击“Tools > Start SSH Session”，则可连接到云端开发环境内。执行如下命令可在/home/ma-user/下面的README文件查看当前环境内置的Python虚拟环境。 cat /home/ma-user/README

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
包年/包月 - AI开发平台ModelArts
包年/包月 - AI开发平台ModelArts

期和保留期。图1 包年/包月资源生命周期到期预警包年/包月资源池在到期前第7天内，系统将向用户推送到期预警消息。预警消息将通过邮件、短信和站内信的方式通知到华为云账号的创建者。到期后影响当您的包年/包月资源池到期未续费，首先会进入宽限期，资源状态变为“已过期”。宽限期内

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
数据管理（旧版） - AI开发平台ModelArts

提交验收任务的样本评审意见团队标注审核批量更新团队标注样本的标签查询标注团队列表创建标注团队查询标注团队详情更新标注团队删除标注团队向标注成员发送邮件查询所有团队的标注成员列表查询标注团队的成员列表创建标注团队的成员批量删除标注团队成员查询标注团队成员详情更新标注团队成员

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

T_S=600 # PYTORCH_NPU_ALLOC_CONF优先设置为expandable_segments:True # 如果有涉及虚拟显存相关的报错，可设置为expandable_segments:False export PYTORCH_NPU_ALLOC_CONF=e

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）

总条数： 206

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

步骤总览 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

多模态 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

Lite Server资源开通 - AI开发平台ModelArts

训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

专属资源池VPC打通 - AI开发平台ModelArts

配置Lite Server网络 - AI开发平台ModelArts

团队成员查询团队标注任务列表 - AI开发平台ModelArts

VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

使用PyCharm手动连接Notebook - AI开发平台ModelArts

包年/包月 - AI开发平台ModelArts

数据管理（旧版） - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线