搜索_华为云

使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

Events（SSE）是一种服务器向客户端推送数据的技术，它是一种基于HTTP的推送技术，服务器可以向客户端推送事件。这种技术通常用于实现服务器向客户端推送实时数据，例如聊天应用、实时新闻更新等。 SSE主要解决了客户端与服务器之间的单向实时通信需求（例如ChatGPT回答的流式输出），相较于WebSocket（双向实时），它更加轻量级且易于实现。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
使用SDK调测单机训练作业 - AI开发平台ModelArts

import Estimator parameters = [] parameters.append({"name": "data_url", "value": data_local}) parameters.append({"name": "output_dir", "value": os

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
查询训练作业版本列表 - AI开发平台ModelArts

"status": 10, "app_url": "/usr/app/", "boot_file_url": "/usr/app/boot.py", "create_time": 1524189990635

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

公网访问在线服务有以下认证方式，API调用请参见认证详情：通过Token认证的方式访问在线服务通过AK/SK认证的方式访问在线服务通过APP认证的方式访问在线服务父主题：访问在线服务支持的访问通道

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
推理性能测试 - AI开发平台ModelArts

mpletions"拼接而成。部署成功后的在线服务详情页中可查看API接口公网地址。图1 API接口公网地址 --app-code：获取方式见访问在线服务（APP认证）。 --tokenizer：tokenizer路径，HuggingFace的权重路径。如果服务部署在Noteb

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

mpletions"拼接而成。部署成功后的在线服务详情页中可查看API接口公网地址。图1 API接口公网地址 --app-code：获取方式见访问在线服务（APP认证）。 --tokenizer：tokenizer路径，HuggingFace的权重路径。如果服务部署在Noteb

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
昇腾能力应用地图 - AI开发平台ModelArts

昇腾能力应用地图 ModelArts支持如下开源模型昇腾NPU进行训练和推理。 LLM大语言模型 ModelArts针对以下主流的LLM大模型进行了基于昇腾NPU的适配工作，可以直接使用适配过的模型在NPU上进行推理训练。表1 LLM模型推理能力支持模型支持模型参数量应用场景

 帮助中心 > AI开发平台ModelArts > 最佳实践
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

型场景下的模型管理和服务部署。约束与限制需要申请单个模型大小配额和添加使用节点本地存储缓存的白名单。需要使用自定义引擎Custom，配置动态加载。需要使用专属资源池部署服务。专属资源池磁盘空间需大于1T。操作事项申请扩大模型的大小配额和使用节点本地存储缓存白名单上传模型数据并校验上传对象的一致性

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

device specification refers to a valid device, The requested device appeares to be a GPU,but CUDA is not enabled” 原因分析出现该问题的可能原因如下：新安装的包与镜像中带的CUDA版本不匹配。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

ity_megabytes 该指标用于统计测量对象申请的物理内存总量。兆字节（Megabytes） ≥0 NA NA NA 物理内存使用率 ma_container_memory_util 该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。百分比（Percent） 0～100%

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

错误未被抑制，可能影响后续业务，需要重置卡或重启节点。观测方式：Xid事件中包含95事件。(Remapped的Pending记录只作为提示，当业务空闲时进行卡重置触发重映射即可) L4: 需要换卡，SRAM Uncorrectable>4或者Remapped Failed。可能是亚健康，建议先重启节点，如果重启节点后未恢复，发起维修流程。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
推理性能测试 - AI开发平台ModelArts

mpletions"拼接而成。部署成功后的在线服务详情页中可查看API接口公网地址。图1 API接口公网地址 --app-code：获取方式见访问在线服务（APP认证）。 --tokenizer：tokenizer路径，HuggingFace的权重路径。如果服务部署在Noteb

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
推理性能测试 - AI开发平台ModelArts

mpletions"拼接而成。部署成功后的在线服务详情页中可查看API接口公网地址。图1 API接口公网地址 --app-code：获取方式见访问在线服务（APP认证）。 --tokenizer：tokenizer路径，HuggingFace的权重路径。如果服务部署在Noteb

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
查询模型runtime - AI开发平台ModelArts

200 OK 401 Unauthorized 403 Forbidden 404 Not Found 错误码请参见错误码。父主题： AI应用管理

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

步骤二：使用Docker安装和配置正向代理购买弹性云服务器ECS，详情请见购买ECS。镜像可选择Ubuntu最新版本。虚拟私有云选择提前创建好的VPC。申请弹性公网IP EIP，详情请见申请弹性公网IP。将弹性公网IP绑定到ECS，详情请见将弹性公网IP绑定至实例。登录ECS，执行如下命令进行Docker安装。如已安装，请直接进入下一步。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
将数据预热到SFS Turbo - AI开发平台ModelArts

# 安装模型运行环境 │ └── qwen-vl.patch # 使用git apply修改模型相关代码 │ └── models └── Qwen-VL-Chat 父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

创建模型时不填写apis。在创建的模型部署服务成功后，进行预测，需选择“请求类型”。“请求类型”可选择“application/json”或“multipart/form-data”。请根据元模型，选择合适的类型。选择“application/json”时，直接填写“预测代码”进行文本预测。选择“mu

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
在推理生产环境中部署推理服务 - AI开发平台ModelArts

在ModelArts控制台的AI应用管理模块中，将模型部署为一个AI应用。登录ModelArts控制台，单击“AI应用管理 > AI应用 > 创建”，开始创建AI应用。图2 创建AI应用设置创建AI应用的相应参数。此处仅介绍关键参数，设置AI应用的详细参数解释请参见从OBS中选择元模型。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

在ModelArts控制台的AI应用管理模块中，将模型部署为一个AI应用。登录ModelArts控制台，单击“AI应用管理 > AI应用 > 创建”，开始创建AI应用。图2 创建AI应用设置创建AI应用的相应参数。此处仅介绍关键参数，设置AI应用的详细参数解释请参见从OBS中选择元模型。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
日志提示“RuntimeError: Cannot re-initialize CUDA in forked subprocess” - AI开发平台ModelArts

rocess, args=(rank, size, run)) p.start() processes.append(p) for p in processes: p.join() 建议与总结在创建训练作业前，推荐您先使

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题

总条数： 591

上一页
1
...
12
13
14
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

使用SDK调测单机训练作业 - AI开发平台ModelArts

查询训练作业版本列表 - AI开发平台ModelArts

通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

昇腾能力应用地图 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

查询模型runtime - AI开发平台ModelArts

ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

将数据预热到SFS Turbo - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

日志提示“RuntimeError: Cannot re-initialize CUDA in forked subprocess” - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线