搜索_华为云

使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

Server-Sent Events（SSE）是一种服务器向客户端推送数据的技术，它是一种基于HTTP的推送技术，服务器可以向客户端推送事件。这种技术通常用于实现服务器向客户端推送实时数据，例如聊天应用、实时新闻更新等。 SSE主要解决了客户端与服务器之间的单向实时通信需求（例如ChatGP

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
基于MaaS DeepSeek API和Cherry Studio快速构建个人AI智能助手 - AI开发平台ModelArts

Studio调用部署在ModelArts Studio上的DeepSeek模型，构建个人AI助手。背景介绍 Cherry Studio是一款开源的多模型桌面客户端，支持Windows、macOS和Linux系统。它集成了多种主流大语言模型（例如OpenAI、DeepSeek、Gemini等），并支持

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 使用MaaS DeepSeek API搭建AI应用
基于MaaS DeepSeek API和Cherry Studio快速构建个人AI智能助手 - AI开发平台ModelArts

添加MaaS提供商。在Cherry Studio客户端左下角，单击设置图标，在“模型服务”中单击“添加”。图1 添加提供商在“添加提供商”对话框，配置提供商名称和提供商类型，然后单击“确定”。表1 添加提供商参数说明参数说明提供商名称配置为“华为云ModelArts Studio”，您可以按需修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理应用
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

不同）。 WebSocket客户端和服务端双向传输数据连接建立后，WebSocket使用TCP完成全双工通信。WebSocket的客户端可以往服务端发送数据，客户端有不同的实现，同一种语言也存在不同的lib包的实现，这里不考虑实现的不同种类。客户端发送的内容在协议的角度不限定

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

不同）。 WebSocket客户端和服务端双向传输数据连接建立后，WebSocket使用TCP完成全双工通信。WebSocket的客户端可以往服务端发送数据，客户端有不同的实现，同一种语言也存在不同的lib包的实现，这里不考虑实现的不同种类。客户端发送的内容在协议的角度不限定

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

otebook中的文件上传至OBS，或者下载OBS中的文件至Notebook中。图1 Notebook中上传下载OBS文件使用OBS客户端上传文件的操作指导：上传文件方法一：在Notebook中通过Moxing上传下载OBS文件 MoXing是ModelArts自研的分布式

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
上传镜像 - AI开发平台ModelArts
上传镜像 - AI开发平台ModelArts

上传镜像操作场景客户端上传镜像，是指在安装了容器引擎客户端的机器上使用docker命令将镜像上传到容器镜像服务的镜像仓库。如果容器引擎客户端机器为云上的ECS或CCE节点，根据机器所在区域有两种网络链路可以选择：如果机器与容器镜像仓库在同一区域，则上传镜像走内网链路。如

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

suppressed"。原因分析根据SFS客户端日志分析出现问题的时间点发现，SFS盘连接的客户端个数较多，在问题的时间点并发读取数据，I/O超高；当前SFS服务端的机制是：当SFS盘的性能到上限时，就会IO排队。IO排队造成处理时间超过 1 分钟时，客户端内核会打印"rpc_check_timeout:939

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

html），后台的实例运行是一直稳定的，重连即可再次连上。解决方法如果想保持长时间连接不断开，可以通过配置SSH定期发送通信消息，避免防火墙认为链路空闲而关闭。客户端配置（用户可根据需要自行配置，不配置默认是不给服务端发心跳包），如图1，图2所示。图1 打开VS Code ssh config配置文件

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
创建Notebook实例 - AI开发平台ModelArts

创建Notebook实例，可以根据您指定的实例规格，不同AI引擎镜像，存储等相关参数，为您创建一个Notebook，您可以通过网页和SSH客户端访问Notebook实例。该接口为异步操作，创建Notebook实例的状态请通过查询Notebook实例详情接口获取。接口约束暂无约束

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
服务预测失败 - AI开发平台ModelArts

服务预测失败问题现象在线服务部署完成且服务已经处于“运行中”的状态，向服务发起推理请求，预测失败。原因分析及处理方法服务预测需要经过客户端、外部网络、APIG、Dispatch、模型服务多个环节。每个环节出现都会导致服务预测失败。图1 推理服务流程图出现APIG.XXXX

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
附录：大模型推理常见问题 - AI开发平台ModelArts

问题10：使用benchmark-tools访问推理客户端返回报错或警告使用benchmark-tools访问推理客户端返回报错或警告：actual output_tokens_length < expected output_len 图5 benchmark-tools访问推理客户端返回报错图6 ben

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
附录：大模型推理常见问题 - AI开发平台ModelArts

问题10：使用benchmark-tools访问推理客户端返回报错或警告使用benchmark-tools访问推理客户端返回报错或警告：actual output_tokens_length < expected output_len 图5 benchmark-tools访问推理客户端返回报错图6 ben

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
附录：大模型推理常见问题 - AI开发平台ModelArts

问题10：使用benchmark-tools访问推理客户端返回报错或警告使用benchmark-tools访问推理客户端返回报错或警告：actual output_tokens_length < expected output_len 图5 benchmark-tools访问推理客户端返回报错图6 ben

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
在ModelArts训练时如何安装C++的依赖库？ - AI开发平台ModelArts

在ModelArts训练时如何安装C++的依赖库？在训练作业的过程中，会使用到第三方库。以C++为例，请参考如下操作步骤进行安装：将源码下载至本地并上传到OBS。使用OBS客户端上传文件的操作请参见上传文件。将上传到OBS的源码使用Moxing复制到开发环境Notebook中。以下为使用EVS挂载的开发环境，将

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
实时推理的部署及使用流程 - AI开发平台ModelArts

在线服务的API默认为HTTPS访问，同时还支持以下的传输协议：使用WebSocket协议的方式访问在线服务：WebSocket使得客户端和服务器之间的数据交换变得更加简单，允许服务端主动向客户端推送数据。在WebSocket API中，浏览器和服务器只需要完成一次握手，两者之间就可以建立持久性的连接，并进行双向数据传输。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

本案例介绍如何在Snt9B环境中利用Deployment机制部署在线推理服务。首先创建一个Pod以承载服务，随后登录至该Pod容器内部署在线服务，并最终通过新建一个终端作为客户端来访问并测试该在线服务的功能。图1 任务示意图操作步骤拉取镜像。本测试镜像为bert_pretrain_mindspore:v1，已经把测试数据和代码打进镜像中。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

APPcode认证是一种简易的API调用认证方式，通过在HTTP请求头中添加参数X-Apig-AppCode来实现身份认证，无需复杂的签名过程，适合于客户端环境安全可控的场景，如内网系统之间的API调用。在ModelArts中，支持在部署在线服务时开启AppCode认证（部署模型为在线服务中的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
状态码 - AI开发平台ModelArts
状态码 - AI开发平台ModelArts

服务器在完成请求时发生冲突。返回该状态码，表明客户端尝试创建的资源已经存在，或者由于冲突请求的更新操作不能被完成。 410 Gone 客户端请求的资源已经不存在。返回该状态码，表明请求的资源已被永久删除。 411 Length Required 服务器无法处理客户端发送的不带Content-Length的请求信息。

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
推理业务迁移评估表 - AI开发平台ModelArts

性能预期：QPS 20/s - 业务访问方式推理业务访问：“客户端 -> 云服务” 或 “云客户端 -> 云服务”。推理业务时延要求，客户端到云服务端到端可接受时延。例如：当前是“客户端 -> 云服务”模式，客户端请求应答可接受的最长时延为2秒。 - 模型参数规模，是否涉及分布式推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导

总条数： 498

上一页
1
2
3
4
5
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

基于MaaS DeepSeek API和Cherry Studio快速构建个人AI智能助手 - AI开发平台ModelArts

基于MaaS DeepSeek API和Cherry Studio快速构建个人AI智能助手 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

上传镜像 - AI开发平台ModelArts

使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

服务预测失败 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

在ModelArts训练时如何安装C++的依赖库？ - AI开发平台ModelArts

实时推理的部署及使用流程 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

状态码 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线