搜索_华为云

什么是弹性负载均衡 - 弹性负载均衡 ELB

什么是弹性负载均衡弹性负载均衡（Elastic Load Balance，简称ELB）是将访问流量根据分配策略分发到后端多台服务器的流量分发控制服务。弹性负载均衡可以通过流量分发扩展应用系统对外的服务能力，同时通过消除单点故障提升应用系统的可用性。

帮助中心 > 弹性负载均衡 ELB > 产品介绍
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

成的模型及版本升级为WebSocket：打开开关图2 升级为WebSocket 单击“下一步”，确认配置后“提交”，完成在线服务的部署。返回在线服务列表页，查看服务状态变为“运行中”，表示服务部署成功。 WebSocket在线服务调用 WebSocket协议本身不提供额外的认

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

token认证 AK/SK APP认证 WebSocket服务调用步骤如下（以图形界面的软件Postman进行预测，token认证为例）： WebSocket连接的建立 WebSocket客户端和服务端双向传输数据 WebSocket连接的建立打开Postman（需选择8.5

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
如何启用WebSocket支持？ - 弹性负载均衡 ELB

如何启用WebSocket支持？无需配置，当选用HTTP监听时，默认支持无加密版本WebSocket协议（WS协议）；当选择HTTPS监听时，默认支持加密版本的WebSocket协议（WSS协议）。父主题：监听器

 帮助中心 > 弹性负载均衡 ELB > 常见问题 > 监听器
使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

例如聊天应用、实时新闻更新等。 SSE主要解决了客户端与服务器之间的单向实时通信需求（例如ChatGPT回答的流式输出），相较于WebSocket（双向实时），它更加轻量级且易于实现。前提条件在线服务中的模型导入选择的镜像需支持SSE协议。约束与限制 SSE协议只支持部署在线服务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
如何使用WebSocket - Astro轻应用 AstroZero

如何使用WebSocket 使用说明开发高级页面时，如果需要消息主动推送、高实时数据展示，您需要使用WebSocket来实现后台数据调用。 WebSocket是一种HTML5提供的网络传输协议。

帮助中心 > Astro轻应用 AstroZero > 用户指南（低代码） > 经典版开发指导 > 高级页面
访问在线服务支持的传输协议 - AI开发平台ModelArts

访问在线服务支持的传输协议使用WebSocket协议的方式访问在线服务使用Server-Sent Events协议的方式访问在线服务父主题：将模型部署为实时推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

打开Terminal窗口，执行以下命令启动kernelgateway服务。 API_TYPE=kernel_gateway.jupyter_websocket LOG_DIR="/home/ma-user/log" mkdir -p ${LOG_DIR} KERNEL_GATEWAY_LO

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

post(url, data=body) print(response.content) 由于高速通道特性会缺失负载均衡的能力，因此在多实例时需要自主制定负载均衡策略。父主题：访问在线服务支持的访问通道

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
实时推理的部署及使用流程 - AI开发平台ModelArts

在线服务的API默认为HTTPS访问，同时还支持以下的传输协议：使用WebSocket协议的方式访问在线服务：WebSocket使得客户端和服务器之间的数据交换变得更加简单，允许服务端主动向客户端推送数据。在WebSocket API中，浏览器和服务器只需要完成一次握手，两者之间就可以建立持久性的连接，并进行双向数据传输。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

post(url, data=body) print(response.content) 由于高速通道特性会缺失负载均衡的能力，因此在多实例时需要自主制定负载均衡策略。父主题： Standard推理部署

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
Standard推理部署 - AI开发平台ModelArts

Standard推理自定义引擎 ModelArts Standard推理服务支持VPC直连的高速访问通道配置 ModelArts Standard的WebSocket在线服务全流程开发从0-1制作自定义镜像并创建模型使用AppCode认证鉴权方式进行在线预测

 帮助中心 > AI开发平台ModelArts > 最佳实践
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

启后不支持修改。 websocket_upgrade 否 Boolean 服务接口是否升级为WebSocket。部署服务时，默认值为false；更新服务配置时，默认值为上一次设置的值。 false：不升级为WebSocket。 true：升级为WebSocket。开启后，不支持修

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
部署模型为在线服务 - AI开发平台ModelArts

“升级为WebSocket” - 设置在线服务是否部署为WebSocket服务。了解在线服务支持WebSocket，请参考WebSocket在线服务全流程开发。说明：要求模型的元模型来源为从容器镜像中选择，并且镜像支持WebSocket。设置“升级为WebSocket”后，不支持设置“服务流量限制”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
配置Lite Server存储 - AI开发平台ModelArts

使用弹性文件服务SFS作为存储若使用SFS服务作为存储方案，推荐使用SFS Turbo文件系统。SFS Turbo提供按需扩展的高性能文件存储，还具备高可靠和高可用的特点，支持根据业务需要弹性扩容，且性能随容量增加而提升，可广泛应用于多种业务场景。在SFS服务控制台上创建文件系统，具体步骤请参考创建SFS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
扩缩容模型服务实例数 - AI开发平台ModelArts

在使用大型模型进行推理时，其业务需求会呈现出明显的峰谷波动。因此，模型服务必须具备灵活的扩缩容能力，以适应不同时间段内的用户负载变化，确保服务的高可用性和资源的高效利用。 ModelArts Studio大模型即服务平台支持手动扩缩容模型服务的实例数，该操作不会影响部署服务的正常运行。约束限制

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
更新服务配置 - AI开发平台ModelArts

启后不支持修改。 websocket_upgrade 否 Boolean 服务接口是否升级为WebSocket。部署服务时，默认值为false；更新服务配置时，默认值为上一次设置的值。 false：不升级为WebSocket。 true：升级为WebSocket。开启后，不支持修

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查看在线服务详情 - AI开发平台ModelArts

请勿打印无用的audio日志文件，这会导致系统日志卡死，无法正常显示日志，可能会出现“Failed to load audio”的报错。升级为WebSocket 是否升级为WebSocket服务。您可以进入在线服务的详情页面，通过切换页签查看更多详细信息，详情说明请参见表2。表2 在线服务详情参数说明

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
修复Standard专属资源池故障节点 - AI开发平台ModelArts

开启高可用冗余挑选无业务节点作为高可用冗余节点使用，在资源池详情页，“节点”页签下，在想要开启高可用冗余的节点操作列，单击“更多 > 开启高可用冗余”，设置成功后，该节点高可用冗余列标签变为“启用”。如果想批量设置节点开启高可用冗余，可勾选多个节点后，单击列表上方的“开启高可用冗余”按钮实现批量开启。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

大模型加载启动的时间一般大于普通的模型创建的服务，请配置合理的“部署超时时间”，避免尚未启动完成被认为超时而导致部署失败。添加环境变量部署服务时，增加如下环境变量，会将负载均衡的请求亲和策略配置为集群亲和，避免未就绪的服务实例影响预测成功率。 MODELARTS_SERVICE_TRAFFIC_POLICY: cluster

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
什么是ModelArts - AI开发平台ModelArts

ModelArts Edge 为客户提供了统一边缘部署和管理能力，支持统一纳管异构边缘设备，提供AI应用部署、Al应用和节点管理、资源池与负载均衡、应用商用保障等能力，帮助客户快速构建高性价比的边云协同AI解决方案。适用于边缘部署场景。 ModelArts Edge是白名单功能，如果有试用需求，请提工单申请。

帮助中心 > AI开发平台ModelArts > 产品介绍
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

华为云ModelArts服务视频训练作业容错检查功能介绍 04:48 了解什么是训练作业容错检查功能华为云ModelArts服务视频高可用冗余节点功能介绍 03:07 了解什么是高可用冗余节点功能操作指导开发一条Workflow 操作指导 5:55 开发一条Workflow VS Code连接Notebook

帮助中心 > AI开发平台ModelArts > 视频帮助
【下线公告】华为云ModelArts MindStudio/ML Studio/ModelBox镜像下线公告 - AI开发平台ModelArts

【下线公告】华为云ModelArts MindStudio/ML Studio/ModelBox镜像下线公告华为云ModelArts服务MindStudio，ML Studio，ModelBox镜像将在2024年6月30日00:00（北京时间）正式退市。下线范围下线Region：华为云全部Region

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告

总条数： 69

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么是弹性负载均衡 - 弹性负载均衡 ELB

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

如何启用WebSocket支持？ - 弹性负载均衡 ELB

使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

如何使用WebSocket - Astro轻应用 AstroZero

访问在线服务支持的传输协议 - AI开发平台ModelArts

用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

实时推理的部署及使用流程 - AI开发平台ModelArts

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

Standard推理部署 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

扩缩容模型服务实例数 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

查看在线服务详情 - AI开发平台ModelArts

修复Standard专属资源池故障节点 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

什么是ModelArts - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

【下线公告】华为云ModelArts MindStudio/ML Studio/ModelBox镜像下线公告 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线