搜索_华为云

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

模型，加载模型，执行预处理，完成推理，拼装响应体等。操作步骤 WebSocket在线服务开发操作步骤如下：上传镜像至容器镜像服务使用镜像创建模型使用模型部署在线服务 WebSocket在线服务调用上传镜像至容器镜像服务将准备好的本地镜像上传到容器镜像服务（SWR）。使用镜像创建模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
训练benchmark工具 - AI开发平台ModelArts

训练benchmark工具工具介绍及准备工作训练性能测试训练精度测试父主题：主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

ModelArts支持在开发环境中开启TensorBoard可视化工具。TensorBoard是TensorFlow的可视化工具包，提供机器学习实验所需的可视化功能和工具。 TensorBoard是一个可视化工具，能够有效地展示TensorFlow在运行过程中的计算图、各种指标随

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
ModelArts中常用概念 - AI开发平台ModelArts

指按某种策略由已知判断推出新判断的思维过程。人工智能领域下，由机器模拟人类智能，使用构建的神经网络完成推理过程。在线推理在线推理是对每一个推理请求同步给出推理结果的在线服务（Web Service）。批量推理批量推理是对批量数据进行推理的批量作业。昇腾芯片昇腾芯片又叫As

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

单击“确定”，完成DNS内网域名的创建。 VPC访问在线服务通过VPC访问通道访问在线服务，API如下： https://{DNS内网域名}/{URL} DNS内网域名：设置的内网域名。您还可以通过在线服务列表页，单击“VPC访问通道”，打开弹出框，查看“访问域名”。 URL：在线服务的URL为服务详情页

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
部署模型为在线服务 - AI开发平台ModelArts

部署模型为在线服务模型准备完成后，您可以将模型部署为在线服务，对在线服务进行预测和调用。约束与限制单个用户最多可创建20个在线服务。前提条件数据已完成准备：已在ModelArts中创建状态“正常”可用的模型。由于在线运行需消耗资源，确保账户未欠费。部署服务操作需要镜

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
创建在线服务包 - AI开发平台ModelArts

创建在线服务包功能介绍计费工作流购买资源。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/workfl

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

VPC直连的高速访问通道，目前只支持访问在线服务。因流量限控，获取在线服务的IP和端口号次数有限制，每个主账号租户调用次数不超过2000次/分钟，每个子账号租户不超过20次/分钟。目前仅支持自定义镜像导入模型，部署的服务支持高速访问通道。操作步骤使用VPC直连的高速访问通道访问在线服务，基本操作步骤如下：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

通过Token认证的方式访问在线服务通过AK/SK认证的方式访问在线服务通过APP认证的方式访问在线服务父主题：访问在线服务支持的访问通道

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
服务部署失败，报错No Module named XXX - AI开发平台ModelArts

XXX，表示模型中没有导入对应依赖模块。处理方法依赖模块没有导入，需要您在模型推理代码中导入缺失依赖模块。例如您的模型是Pytorch框架，部署为在线服务时出现告警：ModuleNotFoundError: No module named ‘model_service.tfserving

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
创建工作空间 - AI开发平台ModelArts

创建工作空间功能介绍创建工作空间（"default"为系统预留的默认工作空间名称，不能使用）。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v1/

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 AI Gallery支持将训练的模型或创建的模型资产部署为在线推理服务，可供用户直接调用API完成推理业务。约束限制如果模型的“任务类型”是“文本问答”或“文本生成”，则支持在线推理。如果模型的“任务类型”是除“文本问答”和“文本

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

Socket（双向实时），它更加轻量级且易于实现。前提条件在线服务中的模型导入选择的镜像需支持SSE协议。约束与限制 SSE协议只支持部署在线服务。只支持自定义镜像导入模型部署的在线服务。调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

ster”已指向最新一次的提交。同时在GitHub对应仓库的commit记录中也可以查找到对应的信息。父主题：通过JupyterLab在线使用Notebook实例进行AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
安装Gallery CLI配置工具 - AI开发平台ModelArts

在节点页签，单击选择“配置工具”，弹出该节点的配置工具页面。在配置工具页面，单击“下载”启动下载任务。当配置工具的状态记录中“工具状态”为“下载完成”时表示下载完成，工具包存放在“下载位置”的目录下。如果下载失败，单击“下载”可以重新下载。登录云服务器查看工具包是否下载成功。在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
在线服务预测报错ModelArts.4206 - AI开发平台ModelArts

在线服务预测报错ModelArts.4206 问题现象在线服务部署完成且服务已经处于“运行中”的状态，向服务发起推理请求，报错“ModelArts.4206”。原因分析 ModelArts.4206表示该API的请求流量超过了设定值。为了保证服务的平稳运行，ModelArts

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在线服务预测报错DL.0105 - AI开发平台ModelArts

在线服务预测报错DL.0105 问题现象在线服务预测报错DL.0105，报错日志：“TypeError:‘float’object is not subscriptable”。原因分析根据报错日志分析，是因为一个float数据被当做对象下标访问了。处理方法将模型推理代码

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
使用AWQ量化工具转换权重 - AI开发平台ModelArts

过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?sort=trending&search=QWEN+AWQ 方式二：使用AutoAWQ量化工具进行量化。 1、使用该量化工具，需要切换conda环境。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 问题现象在线服务部署完成且服务已经处于“运行中”的状态后，向运行的服务发起推理请求，报错ModelArts.4503。原因分析及处理方法服务预测报错ModelArts.4503有多种场景，常见场景如下：通信出错请求报错：{"

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在线服务预测报错ModelArts.4302 - AI开发平台ModelArts

在线服务预测报错ModelArts.4302 问题现象在线服务部署完成且服务已经处于“运行中”的状态后，向运行的服务发起推理请求，报错ModelArts.4302。原因分析及处理方法服务预测报错ModelArts.4302有多种场景，以下主要介绍两种场景： "error_msg":

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测

总条数： 1763

上一页
1
2
3
4
5
...
89
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

训练benchmark工具 - AI开发平台ModelArts

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

创建在线服务包 - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

服务部署失败，报错No Module named XXX - AI开发平台ModelArts

创建工作空间 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

在线服务预测报错ModelArts.4206 - AI开发平台ModelArts

在线服务预测报错DL.0105 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

在线服务预测报错ModelArts.4302 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线