搜索_华为云

ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

应用场景推理服务访问公网地址的场景，如：输入图片，先进行公网OCR服务调用，然后进行NLP处理；进行公网文件下载，然后进行分析；分析结果回调给公网服务终端。方案设计从推理服务的算法实例内部，访问公网服务地址的方案。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
更新消息订阅Subscription - AI开发平台ModelArts

更新消息订阅Subscription 功能介绍更新Workflow工作流已订阅的订阅信息。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI PUT /v2

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
将数据预热到SFS Turbo - AI开发平台ModelArts

flat 结束后可以看到如下目录结构： /mnt/sfs_turbo ├── training_data │ └── qwenvl_dataset #数据集目录 │ ├── chart_qa_train_ocr.json

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
MiniCPM-V2.0推理及LoRA微调基于Lite Server适配PyTorch NPU指导（6.3.910） - AI开发平台ModelArts

MiniCPM-V2.0具有领先的光学字符识别（OCR）和多模态理解能力。该模型在综合性OCR能力评测基准OCRBench上达到开源社区的最佳水平，甚至在场景文字理解方面实现接近 Gemini Pro 的性能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
查询消息订阅Subscription详情 - AI开发平台ModelArts

查询消息订阅Subscription详情功能介绍查询Workflow工作流已订阅的订阅信息详情。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
删除消息订阅Subscription - AI开发平台ModelArts

删除消息订阅Subscription 功能介绍删除已订阅的消息订阅Subscription。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI DELETE

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
新建消息订阅Subscription - AI开发平台ModelArts

新建消息订阅Subscription 功能介绍为Workflow工作流添加消息订阅功能。工作流已订阅的事件发生时，会产生消息提醒。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务背景说明 WebSocket是一种网络传输协议，可在单个TCP连接上进行全双工通信，位于OSI模型的应用层。WebSocket协议在2011年由IETF标准化为RFC 6455，后由RFC 7936补充规范。Web IDL中的WebSocket

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发背景说明 WebSocket是一种网络传输协议，可在单个TCP连接上进行全双工通信，位于OSI模型的应用层。WebSocket协议在2011年由IETF标准化为RFC 6455，后由RFC 7936补充规范

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
推理业务迁移评估表 - AI开发平台ModelArts

- 性能指标与预期例1：模型：YOLOv5 运行环境：Vnt1 单卡性能指标：QPS 100/s （两进程）性能约束：单次请求最大可以接受时延需小于100ms 性能预期：QPS 130/s 例2：模型：OCR 运行环境：6348（单核48U超线程）性能指标：QPS 10

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

obs://standard-qwenvl-7b ├── training_data │ └── qwenvl_dataset #数据集目录 │ ├── chart_qa_train_ocr.json

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

obs://standard-qwenvl-7b ├── training_data │ └── qwenvl_dataset #数据集目录 │ ├── chart_qa_train_ocr.json

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
模型包结构介绍 - AI开发平台ModelArts

模型包结构示例 TensorFlow模型包结构发布该模型时只需要指定到“ocr”目录。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
推理场景介绍 - AI开发平台ModelArts

推理场景介绍方案概览本方案介绍了在ModelArts的Lite k8s Cluster上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
推理场景介绍 - AI开发平台ModelArts

推理场景介绍方案概览本方案介绍了在ModelArts的Lite k8s Cluster上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
重置AppSecret - AI开发平台ModelArts

重置AppSecret 功能介绍重置指定API网关应用的AppSecret，只有APP的创建用户才可以重置AppSecret。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

- 性能指标与预期例1：模型：YOLOv5 运行环境：Vnt1 单卡性能指标：QPS 100/s （两进程）性能约束：单次请求最大可以接受时延需小于100ms 性能预期：QPS 130/s 例2：模型：OCR 运行环境：6348（单核48U超线程）性能指标：QPS 10

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
Open-Sora-Plan1.0基于Lite Server适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

Open-Sora-Plan1.0基于Lite Server适配PyTorch NPU训练推理指导（6.3.907）本文档主要介绍如何在ModelArts Lite Server上，使用PyTorch_npu+华为自研Ascend Snt9B硬件，完成Open-Sora-Plan1.0

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

下数据集结构： obs://standard-qwenvl-7b └── training_data └── qwenvl_dataset #数据集目录 ├── chart_qa_train_ocr.json

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

下数据集结构： obs://standard-qwenvl-7b └── training_data └── qwenvl_dataset #数据集目录 ├── chart_qa_train_ocr.json

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作

总条数： 759

上一页
1
2
3
4
5
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消