检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应用场景 推理服务访问公网地址的场景,如: 输入图片,先进行公网OCR服务调用,然后进行NLP处理; 进行公网文件下载,然后进行分析; 分析结果回调给公网服务终端。 方案设计 从推理服务的算法实例内部,访问公网服务地址的方案。
新建消息订阅Subscription 功能介绍 为Workflow工作流添加消息订阅功能。工作流已订阅的事件发生时,会产生消息提醒。 接口约束 无 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK
ModelArts Standard的WebSocket在线服务全流程开发 背景说明 WebSocket是一种网络传输协议,可在单个TCP连接上进行全双工通信,位于OSI模型的应用层。WebSocket协议在2011年由IETF标准化为RFC 6455,后由RFC 7936补充规范
flat 结束后可以看到如下目录结构: /mnt/sfs_turbo ├── training_data │ └── qwenvl_dataset #数据集目录 │ ├── chart_qa_train_ocr.json
MiniCPM-V2.0具有领先的光学字符识别(OCR)和多模态理解能力。该模型在综合性OCR能力评测基准OCRBench上达到开源社区的最佳水平,甚至在场景文字理解方面实现接近 Gemini Pro 的性能。
使用WebSocket协议的方式访问在线服务 背景说明 WebSocket是一种网络传输协议,可在单个TCP连接上进行全双工通信,位于OSI模型的应用层。WebSocket协议在2011年由IETF标准化为RFC 6455,后由RFC 7936补充规范。Web IDL中的WebSocket
查询消息订阅Subscription详情 功能介绍 查询Workflow工作流已订阅的订阅信息详情。 接口约束 无 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET
obs://standard-qwenvl-7b ├── training_data │ └── qwenvl_dataset #数据集目录 │ ├── chart_qa_train_ocr.json
obs://standard-qwenvl-7b ├── training_data │ └── qwenvl_dataset #数据集目录 │ ├── chart_qa_train_ocr.json
- 性能指标与预期 例1: 模型:YOLOv5 运行环境:Vnt1 单卡 性能指标:QPS 100/s (两进程) 性能约束:单次请求最大可以接受时延需小于100ms 性能预期:QPS 130/s 例2: 模型:OCR 运行环境:6348(单核48U超线程) 性能指标:QPS 10
删除消息订阅Subscription 功能介绍 删除已订阅的消息订阅Subscription。 接口约束 无 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI DELETE
推理场景介绍 方案概览 本方案介绍了在ModelArts的Lite k8s Cluster上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B
推理场景介绍 方案概览 本方案介绍了在ModelArts的Lite k8s Cluster上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B
重置AppSecret 功能介绍 重置指定API网关应用的AppSecret,只有APP的创建用户才可以重置AppSecret。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
模型包结构示例 TensorFlow模型包结构 发布该模型时只需要指定到“ocr”目录。
更新消息订阅Subscription 功能介绍 更新Workflow工作流已订阅的订阅信息。 接口约束 无 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI PUT /v2
下数据集结构: obs://standard-qwenvl-7b └── training_data └── qwenvl_dataset #数据集目录 ├── chart_qa_train_ocr.json
下数据集结构: obs://standard-qwenvl-7b └── training_data └── qwenvl_dataset #数据集目录 ├── chart_qa_train_ocr.json
- 性能指标与预期 例1: 模型:YOLOv5 运行环境:Vnt1 单卡 性能指标:QPS 100/s (两进程) 性能约束:单次请求最大可以接受时延需小于100ms 性能预期:QPS 130/s 例2: 模型:OCR 运行环境:6348(单核48U超线程) 性能指标:QPS 10
Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导(6.3.910) 本文档主要介绍如何在ModelArts Lite DevServer上,使用PyTorch_npu+华为自研Ascend Snt9B硬件,完成Open-Sora 1.2 训练和推理