搜索_华为云

使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

Socket（双向实时），它更加轻量级且易于实现。前提条件在线服务中的模型导入选择的镜像需支持SSE协议。约束与限制 SSE协议只支持部署在线服务。只支持自定义镜像导入模型部署的在线服务。调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

1234 随机种子数。每次数据采样时，保持一致。 CONVERT_MG2HF True 表示训练完成的权重文件会自动转换为Hugging Face格式权重。如果不需要自动转换，则删除该环境变量。对于Yi系列模型、ChatGLMv3-6B和Qwen系列模型，还需要手动修改训练参数和to

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908）
LoRA微调训练 - AI开发平台ModelArts

1234 随机种子数。每次数据采样时，保持一致。 CONVERT_MG2HF True 表示训练完成的权重文件会自动转换为Hugging Face格式权重。如果不需要自动转换，则删除该环境变量。对于ChatGLMv3-6B、GLMv4-9B和Qwen系列模型，还需要手动修改token

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908）
查询预置算法 - AI开发平台ModelArts

"[{\"label\":\"batch_size\",\"value\":\"4\",\"placeholder_cn\":\"每次更新训练的图片数量（总）\",\"placeholder_en\":\"\",\"required\":true},{\"label\":\"lr\",\"value\":\"0

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

通过Token认证的方式访问在线服务通过AK/SK认证的方式访问在线服务通过APP认证的方式访问在线服务父主题：访问在线服务支持的访问通道

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
查询单个智能标注样本的信息 - AI开发平台ModelArts

Long 样本时间，OBS最后修改时间。 sample_type Integer 样本类型。可选值如下： 0：图像 1：文本 2：语音 4：表格 6：视频 9：自由格式 score String 综合评分，用于团队标注。 source String 样本数据源地址。 sub_sample_url

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

针对每一个数据集版本，您可以通过“存储路径”参数，获得此版本对应的Manifest文件格式的数据集。可用于导入数据或难例筛选操作。表格数据集暂不支持切换版本。发布数据集版本登录ModelArts管理控制台，在左侧菜单栏中选择“资产管理> 数据集”，进入“数据集”管理页面在数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
查看ModelArts模型详情 - AI开发平台ModelArts

模型的当前最新版本。状态模型当前状态。部署类型模型支持部署的服务类型。版本数量模型的版本数量。请求模式在线服务的请求模式。同步请求：单次推理，可同步返回结果（约<60s）。例如: 图片、较小视频文件。异步请求：单次推理，需要异步处理返回结果（约>60s）。例如: 实时视频推理、大视频文件。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
服务部署 - AI开发平台ModelArts
服务部署 - AI开发平台ModelArts

服务部署自定义镜像模型部署为在线服务时出现异常部署的在线服务状态为告警服务启动失败服务部署、启动、升级和修改时，拉取镜像失败如何处理？服务部署、启动、升级和修改时，镜像不断重启如何处理？服务部署、启动、升级和修改时，容器健康检查失败如何处理？服务部署、启动、升级和修改时，资源不足如何处理？

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
在线服务 - AI开发平台ModelArts
在线服务 - AI开发平台ModelArts

在线服务部署在线服务时，自定义预测脚本python依赖包出现冲突，导致运行出错在线服务预测时，如何提高预测速度？调整模型后，部署新版本AI应用能否保持原API接口不变？在线服务的API接口组成规则是什么？在线服务运行中但是预测失败时，如何排查报错是不是模型原因导致的在

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线
FlUX.1基于DevServer适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

参数说明如下： --width ：生成图片的宽 --height：生成图片的长 --num_inference_steps：推理步数 --dynamo: 使用图模式。如果使用该参数，则首次编译时间较长，请耐心等待。推理完成后，生成的图片image_1024x688.png保存在当前路径下，如下图所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
创建数据集版本 - AI开发平台ModelArts

1：物体检测 3：图像分割 100：文本分类 101：命名实体 102：文本三元组 200：声音分类 201：语音内容 202：语音分割 400：表格数据集 600：视频标注 900：自由格式 label_task_id 否 String 基于标注任务创建数据集版本，标注任务ID。 description

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集版本管理
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

模型，加载模型，执行预处理，完成推理，拼装响应体等。操作步骤 WebSocket在线服务开发操作步骤如下：上传镜像至容器镜像服务使用镜像创建模型使用模型部署在线服务 WebSocket在线服务调用上传镜像至容器镜像服务将准备好的本地镜像上传到容器镜像服务（SWR）。使用镜像创建模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
部署上线失败 - AI开发平台ModelArts

出现此问题，一般是因为后台服务故障导致的，建议稍等片刻，然后重新部署在线服务。如果重试超过3次仍无法解决，请获取如下信息，并联系华为云技术支持协助解决故障。获取服务ID。进入“部署上线>在线服务”页面，在服务列表中找到自动学习任务中部署的在线服务，自动学习部署的服务都是以“exeML-”开头的

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 部署上线
非分离部署推理服务 - AI开发平台ModelArts

lm_tools/spec_decode/EAGLE 文件夹，使用convert_eagle_ckpt_to_vllm_compatible.py脚本进行权重转换。转换命令为 python convert_eagle_ckpt_to_vllm_compatible.py --base-path 大模型权重地址

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
非分离部署推理服务 - AI开发平台ModelArts

--image-input-shape：输入图片维度，当前不支持图片动态维度，如果图片不是（1，336，336）shape，将会被resize。 --image-feature-size：图片输入解析维度大小；llava-v1.6图片输入维度与image-feature-size关系映射表见git；计算原理如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
非分离部署推理服务 - AI开发平台ModelArts

lm_tools/spec_decode/EAGLE文件夹，使用convert_eagle_ckpt_to_vllm_compatible.py脚本进行权重转换。转换命令为 python convert_eagle_ckpt_to_vllm_compatible.py --base-path 大模型权重地址

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
预测API的域名停用公告 - AI开发平台ModelArts

的预测API的域名。如果您使用的是VPC内部节点访问ModelArts推理的在线服务，预测API切换域名后，由于内网VPC无法识别公网域名，请提交工单联系华为云技术支持打通网络。父主题：产品变更公告

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品变更公告
更新团队标注验收任务状态 - AI开发平台ModelArts

Long 样本时间，OBS最后修改时间。 sample_type Integer 样本类型。可选值如下： 0：图像 1：文本 2：语音 4：表格 6：视频 9：自由格式 score String 综合评分，用于团队标注。 source String 样本数据源地址。 sub_sample_url

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询单个样本信息 - AI开发平台ModelArts

Long 样本时间，OBS最后修改时间。 sample_type Integer 样本类型。可选值如下： 0：图像 1：文本 2：语音 4：表格 6：视频 9：自由格式 score String 综合评分，用于团队标注。 source String 样本数据源地址。 sub_sample_url

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 1251

上一页
1
...
12
13
14
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

查询预置算法 - AI开发平台ModelArts

通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

查询单个智能标注样本的信息 - AI开发平台ModelArts

发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

查看ModelArts模型详情 - AI开发平台ModelArts

服务部署 - AI开发平台ModelArts

在线服务 - AI开发平台ModelArts

FlUX.1基于DevServer适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

创建数据集版本 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

部署上线失败 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

预测API的域名停用公告 - AI开发平台ModelArts

更新团队标注验收任务状态 - AI开发平台ModelArts

查询单个样本信息 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线