搜索_华为云

附录：大模型推理常见问题 - AI开发平台ModelArts

drived max_model_len 解决方法：修改config.json文件中的"seq_length"的值，"seq_length"需要大于等于 --max-model-len的值。config.json存在模型对应的路径下，例如：/data/nfs/benchmark/t

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
服务管理概述 - AI开发平台ModelArts

服务管理概述服务管理，包括将已创建成功的模型部署为在线服务或本地服务。可以实现在线预测、本地预测、服务详情查询、查看服务日志等功能。这里的在线服务包括“predictor”和“transformer”两类，都包括下文描述的功能，本章节以“predictor”服务为例进行说明。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

"application/json" }, "response": { "Content-type": "application/json" } } ] 将模型部署为在线服务参考部署为在线服务将模型部署为在线服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
启动推理服务 - AI开发平台ModelArts

l-len的值必须小于config.json文件中的"seq_length"的值，否则推理预测会报错。config.json存在模型对应的路径下，例如：${container_work_dir}/chatglm3-6b/config.json。不同模型推理支持的max-model-len长度不同，具体差异请参见表1。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
更新服务配置 - AI开发平台ModelArts

在ModelArts notebook平台，Session鉴权无需输入鉴权参数；其它平台的Session鉴权请参考Session鉴权。方式1：根据部署在线服务生成的服务对象进行更新服务配置 1 2 3 4 5 6 7 8 9 10 from modelarts.session

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

从OBS中或者从容器镜像中导入模型时，开发者需要编写模型配置文件。模型配置文件描述模型用途、模型计算框架、模型精度、推理代码依赖包以及模型对外API接口。配置文件为JSON格式。配置文件中的“dependencies”，表示配置模型推理代码需要的依赖包，需要提供依赖包名、安装方式和版本约束的信息，详细参数见

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
停止计费 - AI开发平台ModelArts
停止计费 - AI开发平台ModelArts

flow、开发环境、模型训练、在线服务、专属资源池涉及到需要停止的计费项如下：自动学习：停止因运行自动学习作业而创建的训练作业和在线服务。删除存储到OBS中的数据及OBS桶。 Workflow：停止因运行Workflow作业而创建的训练作业和在线服务。删除存储到OBS中的数据及OBS桶。

帮助中心 > AI开发平台ModelArts > 计费说明
在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

"application/json" }, "response": { "Content-type": "application/json" } } ] 将模型部署为在线服务参考部署为在线服务将模型部署为在线服务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

“部署类型”：默认选择“在线服务”。参数填写完成后，单击“立即创建”。页面自动跳转至AI应用列表页面，等待创建结果，预计2分钟左右。当AI应用的状态变为“正常”时，表示创建成功。步骤5：部署为在线服务（CPU） AI应用创建成功后，可将其部署为在线服务，在部署时可使用CPU资源。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
在ModelArts的Notebook中如何设置VS Code背景色为豆沙绿？ - AI开发平台ModelArts

在ModelArts的Notebook中如何设置VS Code背景色为豆沙绿？在VS Code的配置文件settings.json中添加如下参数 "workbench.colorTheme": "Atom One Light", "workbench.colorCustomizations":

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
部署上线失败 - AI开发平台ModelArts

出现此问题，一般是因为后台服务故障导致的，建议稍等片刻，然后重新部署在线服务。如果重试超过3次仍无法解决，请获取如下信息，并联系华为云技术支持协助解决故障。获取服务ID。进入“部署上线>在线服务”页面，在服务列表中找到自动学习任务中部署的在线服务，自动学习部署的服务都是以“exeML-”开头的

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 部署上线
在ModelArts的Notebook中如何设置VS Code远端默认安装的插件？ - AI开发平台ModelArts

在ModelArts的Notebook中如何设置VS Code远端默认安装的插件？在VS Code的配置文件settings.json中添加remote.SSH.defaultExtensions参数，如自动安装Python和Maven插件，可配置如下。 "remote.SSH

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

tor，其运行环境就是cpu.2u。部署在线服务Predictor，即将存储在OBS中的模型文件部署到线上服务管理模块提供的容器中运行，其环境规格（如CPU规格，GPU规格）由表3 predictor configs结构决定。部署在线服务Predictor需要线上服务端根据A

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
服务部署 - AI开发平台ModelArts
服务部署 - AI开发平台ModelArts

服务部署自定义镜像模型部署为在线服务时出现异常部署的在线服务状态为告警服务启动失败服务部署、启动、升级和修改时，拉取镜像失败如何处理？服务部署、启动、升级和修改时，镜像不断重启如何处理？服务部署、启动、升级和修改时，容器健康检查失败如何处理？服务部署、启动、升级和修改时，资源不足如何处理？

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
自动学习训练后的模型是否可以下载？ - AI开发平台ModelArts

自动学习训练后的模型是否可以下载？不可以下载。但是您可以在AI应用管理页面查看，或者将此模型部署为在线服务。父主题： Standard自动学习

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
推理性能测试 - AI开发平台ModelArts

约束限制创建在线服务时，每秒服务流量限制默认为100次，若静态benchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
自定义镜像规范 - AI开发平台ModelArts

ms.json”决定镜像在部署推理服务时是否支持设置推理参数。如果在自定义镜像的“模型文件”下上传了“gallery_inference/inference_params.json”文件，则在推理启动脚本中需要使用环境变量来指定“inference_params.json”中的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
通过patch操作对服务进行更新 - AI开发平台ModelArts

操作类型，目前仅支持replace，代表值替换操作。 path 否 String 操作路径，符合标准的Json PATCH格式，代表以服务详情的Json返回体为基准，想要执行替换的值的目标路径（Json PATH）。当前支持且仅支持对模型相关所有参数的替换更新，因此前缀固定为“/config

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
删除服务 - AI开发平台ModelArts
删除服务 - AI开发平台ModelArts

删除服务存在如下两种删除方式。根据部署在线服务生成的服务对象删除服务。根据查询服务对象列表返回的服务对象删除服务。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。方式1：根据部署在线服务生成的服务对象删除服务

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
自定义模型规范 - AI开发平台ModelArts

调失败。 “train_params.json” 必选文件，训练参数文件，定义了模型训练的必要参数，例如训练方式、超参信息。该参数会显示在微调工作流的“作业设置”页面的算法配置和超参数设置里面。代码示例请参见train_params.json示例。 “dataset_readme

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型

总条数： 1000

上一页
1
...
4
5
6
...
50
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：大模型推理常见问题 - AI开发平台ModelArts

服务管理概述 - AI开发平台ModelArts

从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

停止计费 - AI开发平台ModelArts

在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

在ModelArts的Notebook中如何设置VS Code背景色为豆沙绿？ - AI开发平台ModelArts

部署上线失败 - AI开发平台ModelArts

在ModelArts的Notebook中如何设置VS Code远端默认安装的插件？ - AI开发平台ModelArts

在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

服务部署 - AI开发平台ModelArts

自动学习训练后的模型是否可以下载？ - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

自定义镜像规范 - AI开发平台ModelArts

通过patch操作对服务进行更新 - AI开发平台ModelArts

删除服务 - AI开发平台ModelArts

自定义模型规范 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线