搜索_华为云

非分离部署推理服务 - AI开发平台ModelArts

com/SafeAILab/EAGLE/ 版本实现，默认开启 export ENABLE_SPEC_METRIC=0 # 是否关闭投机推理的metric采集功能，关闭有助于提升投机推理性能，默认关闭如果需要使用eagle投机推理功能，需要进入 lm_tools/spec_decode/EAGLE 文

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 # 是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
Standard数据管理 - AI开发平台ModelArts

添加图片时，图片大小有限制吗？数据集图片无法显示，如何解决？如何将多个物体检测的数据集合并成一个数据集？导入数据集失败表格类型的数据集如何标注本地标注的数据，导入ModelArts需要做什么？为什么通过Manifest文件导入失败？标注结果存储在哪里？如何将标注结果下载至本地？

帮助中心 > AI开发平台ModelArts > 常见问题
JupyterLab常用功能介绍 - AI开发平台ModelArts

JupyterLab常用功能介绍 JupyterLab视频介绍 JupyterLab主页介绍下面介绍如何从运行中的Notebook实例打开JupyterLab。登录ModelArts管理控制台，在左侧菜单栏中选择“开发空间 > Notebook”，进入Notebook页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
SD WebUI推理方案概览 - AI开发平台ModelArts

SD WebUI推理方案概览本文档主要介绍如何在ModelArts的DevServer和ModelArts Standard环境上部署Stable Diffusion的WebUI套件，使用NPU卡进行推理。约束限制本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
如何知道是哪个节点是worker呢？ - AI开发平台ModelArts

多节点训练TensorFlow框架ps节点作为server会一直挂着，ModelArts是怎么判定训练任务结束？如何知道是哪个节点是worker呢？ TensorFlow框架分布式训练的情况下，会启动ps与worker任务组，worker任务组为关键任务组，会以worker任务组的进程退出码，判断训练作业是否结束。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
服务部署失败，报错ModelArts.3520，服务总数超限 - AI开发平台ModelArts

服务部署失败，报错ModelArts.3520，服务总数超限部署服务时，ModelArts报错“ModelArts.3520: 在线服务总数超限，限制为20”，接口返回“A maximum of xxx real-time services are allowed.”，表示服务数量超限。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
VS Code一键连接Notebook - AI开发平台ModelArts

port xxxxx: Connection refused”如何解决？报错“no such identity: C:/Users/xx /test.pem: No such file or directory”如何解决？报错“Bad owner or permissions

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
使用MaaS压缩模型 - AI开发平台ModelArts

选择是否打开“永久保存日志”开关。开关关闭（默认关闭）：表示不永久保存日志，则任务日志会在30天后会被清理。可以在任务详情页下载全部日志至本地。开关打开：表示永久保存日志，此时必须配置“日志路径”，系统会将任务日志永久保存至指定的OBS路径。事件通知选择是否打开“事件通知”开关。开关关闭（默认关闭）：表示不启用消息通知服务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
非分离部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 # 是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
训练作业的日志出现detect failed（昇腾预检失败） - AI开发平台ModelArts

失败。处理方法通过给训练作业加环境变量“MA_DETECT_TRAIN_INJECT_CODE”并将对应的值设置成0，就可以将预检功能关闭。环境变量说明参考查看训练容器环境变量。父主题： Ascend相关问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > Ascend相关问题
VS Code ToolKit连接Notebook - AI开发平台ModelArts

报错“Permissions for 'x:/xxx.pem' are too open”如何解决？报错“ssh: connect to host ModelArts-xxx port xxx: Connection timed out”如何解决？报错“Host key verification failed

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

息。 xxx 流量限制（QPS）设置待部署模型的流量限制QPS。 3 实例数设置服务器个数。推荐实例数 = 流量限制 ÷ 推荐的单实例流量限制 1 更多选项内容审核选择是否打开内容审核，默认启用。打开事件通知选择是否打开“事件通知”开关。关闭自动停止当使用付

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

#查询nginx进程 ps -ef |grep nginx #关闭所有nginx相关进程 kill -9 {进程ID} #运行run.sh脚本 sh run.sh 也可以执行pkill nginx命令直接关闭所有nginx进程。 #关闭所有nginx进程 pkill nginx #运行run

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
发布免费算法 - AI开发平台ModelArts

“指定用户”：表示仅特定用户可以查看及使用该资产。 “仅自己可见”：表示只有当前账号可以查看并使用该资产。设置“时长限制”。设置订阅者可以免费使用资产的时长，默认关闭，即无限期使用。如果打开时长限制，除了设置资产免费使用的时长，还可以设置到期后是否续订。如果是更新已发布资产的版本。 “发布方式”选择“添加资产版本”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
Notebook Cache盘告警上报 - AI开发平台ModelArts

s会挂载硬盘至“/cache”目录，用户可以使用此目录来储存临时文件。当前开发环境的Cache盘使用时，没有容量告警，在使用时很容易超过限制，并直接重启Notebook实例。重启后多种配置重置，会导致用户数据丢弃，环境丢失，造成很不好的使用体验。因此需要提供cache盘使用情况

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
创建模型失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

build task timed out”，没有详细构建日志。图1 模型镜像构建任务超时原因分析 imagePacker构建镜像有超时时间限制，默认值为30min（各区域可能存在差异）。当模型镜像构建时间太长，构建日志最后未能完成构建任务，构建超时中断，即会出现“Model image

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
在DevServer上部署SD WebUI推理服务 - AI开发平台ModelArts

在DevServer上部署SD WebUI推理服务本章节主要介绍如何在ModelArts的DevServer环境上部署Stable Diffusion的WebUI套件，使用NPU卡进行推理。步骤一准备环境请参考DevServer资源开通，购买DevServer资源，并确保

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成推理任务场景描述本案例介绍如何在Snt9B环境中利用Deployment机制部署在线推理服务。首先创建一个Pod以承载服务，随后登录至该Pod容器内部署在线服务，并最终通过新建一个终端作为客户端来访问并测试该在线服务的功能。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
查询算法列表 - AI开发平台ModelArts

算法uuid，创建算法时无需填写。 name String 算法名称。限制为1-64位只含数字、字母、下划线和中划线的名称。 description String 对算法的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 workspace_id String 指定算

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理

总条数： 944

上一页
1
...
14
15
16
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

非分离部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

Standard数据管理 - AI开发平台ModelArts

JupyterLab常用功能介绍 - AI开发平台ModelArts

SD WebUI推理方案概览 - AI开发平台ModelArts

如何知道是哪个节点是worker呢？ - AI开发平台ModelArts

服务部署失败，报错ModelArts.3520，服务总数超限 - AI开发平台ModelArts

VS Code一键连接Notebook - AI开发平台ModelArts

使用MaaS压缩模型 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

训练作业的日志出现detect failed（昇腾预检失败） - AI开发平台ModelArts

VS Code ToolKit连接Notebook - AI开发平台ModelArts

在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

发布免费算法 - AI开发平台ModelArts

Notebook Cache盘告警上报 - AI开发平台ModelArts

创建模型失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

在DevServer上部署SD WebUI推理服务 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

查询算法列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线