搜索_华为云

pipeline代码适配 - AI开发平台ModelArts

pipeline代码适配 onnx pipeline的主要作用是将onnx模型进行一系列编排，并在onnx Runtime上按照编排顺序执行。因此，需要将转换得到的mindir模型按照相同的逻辑进行编排，并在MindSpore Lite上执行。只需要将原始onnx的pipeline中涉及到onn

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

业务场景依赖的服务委托授权项说明配置建议在线服务 LTS lts:groups:create lts:groups:list lts:topics:create lts:topics:delete lts:topics:list 在线服务配置LTS日志上报。按需配置。批量服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
将AI应用部署为批量推理服务 - AI开发平台ModelArts

manifest”文件规范请参见Manifest文件规范。说明：输入数据为图片时，建议单张图片小于12MB。输入数据格式为csv时，建议不要包含中文。如需使用中文，请将文件编码格式设置为UTF-8编码。您可以使用代码方式转换文件编码格式，也可以将csv文件用记事本方式打开，在另存为弹出的窗口页面设置编码格式。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
Standard开发环境 - AI开发平台ModelArts

tebook实例中不支持不同引擎之间的切换。不同Region支持的AI引擎不一样，请以控制台实际界面为准。亮点特性4：提供在线的交互式开发调试工具JupyterLab ModelArts集成了基于开源的JupyterLab，可为您提供在线的交互式开发调试。您无需关注安装配置，

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
创建数据集 - AI开发平台ModelArts

101：命名实体 102：文本三元组 200：声音分类 201：语音内容 202：语音分割 400：表格数据集 600：视频标注 900：自由格式 data_sources 是表2 数据集输入位置，用于将此目录及子目录下的源数据(如图片/文件/音频等)同步到数据集。对于表格数据集，该参数为

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
团队标注的数据分配机制是什么？ - AI开发平台ModelArts

团队标注的数据分配机制是什么？目前不支持用户自定义成员任务分配，数据是平均分配的。当数量和团队成员人数不成比例，无法平均分配时，则将多余的几张图片，随机分配给团队成员。如果样本数少于待分配成员时，部分成员会存在未分配到样本的情况。样本只会分配给labeler，比如10000张都是未

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
使用AWQ量化 - AI开发平台ModelArts

o_awq.html。步骤二权重格式离线转换（可选）在GPU上AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

awq.html。 Step2 权重格式离线转换（可选）在GPU上AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

tor，其运行环境就是cpu.2u。部署在线服务Predictor，即将存储在OBS中的模型文件部署到线上服务管理模块提供的容器中运行，其环境规格（如CPU规格，GPU规格）由表3 predictor configs结构决定。部署在线服务Predictor需要线上服务端根据A

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
Standard自动学习 - AI开发平台ModelArts

的自动学习功能，让零AI基础的业务开发者可快速完成模型的训练和部署。 ModelArts自动学习，为入门级用户提供AI零代码解决方案支持图片分类、物体检测、预测分析、声音分类场景自动执行模型开发、训练、调优和推理机器学习的端到端过程根据最终部署环境和开发者需求的推理速度，自动调优并生成满足要求的模型

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
查看AI应用详情 - AI开发平台ModelArts

AI应用当前状态。部署类型 AI应用支持部署的服务类型。版本数量 AI应用的版本数量。请求模式在线服务的请求模式。同步请求：单次推理，可同步返回结果（约<60s）。例如: 图片、较小视频文件。异步请求：单次推理，需要异步处理返回结果（约>60s）。例如: 实时视频推理、大视频文件。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理AI应用
发布本地AI应用到AI Gallery - AI开发平台ModelArts

AI应用封面图否上传一张AI应用封面图，AI应用创建后，将作为AI应用页签的背景图展示在AI应用列表。建议使用16：9的图片，且大小不超过7MB。如果未上传图片，AI Gallery会为AI应用自动生成封面。应用描述否输入AI应用的功能介绍，AI应用创建后，将展示在AI应用页签上，方便其他用户了解与使用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
创建Workflow模型注册节点 - AI开发平台ModelArts

结构如下：表1 ModelStep 属性描述是否必填数据类型 name 模型注册节点的名称。只能包含英文字母、数字、下划线（_）、中划线（-），并且只能以英文字母开头，长度限制为64字符，一个Workflow里的两个step名称不能重复是 str inputs 模型注册节点的输入列表

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
管理AI Gallery模型 - AI开发平台ModelArts

像无法正常使用AI Gallery工具链服务（微调大师和在线推理服务）。说明：建议写清楚模型的使用方法，方便使用者更好的完成训练、推理任务。表2 任务类型支持的AI Gallery工具链服务任务类型微调大师在线推理服务 AI应用文本问答/文本生成支持支持支持其他类型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
监控资源 - AI开发平台ModelArts
监控资源 - AI开发平台ModelArts

操作一：如果训练作业使用多个计算节点，可以通过实例名称的下拉框切换节点。操作二：单击图例“cpuUsage”、“gpuMemUsage”、“gpuUtil”、“memUsage”“npuMemUsage”、“npuUtil”、可以添加或取消对应参数的使用情况图。操作三：鼠标悬浮在图片上的时间节点，可查看对应时间节点的占用率情况。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

WebUI如何...。 AI推理应用运行在昇腾设备上一般有两种方式：方式1：通过Ascend PyTorch，后端执行推理，又称在线推理。方式2：通过模型静态转换后，执行推理，又称离线推理。通常为了获取更好的推理性能，推荐使用方式2的离线推理。下文将以Diffusers img2img

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

--image-input-shape：输入图片维度，当前不支持图片动态维度，如果图片不是（1，336，336）shape，将会被resize。 --image-feature-size：图片输入解析维度大小；llava-v1.6图片输入维度与image-feature-size关系映射表见git；计算原理如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

--image-input-shape：输入图片维度，当前不支持图片动态维度，如果图片不是（1，336，336）shape，将会被resize。 --image-feature-size：图片输入解析维度大小；llava-v1.6图片输入维度与image-feature-size关系映射表见git；计算原理如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
非分离部署推理服务 - AI开发平台ModelArts

--image-input-shape：输入图片维度，当前不支持图片动态维度，如果图片不是（1，336，336）shape，将会被resize。 --image-feature-size：图片输入解析维度大小；llava-v1.6图片输入维度与image-feature-size关系映射表见git；计算原理如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
在DevServer上部署SD WebUI推理服务 - AI开发平台ModelArts

bird"}' 执行成功显示：图2 执行成功显示在浏览器输入http://{宿主机ip}:8183，可以访问前端页面，通过输入文字生成图片。图3 输入文字生成图片注意需要勾选Enable Flash Attention按钮。图4 Enable Flash Attention优化按钮

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）

总条数： 273

上一页
1
...
8
9
10
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pipeline代码适配 - AI开发平台ModelArts

给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

将AI应用部署为批量推理服务 - AI开发平台ModelArts

Standard开发环境 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

团队标注的数据分配机制是什么？ - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

Standard自动学习 - AI开发平台ModelArts

查看AI应用详情 - AI开发平台ModelArts

发布本地AI应用到AI Gallery - AI开发平台ModelArts

创建Workflow模型注册节点 - AI开发平台ModelArts

管理AI Gallery模型 - AI开发平台ModelArts

监控资源 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

在DevServer上部署SD WebUI推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线