搜索_华为云

部署在线服务 - AI开发平台ModelArts

子网的网络ID，默认为空，当配置了vpc_id则此参数必填。需填写虚拟私有云控制台子网详情中显示的“网络ID”。通过子网可提供与其他网络隔离的、可以独享的网络资源。 security_group_id 否 String 安全组，默认为空，当配置了vpc_id则此参数必填。安全组起着虚拟防火墙的作用，为服务实例提供安

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

Step6 准备镜像创建ECS。参考ECS文档购买弹性云服务器。网络配置、高级配置等后续步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，并在控制台发送后续步骤中的远程命令。注意：创建的ECS虚拟机使用ARM镜像创建。图1 购买ECS 安装Docker。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.907） - AI开发平台ModelArts

Step6 准备镜像创建ECS。参考ECS文档购买弹性云服务器。网络配置、高级配置等后续步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，并在控制台发送后续步骤中的远程命令。注意：创建的ECS虚拟机使用ARM镜像创建。图1 购买ECS 安装Docker。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

Step6 准备镜像创建ECS。参考ECS文档购买弹性云服务器。网络配置、高级配置等后续步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，并在控制台发送后续步骤中的远程命令。注意：创建的ECS虚拟机使用ARM镜像创建。图1 购买ECS 安装Docker。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
环境准备 - AI开发平台ModelArts
环境准备 - AI开发平台ModelArts

运行实例图3 线上Notebook入口 ModelArts Lite DevServer 开通裸金属服务器资源请见DevServer资源开通，在裸金属服务器上搭建迁移环境请见裸金属服务器环境配置指导。父主题： GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
使用ModelArts Studio的Llama3.1-8B模型框架实现对话问答 - AI开发平台ModelArts

图5 资源设置表2 部署模型服务参数说明取值样例服务设置服务名称自定义模型服务的名称。 service-llama3 描述部署模型服务的简介。 - 模型设置部署模型当从“我的模型”进入部署模型服务页面时，此处默认呈现选择的模型。 llama3.1 资源设置资源池类型

 帮助中心 > AI开发平台ModelArts > 快速入门
使用MaaS部署模型服务 - AI开发平台ModelArts

单击“选择模型”，从“我的模型”列表中选择需要部署的模型。资源设置资源池类型资源池分为公共资源池与专属资源池。公共资源池供所有租户共享使用。专属资源池需单独创建，不与其他租户共享。实例规格选择实例规格，规格中描述了服务器类型、型号等信息。流量限制（QPS）设置待部署模型的流量限制QPS。单位：次/秒

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
实时推理的部署及使用流程 - AI开发平台ModelArts

协议：使用WebSocket协议的方式访问在线服务：WebSocket使得客户端和服务器之间的数据交换变得更加简单，允许服务端主动向客户端推送数据。在WebSocket API中，浏览器和服务器只需要完成一次握手，两者之间就可以建立持久性的连接，并进行双向数据传输。使用Server-Sent

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
管理Lite Cluster节点 - AI开发平台ModelArts

留。 - 重部署：通过更换为新服务器实现修复，修复耗时较短，本地盘数据会丢失。修复期间实例将无法工作，请确保相关实例业务已离线。如果云服务器上的业务不可停止，请勿修复，并联系技术支持进行处理。若选择了重部署修复方式，实例会立即关机并迁移到新服务器，本地盘数据会被清空，请提前做好业务迁移和数据备份。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
基本配置 - AI开发平台ModelArts
基本配置 - AI开发平台ModelArts

基本配置权限配置创建网络专属资源池VPC打通 ECS服务器挂载SFS Turbo存储在ECS中创建ma-user和ma-group obsutil安装和配置（可选）工作空间配置父主题：专属资源池训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
模型调试 - AI开发平台ModelArts
模型调试 - AI开发平台ModelArts

python包的下载源。 pip_packages 否 List conda虚拟环境需要使用的python包，如tensorflow，pillow等。 conda_packages 否 List conda虚拟环境需要使用的conda包，如指定python版本。表4 params结构

 帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
Lite Server算力资源和镜像版本配套关系 - AI开发平台ModelArts

Server算力资源和镜像版本配套关系 Lite Server提供多种NPU、GPU镜像，您可在购买前了解当前支持的镜像及对应详情。 NPU Snt9裸金属服务器支持的镜像详情镜像名称：ModelArts-Euler2.8_Aarch64_Snt9_C78 表1 镜像详情软件类型版本详情操作系统

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
调用MaaS部署的模型服务 - AI开发平台ModelArts

Int 控制要考虑的前几个Tokens的数量的整数。设置为“-1”表示考虑所有Tokens。适当降低该值可以减少采样时间。 top_p 否 1.0 Float 控制要考虑的前几个Tokens的累积概率的浮点数。取值范围：0~1 设置为“1”表示考虑所有Tokens。 temperature

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
创建Workflow服务部署节点 - AI开发平台ModelArts

在服务部署节点启动之后会等待用户设置相关配置信息，配置完成后直接单击“继续运行”即可。异步推理服务部署相关信息配置操作在ModelArts管理控制台，左侧菜单栏选择“Workflow”进入Workflow页面。在服务部署节点启动之后会等待用户设置相关配置信息，选择模型及版本为异步推理模型，设置服务启

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
配额与限制 - AI开发平台ModelArts

Cluster或Lite Server时，所需的ECS实例数、内存大小、CPU核数和EVS硬盘大小等等资源会超出华为云默认提供的资源配额，因此需要申请扩大配额。具体配额项如下。表1 ModelArts Lite涉及的资源配额服务资源类型 ECS资源类型 ECS实例数 CPU核心数 RAM容量（MB）

帮助中心 > AI开发平台ModelArts > 产品介绍
配置ModelArts委托授权 - AI开发平台ModelArts

30天。图7 手动创建的委托在授权记录页面单击“授权”，勾选要配置的策略，单击下一步设置最小授权范围，单击确定，完成授权修改。设置最小授权范围时，可以选择指定的区域，也可以选择所有区域，即不设置范围。删除授权为了更好的管理您的授权，您可以删除某一IAM用户的授权，也可批量清空所有用户的授权。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
费用账单 - AI开发平台ModelArts
费用账单 - AI开发平台ModelArts

ID”，并输入步骤1中复制的Notebook的ID，单击图标即可搜索该资源的账单。图1 查询资源账单这里设置的统计维度为“按使用量”，统计周期为“按账期”，您也可以设置其他统计维度和周期，详细介绍请参见流水与明细账单。查看训练作业的账单 ModelArts训练作业查询资源账

 帮助中心 > AI开发平台ModelArts > 计费说明
ModelArts CLI命令功能介绍 - AI开发平台ModelArts

命令。为了方便理解，下面将ModelArts CLI统称为ma-cli。ma-cli支持用户在ModelArts Notebook及线下虚拟机中与云端服务交互，使用ma-cli命令可以实现命令自动补全、鉴权、镜像构建、提交ModelArts训练作业、提交DLI Spark作业、OBS数据复制等。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
在ModelArts Studio基于Llama3-8B模型实现新闻自动分类 - AI开发平台ModelArts

/maas-test/news/out 超参设置迭代步数/Iterations 设置模型参数/权重更新的次数。在调优过程中，每一个Iterations会消耗32条训练数据。参见表3 学习率/learning_rate 设置每个迭代步数（iteration）模型参数/权重更新的速率。学习率设置得过高会导致模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
快速配置ModelArts委托授权 - AI开发平台ModelArts

30天。图7 手动创建的委托在授权记录页面单击“授权”，勾选要配置的策略，单击下一步设置最小授权范围，单击确定，完成授权修改。设置最小授权范围时，可以选择指定的区域，也可以选择所有区域，即不设置范围。删除授权为了更好的管理您的授权，您可以删除某一IAM用户的授权，也可批量清空所有用户的授权。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权

总条数： 887

上一页
1
...
6
7
8
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署在线服务 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.907） - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

环境准备 - AI开发平台ModelArts

使用ModelArts Studio的Llama3.1-8B模型框架实现对话问答 - AI开发平台ModelArts

使用MaaS部署模型服务 - AI开发平台ModelArts

实时推理的部署及使用流程 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

基本配置 - AI开发平台ModelArts

模型调试 - AI开发平台ModelArts

Lite Server算力资源和镜像版本配套关系 - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

创建Workflow服务部署节点 - AI开发平台ModelArts

配额与限制 - AI开发平台ModelArts

配置ModelArts委托授权 - AI开发平台ModelArts

费用账单 - AI开发平台ModelArts

ModelArts CLI命令功能介绍 - AI开发平台ModelArts

在ModelArts Studio基于Llama3-8B模型实现新闻自动分类 - AI开发平台ModelArts

快速配置ModelArts委托授权 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线