搜索_华为云

Lite Cluster资源配置流程 - AI开发平台ModelArts

绑定完成后，通过MobaXterm、Xshell登录。以MobaXterm为例，填入弹性公网IP，登录节点。图7 登录节点方式2：通过华为云自带的远程登录功能使用华为云账号登录CCE管理控制台。在CCE集群详情页面，单击“节点管理”页签，在“节点”页签中单击需要登录的节点名称，跳转至弹性云服务器页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

buildkit由两部分组成： buildkitd（服务端）：负责镜像构建，目前支持runc和containerd作为镜像构建环境，默认是runc。 buildkitctl（客户端）：负责解析Dockerfile文件，并向服务端buildkitd发出构建请求。下载并解压buildkit程序。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

产品优势 ModelArts服务具有以下产品优势。稳定安全的算力底座，极快至简的模型训练支持万节点计算集群管理。大规模分布式训练能力，加速大模型研发。提供高性价比国产算力。多年软硬件经验沉淀，AI场景极致优化。加速套件，训练、推理、数据访问多维度加速。一站式端到端生产工具链，一致性开发体验

 帮助中心 > AI开发平台ModelArts > 产品介绍
修复Standard专属资源池故障节点 - AI开发平台ModelArts

授权技术支持定位故障华为云技术支持在故障定位和性能诊断时，部分运维操作需要用户授权才可进行。您可在资源池详情页的节点页签下，找到对应节点，在操作列单击“更多 > 授权”，在弹出的提示框中单击“确认”即可完成授权。正常情况下，该授权按钮为置灰状态。当华为云技术支持发起运维申请后，按钮会变为可点状态。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
Lite Server高危操作一览表 - AI开发平台ModelArts

内核版本不兼容，从而导致OS无法启动，或者基本功能不可用。相关高危命令如：apt-get upgrade。高如果需要升级/修改，请联系华为云技术支持。切换或者重置操作系统。服务器在进行过“切换或者重置操作系统”操作后，EVS系统盘ID发生变化，和下单时订单中的EVS ID已经不一致，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
管理Lite Cluster节点 - AI开发平台ModelArts

修复节点授权运维华为云技术支持在故障定位和性能诊断时，部分运维操作需要用户授权才可进行。您可在资源池详情页的节点页签下，找到对应节点，在操作列单击“更多 > 授权”，在弹出的提示框中单击“确认”即可完成授权。图3 授权正常情况下，该授权按钮为置灰状态。当华为云技术支持发起运维申请后，按钮会变为可点状态。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

"application/json" } } ] 将模型部署为在线服务参考部署为在线服务将模型部署为在线服务。在线服务创建成功后，您可以在服务详情页查看服务详情。您可以通过“预测”页签访问在线服务。图5 访问在线服务父主题： Standard推理部署

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

SFT和LoRA微调使用的Alpaca数据集下载：https://huggingface.co/datasets/QingyiSi/Alpaca-CoT/blob/main/alpacaGPT4/alpaca_gpt4_data.json，数据大小：43.6 MB。自定义数据预训练数据：用户也可以自行准备预训练数据。数据要求如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
获取项目ID和名称 - AI开发平台ModelArts

注册并登录管理ModelArts控制台。在页面右上角单击用户名，然后在下拉列表中单击“我的凭证”，进入“我的凭证”页面。如果您登录的是华为云官网，而非管理控制台。在单击用户名后，选择下拉列表中的“帐号中心”，然后单击“管理我的凭证”进入“我的凭证”页面。在“API凭证”页面

 帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

run”，驱动包名称为“Ascend-hdk-型号-npu-driver_版本号_linux-aarch64.run”，商用版是权限受控，仅华为工程师和渠道用户有权限下载，下载地址请见固件驱动包下载链接。 arch cat /etc/os-release 图5 查看机器操作系统版本及架构

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
配置Lite Server网络 - AI开发平台ModelArts

单个弹性公网IP用于多个Server服务器所有Server资源必须位于同一个VPC，并且该VPC没有NAT网关以及默认路由。购买弹性公网IP。登录华为云管理控制台。在左侧服务列表中，单击“网络 > 弹性公网IP EIP”，进入弹性公网IP页面。单击“购买弹性公网IP”。参数配置可使用默认值，单击“立即购买”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
服务管理概述 - AI开发平台ModelArts

服务管理概述服务管理，包括将已创建成功的模型部署为在线服务或本地服务。可以实现在线预测、本地预测、服务详情查询、查看服务日志等功能。这里的在线服务包括“predictor”和“transformer”两类，都包括下文描述的功能，本章节以“predictor”服务为例进行说明。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
创建Workflow服务部署节点 - AI开发平台ModelArts

创建Workflow服务部署节点功能介绍通过对ModelArts服务管理能力的封装，实现Workflow新增服务和更新服务的能力。主要应用场景如下：将模型部署为一个Web Service。更新已有服务，支持灰度更新等能力。属性总览您可以使用ServiceStep来构建服务部署节点，ServiceStep结构如下

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
查询服务监控信息 - AI开发平台ModelArts

查询服务监控信息查询当前服务对象监控信息。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。方式1：根据部署在线服务生成的服务对象进行查询服务监控 1 2 3 4 5 6 7 from

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
设置断点续训练 - AI开发平台ModelArts

首次训练的epoch初始值，mindspore1.3及以后版本会支持定义epoch_size初始值。 # cur_epoch_num = 0 # 判断输出obs路径中是否有模型文件。如果无文件则默认从头训练，如果有模型文件，则加载epoch值最大的ckpt文件当做预训练模型。 if os.listdir(train_url):

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

关于Ant8裸金属服务器的购买，可以在华为云官网提工单至ModelArts云服务，完成资源的申请。步骤1 安装模型安装Megatron-DeepSpeed框架。使用root用户SSH的方式登录GPU裸金属服务器。具体登录方式请参见SSH密钥方式登录裸金属服务器。拉取pyt

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
更新模型服务的单个属性 - AI开发平台ModelArts

更新模型服务的单个属性功能介绍更新模型服务的单个属性，目前只支持instance_count(更新模型服务实例数量)，仅运行中、告警、异常状态下的在线服务可以执行该操作。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
安装Gallery CLI配置工具 - AI开发平台ModelArts

iam_user”和“iam_password”；如果使用AK/SK认证，则需要填写配置项“iam_ak”、“iam_sk”和加密配置。华为账号只能使用AK/SK认证。如果要使用账号密码认证，且必须先创建一个IAM用户再获取IAM用户名和密码进行认证，操作指导请参见创建IAM用户。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
Wav2Lip推理基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

本方案介绍了在ModelArts的DevServer上使用昇腾计算资源部署Wav2Lip模型用于推理的详细过程。完成本方案的部署，需要先联系您所在企业的华为方技术支持购买DevServer资源。本方案目前仅适用于企业客户。资源规格要求推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
CogVideoX1.5 5b模型基于DevServer适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

本方案介绍了在ModelArts的DevServer上使用昇腾计算资源开展CogVideoX1.5 5b全量微调的详细过程。完成本方案的部署，需要先联系您所在企业的华为方技术支持购买DevServer资源。本方案目前仅适用于企业客户。资源规格要求推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理

总条数： 1726

上一页
1
...
71
72
73
...
87
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Lite Cluster资源配置流程 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

修复Standard专属资源池故障节点 - AI开发平台ModelArts

Lite Server高危操作一览表 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

获取项目ID和名称 - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

配置Lite Server网络 - AI开发平台ModelArts

服务管理概述 - AI开发平台ModelArts

创建Workflow服务部署节点 - AI开发平台ModelArts

查询服务监控信息 - AI开发平台ModelArts

设置断点续训练 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

更新模型服务的单个属性 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

Wav2Lip推理基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

CogVideoX1.5 5b模型基于DevServer适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线