搜索_华为云

场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Turbo文件系统联动，可以实现数据灵活管理、高性能读取数据等。通过OBS上传训练所需的模型文件、训练数据等，再将OBS中的数据文件导入到SFS Turbo，然后在训练作业中挂载SFS Turbo到容器对应ckpt目录，实现分布式读取训练数据文件。约束限制如果要使用自动重启功能，资源规格必须选择八卡规格。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

指导步骤中，会展开进行详细的解释。如果用户希望自定义参数进行训练，可直接编辑对应模型的训练脚本，可编辑参数以及详细介绍如下。以下参数取值主要以llama2-70b预训练为例，请根据实际模型修改。表1 模型训练脚本参数参数示例值参数说明 ORIGINAL_TRAIN_DATA_PATH

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
责任共担 - AI开发平台ModelArts
责任共担 - AI开发平台ModelArts

责任共担华为云秉承“将公司对网络和业务安全性保障的责任置于公司的商业利益之上”。针对层出不穷的云安全挑战和无孔不入的云安全威胁与攻击，华为云在遵从法律法规业界标准的基础上，以安全生态圈为护城河，依托华为独有的软硬件优势，构建面向不同区域和行业的完善云服务安全保障体系。安全性是华为云与您的共同责任，如图1所示。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
查看在线服务详情 - AI开发平台ModelArts

流、实例数、部署超时时间、环境变量、存储挂载等信息。专属资源池部署的服务，同时展示资源池信息。 “历史更新记录”：展示历史模型相关信息。监控信息展示当前服务的“资源统计信息”和“模型调用次数统计”。 “资源统计信息”：包括CPU、内存、GPU、NPU的可用和已用信息。 “模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
配置多分支节点数据 - AI开发平台ModelArts

ow")), # ModelStep的输出 depend_steps=[job_step_1, job_step_2] # 依赖的作业类型节点对象 )# job_step是wf.steps.JobStep的实例对象，train_url是wf.steps.JobOutput的name字段值

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
Standard推理部署 - AI开发平台ModelArts

Standard推理部署 ModelArts Standard推理服务访问公网方案端到端运维ModelArts Standard推理服务方案使用自定义引擎在ModelArts Standard创建模型使用大模型在ModelArts Standard创建模型部署在线服务第三方推理框架迁移到ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践
查询开发环境实例详情 - AI开发平台ModelArts

pool参数说明参数参数类型描述 id String 资源池ID。 name String 资源池名称。 type String 资源池类型。主要区分类型：USER_DEFINED，表明为专属资源池。 owner Object 当“type”为“USER_DEFINED”时是必选项。如表10所示。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

指导步骤中，会展开进行详细的解释。如果用户希望自定义参数进行训练，可直接编辑对应模型的训练脚本，可编辑参数以及详细介绍如下。以下参数取值主要以llama2-70b预训练为例，请根据实际模型修改。表1 模型训练脚本参数参数示例值参数说明 ORIGINAL_TRAIN_DATA_PATH

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明参考
部署在线服务 - AI开发平台ModelArts

h/edge。默认为real-time。 real-time代表在线服务，将模型部署为一个Web Service，并且提供在线的测试UI与监控能力，服务一直保持运行。 batch为批量服务，批量服务可对批量数据进行推理，完成数据处理后自动停止。 edge表示边缘服务，通过华为云智

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
部署的在线服务状态为告警 - AI开发平台ModelArts

部署的在线服务状态为告警问题现象在部署在线服务时，状态显示为“告警”。解决方法使用状态为告警的服务进行预测，可能存在预测失败的风险，请从以下4个角度进行排查，并重新部署。后台预测请求过多。如果您使用API接口进行预测，请检查是否预测请求过多。大量的预测请求会导致部署的在线服务进入告警状态。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
更新开发环境实例信息 - AI开发平台ModelArts

pool参数说明参数参数类型描述 id String 资源池ID。 name String 资源池名称。 type String 资源池类型。主要区分类型：USER_DEFINED，表明为专属资源池。 owner Object 当“type”为“USER_DEFINED”时是必选项。如表13所示。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
开发第一条Workflow - AI开发平台ModelArts

数据集对象 dataset = wf.data.DatasetPlaceholder(name="input_data") # 创建训练作业 job_step = wf.steps.JobStep( name="training_job", title="图像分类训练"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
工作空间 - AI开发平台ModelArts
工作空间 - AI开发平台ModelArts

工作空间 ModelArts的用户需要为不同的业务目标开发算法、管理和部署模型，此时可以创建多个工作空间，把不同应用开发过程的输出内容划分到不同工作空间中，便于管理和使用。工作空间支持3种访问控制： PUBLIC：租户（主账号和所有子账号）内部公开访问。 PRIVATE：仅创建者和主账号可访问。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
修改Workflow工作流 - AI开发平台ModelArts

labeling 标注 release_dataset 数据集发布 model 模型发布 service 服务部署 mrs_job MRS作业 dataset_import 数据集导入 create_dataset 创建数据集 inputs 否 Array of JobInput

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询开发环境实例列表 - AI开发平台ModelArts

pool参数说明参数参数类型描述 id String 资源池ID。 name String 资源池名称。 type String 资源池类型。主要区分类型：USER_DEFINED，表明为专属资源池。 owner Object 当“type”为“USER_DEFINED”时是必选项。如表12所示。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
infiniband驱动的安装 - AI开发平台ModelArts

infiniband驱动的安装 infiniband驱动的安装如果安装了libibverbs-dev库后仍然无法使能infiniband网卡，您可以直接安装infiniband官方驱动，以使用infiniband网卡进行分布式通信，提升训练性能。infiniband驱动需要在制作镜像时安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

本案例将基于ModelArts提供的PyTorch基础镜像，安装pytorch 1.8、ffmpeg 3和gcc 8，构建一个面向AI开发的新环境。主要流程如下图所示：图1 构建与调测镜像流程本案例适用于华为云-北京四Region。 Notebook自定义镜像规范制作自定义镜像时，Base镜像需满足如下规范：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
数据管理权限 - AI开发平台ModelArts

{dataset_id}/data-annotations/stats modelarts:dataset:get - √ √ 查询数据集监控数据 GET /v2/{project_id}/datasets/{dataset_id}/metrics modelarts:dataset:get

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

推理方式，取值为real-time/batch/edge。 real-time代表在线服务，将模型部署为一个Web Service，并且提供在线的测试UI与监控能力，服务一直保持运行。 batch为批量服务，批量服务可对批量数据进行推理，完成数据处理后自动停止。 edge表示边缘服务，通过华为云智

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
在Workflow中更新已部署的服务 - AI开发平台ModelArts

aluate_sample_ratio="0.8")), depend_steps=[label_step] ) # 创建训练作业 job_step = wf.steps.JobStep( name="training_job", title="图像分类训练"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考

总条数： 936

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

场景介绍 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

责任共担 - AI开发平台ModelArts

查看在线服务详情 - AI开发平台ModelArts

配置多分支节点数据 - AI开发平台ModelArts

Standard推理部署 - AI开发平台ModelArts

查询开发环境实例详情 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

部署的在线服务状态为告警 - AI开发平台ModelArts

更新开发环境实例信息 - AI开发平台ModelArts

开发第一条Workflow - AI开发平台ModelArts

工作空间 - AI开发平台ModelArts

修改Workflow工作流 - AI开发平台ModelArts

查询开发环境实例列表 - AI开发平台ModelArts

infiniband驱动的安装 - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

数据管理权限 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

在Workflow中更新已部署的服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线