搜索_华为云

创建数据处理任务版本 - AI开发平台ModelArts

y/row/entry/p/br {""}) (br]、Map<String,String>类型。对于数据预处理任务比较特殊的两个场景物体检测和图像分类，键“task_type”对应的值为“object_detection”或“image_classification”。表6 WorkPath

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练的数据集预处理说明 - AI开发平台ModelArts

inedFromHF']，一般为 PretrainedFromHF 。 SEQ_LEN 4096 要处理的最大seq length。脚本会检测超出SEQ_LEN长度的数据，并打印log。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
创建Notebook实例 - AI开发平台ModelArts

每GB按照规定费用收费。选择“弹性文件服务SFS”作为存储位置。仅专属资源池支持，并需要在专属资源池对应的网络打通VPC才能生效，具体操作请参见ModelArts网络。说明：如果需要设置SFS Turbo的文件夹权限，请参考权限管理文档配置。 “弹性文件服务”：选择已创建的SFS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
管理Workflow Execution - AI开发平台ModelArts

Workflow工作流配置参数的描述。 example 否 Object Workflow工作流配置参数的样例。 delay 否 Boolean 是否为延迟输入的参数，默认为否。 default 否 Object 配置参数的默认值。 value 否 Object 参数值。 enum 否 Array

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
在ModelArts Standard运行GPU训练任务的准备工作 - AI开发平台ModelArts

加高效。在使用专属资源池之前，您需要先创建一个专属资源池，操作指导请参考创建资源池。配置“网络”时需要选择已打通VPC的网络。如果需要新建网络和打通VPC可以参考ModelArts网络。 “规格类型”和“节点数量”根据训练计划使用的资源选择。在ECS服务器挂载SFS Turbo存储

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
查询服务详情 - AI开发平台ModelArts

在线服务实例所在的虚拟私有云ID，服务自定义网络配置时返回。 subnet_network_id String 在线服务实例所在的子网的网络ID，服务自定义网络配置时返回。 security_group_id String 在线服务实例所在的安全组，服务自定义网络配置时返回。 status String

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询数据集导入任务的详情 - AI开发平台ModelArts

导入的OBS路径或manifest路径。导入manifest时，path必须精确到具体manifest文件。导入为目录时，目前仅支持数据集类型为图片分类、物体检测、文本分类、声音分类。 import_type Integer 导入方式。可选值如下： 0：目录导入 1：按manifest文件导入 imported_sample_count

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询数据处理任务的版本详情 - AI开发平台ModelArts

y/row/entry/p/br {""}) (br]、Map<String,String>类型。对于数据预处理任务比较特殊的两个场景物体检测和图像分类，键“task_type”对应的值为“object_detection”或“image_classification”。表6 WorkPath

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练的数据集预处理说明 - AI开发平台ModelArts

inedFromHF']，一般为 PretrainedFromHF 。 SEQ_LEN 4096 要处理的最大seq length。脚本会检测超出SEQ_LEN长度的数据，并打印log。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

需填写虚拟私有云控制台子网详情中显示的“网络ID”。通过子网可提供与其他网络隔离的、可以独享的网络资源。 config 是 Array of ServiceConfig objects 模型运行配置，当推理方式为batch/edge时仅支持配置一个模型；当推理方式为real-t

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
训练的数据集预处理说明 - AI开发平台ModelArts

inedFromHF']，一般为 PretrainedFromHF 。 SEQ_LEN 4096 要处理的最大seq length。脚本会检测超出SEQ_LEN长度的数据，并打印log。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
使用AOM看Lite Cluster监控指标 - AI开发平台ModelArts

DCGM_FI_DEV_MEMORY_TEMP 表示显存温度。摄氏度（℃）自然数网络IO 下行速率 ma_container_network_receive_bytes 该指标用于统计测试对象的入方向网络流速。字节/秒（Bytes/Second） ≥0 接收包速率 ma_cont

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
非分离部署推理服务 - AI开发平台ModelArts

行。开启该功能会略微增加首Token时间，但可以提升推理吞吐量。 export DEFER_MS=10 # 延迟解码时间，默认值为10，单位为ms。将Token解码延迟进行的毫秒数，使得当次Token解码能与下一次模型推理并行计算，从而减少总推理时延。该参数需要设置环境变量DEFER_DECODE=1才能生效。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

Step1 准备环境请参考Cluster资源开通，购买Cluster资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.2

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

当使用API调用地址预测时，请求体的大小限制是12MB，超过12MB时，请求会被拦截。使用ModelArts console的预测页签进行的预测，由于console的网络链路的不同，要求请求体的大小不超过8MB。图2 请求报错APIG.0201 APIG.0301 鉴权失败通过API进行服务预测，或者使

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
查询数据集导入任务列表 - AI开发平台ModelArts

导入的OBS路径或manifest路径。导入manifest时，path必须精确到具体manifest文件。导入为目录时，目前仅支持数据集类型为图片分类、物体检测、文本分类、声音分类。 import_type Integer 导入方式。可选值如下： 0：目录导入 1：按manifest文件导入 imported_sample_count

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建团队标注任务 - AI开发平台ModelArts

可查看到分配的标注任务，单击任务名称，可进入标注页面。不同类型的标注作业，标注方式不同，详细请参见：标注图片（图像分类）标注图片（物体检测）标注文本（文本分类）标注文本（命名实体）标注文本（文本三元组）标注音频（语音分割）在标注页面中，每个成员可查看“未标注”、“待

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
ECS获取和上传基础镜像 - AI开发平台ModelArts

#检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）

总条数： 507

上一页
1
...
17
18
19
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建数据处理任务版本 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

管理Workflow Execution - AI开发平台ModelArts

在ModelArts Standard运行GPU训练任务的准备工作 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

查询数据集导入任务的详情 - AI开发平台ModelArts

查询数据处理任务的版本详情 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

使用AOM看Lite Cluster监控指标 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

查询数据集导入任务列表 - AI开发平台ModelArts

创建团队标注任务 - AI开发平台ModelArts

ECS获取和上传基础镜像 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线