搜索_华为云

Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

r资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
使用基础镜像 - AI开发平台ModelArts

使用基础镜像通过ECS获取和上传基础镜像将镜像上传至SWR服务后，可创建训练作业，在“选择镜像”中选择SWR中基础镜像。由于基础镜像内需要安装固定版本依赖包，如果直接使用基础镜像进行训练，每次创建训练作业时，训练作业的图1中都需要执行 install.sh文件，来安装依赖以及下载完整代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
使用基础镜像 - AI开发平台ModelArts

使用基础镜像通过ECS获取和上传基础镜像将镜像上传至SWR服务后，可创建训练作业，在“选择镜像”中选择SWR中基础镜像。由于基础镜像内需要安装固定版本依赖包，如果直接使用基础镜像进行训练，每次创建训练作业时，训练作业的图1中都需要执行 install.sh文件，来安装依赖以及下载完整代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
附录：大模型推理常见问题 - AI开发平台ModelArts

oken和大于max_model_len，服务端返回报错Response payload is not completed，见图2。再次设置输入输出的token和小于max_model_len访问推理服务，服务端响应200，见图3。客户端仍返回报错Response payload

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
添加资源标签 - AI开发平台ModelArts

String ModelArts错误码。 error_msg String 具体错误信息。请求示例为指定的Notebook添加资源标签。例如设置TMS标签的key为“test”，value为“service-gpu”。 https://{endpoint}/v1/{project_

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
导出ModelArts数据集中的数据为新数据集 - AI开发平台ModelArts

径。“输出路径”不能与“保存路径”为同一路径，且“输出路径”不能是“保存路径”的子目录。图1 导出新数据集数据导出成功后，您可以前往您设置的保存路径，查看到存储的数据。当导出方式选择为新数据集时，在导出成功后，您可以前往“数据集”列表中，查看到新的数据集。在“数据集概览页”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

ata.json，数据大小：43.6 MB。自定义数据用户也可以自行准备训练数据。数据要求如下：使用标准的.json格式的数据，通过设置--json-key来指定需要参与训练的列。请注意huggingface中的数据集具有如下this格式。可以使用–json-key标志更

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
附录：大模型推理常见问题 - AI开发平台ModelArts

zer/chatglm3-6b/config.json 问题3：使用离线推理时，性能较差或精度异常。解决方法：将block_size大小设置为128。 from vllm import LLM, SamplingParams llm = LLM(model="facebook/opt-125m"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）
用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

复制模型文件失败原因分析由于ModelArts的使用权限依赖OBS服务的授权，需要为用户授予OBS的系统权限。子用户的IAM权限是由其主用户设置的，如果主用户没有赋予OBS的putObjectAcl权限即会导致创建模型构建失败。处理方法了解ModelArts依赖的OBS权限自定

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

ata.json，数据大小：43.6 MB。自定义数据用户也可以自行准备训练数据。数据要求如下：使用标准的.json格式的数据，通过设置--json-key来指定需要参与训练的列。请注意huggingface中的数据集具有如下this格式。可以使用–json-key标志更改

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 准备工作
管理团队和团队成员 - AI开发平台ModelArts

邮箱地址添加新成员。 “角色”支持“Labeler”、“Reviewer”和“Team Manager”，“Team Manager”只能设置为一个人。删除团队当已有的团队不再使用，您可以执行删除操作。在“标注团队”管理页面中，选中需删除的团队，然后单击“删除”。在弹出的对

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
ModelArts Standard资源监控概述 - AI开发平台ModelArts

Standard上报的所有监控指标都保存在AOM中，当ModelArts控制台可以查看的指标不满足诉求时，用户可以通过AOM服务提供的指标消费和使用的能力来查看指标。设置指标阈值告警、告警上报等，都可以直接在AOM控制台操作。具体参见通过AOM控制台查看ModelArts所有监控指标。方式三：通过Grafana查看所有监控指标

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
停止计费 - AI开发平台ModelArts
停止计费 - AI开发平台ModelArts

训练作业和在线服务。删除存储到OBS中的数据及OBS桶。 Workflow：停止因运行Workflow作业而创建的训练作业和在线服务。删除存储到OBS中的数据及OBS桶。 Notebook：删除Notebook实例。删除存储到OBS中的数据及OBS桶。停止Notebook实例时

 帮助中心 > AI开发平台ModelArts > 计费说明
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

预训练前提条件已上传训练代码、训练权重文件和数据集到SFS Turbo中，具体参考代码上传至OBS和使用Notebook将OBS数据导入SFS Turbo。 Step1 在Notebook中修改训练超参配置以llama2-13b预训练为例，执行脚本0_pl_pretrain_13b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
新建消息订阅Subscription - AI开发平台ModelArts

订阅的主题。 entity String 订阅的主题。 events Array of strings 订阅的事件。请求示例创建消息订阅。设置订阅的主题为“fengbin26”，订阅的主题为“238947895793875835893490”，订阅的事件为“[ "*:failed

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
如何禁止Ubuntu 20.04内核自动升级？ - AI开发平台ModelArts

pt.conf.d/10periodic”文件： vi /etc/apt/apt.conf.d/10periodic 修改文件以将所有选项设置为“0”： APT::Periodic::Update-Package-Lists "0"; APT::Periodic::Downloa

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
查询节点池列表 - AI开发平台ModelArts

节点池名称。比如：nodePool-1。 taints Array of Taint objects 支持给创建出来的节点加taints来设置反亲和性，非特权池不能指定。 labels Map<String,String> k8s标签，格式为key/value键值对。 tags Array

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

yaml相对或绝对路径，根据自己要求执行 <model_name>：训练模型名，如qwen2-7b <exp_name>：实验名称：具体可以设置的值参考<cfgs_yaml_file> --master_addr <master_addr>：主master节点IP，一般选rank0为主master。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
使用MaaS评测模型 - AI开发平台ModelArts

Studio左侧导航栏，单击“模型评测”。在“模型评测”页面右上角，单击“创建评测任务”进入创建页面，配置相关信息。表1 创建模型评测任务参数说明任务设置评测任务名称默认名称为：Eval-当前时间戳-四位随机字符。您可以按需修改。支持100字符。描述评测任务简介。支持1000字符。选择服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
通过APP认证的方式访问在线服务 - AI开发平台ModelArts

使用时解密,确保安全; # 本示例以app_key和app_secret保存在环境变量中来实现身份验证为例,运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_APP_KEY和HUAWEICLOUD_APP_SECRET。 app_key = os.envi

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式

总条数： 1669

上一页
1
...
72
73
74
...
84
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

添加资源标签 - AI开发平台ModelArts

导出ModelArts数据集中的数据为新数据集 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

管理团队和团队成员 - AI开发平台ModelArts

ModelArts Standard资源监控概述 - AI开发平台ModelArts

停止计费 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

新建消息订阅Subscription - AI开发平台ModelArts

如何禁止Ubuntu 20.04内核自动升级？ - AI开发平台ModelArts

查询节点池列表 - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

使用MaaS评测模型 - AI开发平台ModelArts

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线