搜索_华为云

附录：大模型推理standard常见问题 - AI开发平台ModelArts

vllm/build_image.sh内容，将'ENTRYPOINT ["/home/mind/model/run_vllm.sh"]'修改为'ENTRYPOINT sh /home/mind/model/run_vllm.sh'，并重新构建镜像。见如下示例：图1 修改build_images

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
查看训练作业日志 - AI开发平台ModelArts

问题时，可首先查看日志，多数场景下的问题可以通过日志报错信息直接定位。训练日志包括普通训练日志和Ascend相关日志。普通日志说明：当使用Ascend之外的资源训练时仅产生普通训练日志，普通日志中包含训练进程日志、pip-requirement.txt安装日志和ModelArts平台日志。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
日志提示"write line error" - AI开发平台ModelArts

5T空间用完了。云上训练磁盘空间一般指如下两个目录的磁盘空间： “/”根目录，是docker中配置项“base size”，默认是10G，云上统一改为50G。 “/cache”目录满了，一般是3.5T存储空间满了，具体规格的空间大小可参见训练环境中不同规格资源“/cache”目录的大小。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
查询数据集导出任务的状态 - AI开发平台ModelArts

根据样本名称搜索（含后缀名）。 sample_time String 样本加入到数据集时，会根据样本在OBS上的最后修改时间(精确到天)建立索引，此处可以根据此时间进行搜索。可选值如下： month：搜索往前30天至今天内添加的样本 day：搜索昨天(往前1天)至今天内添加的样本

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

如上所示，即需要在C:\Users\xxx\AppData\Roaming路径下创建pip文件夹。在pip文件夹中创建一个名为pip的文本文件，并将后缀名由“.txt”改为“.ini”。文件内容示例如下：其中，index-url为pip源ip地址，使用时需自行替换。本示例以华为源为例，具体如下： [global]

帮助中心 > AI开发平台ModelArts > SDK参考
管理训练容器环境变量 - AI开发平台ModelArts

MA_NUM_HOSTS 实例数。系统自动从资源参数的“实例数”中读取。 “MA_NUM_HOSTS=4” VC_TASK_INDEX 当前容器索引，容器从0开始编号。单机训练的时候，该字段无意义。在多机作业中，用户可以根据这个值来确定当前容器运行的算法逻辑。 “VC_TASK_INDEX=0”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
如何禁止Ubuntu 20.04内核自动升级？ - AI开发平台ModelArts

vi /etc/apt/apt.conf.d/20auto-upgrades 将其中的“Unattended-Upgrade "1"; ”改为“Unattended-Upgrade "0";”以禁用自动更新，然后保存文件并退出。将当前内核版本锁定。要禁止特定的内核版本更新，您

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
Qwen-VL基于Lite Server适配PyTorch NPU的Finetune训练指导(6.3.912) - AI开发平台ModelArts

wen-VL 执行训练脚本 #配置训练参数 vim finetune/finetune_ds.sh MODEL: 修改为权重文件实际路径 DATA: 修改为数据集路径 --output_dir：训练后的权重所在目录名称，默认为output_qwen --num_train_epochs：

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

择“自定义”。当模型的“任务类型”是除“文本问答”和“文本生成”之外的类型（即自定义模型）时，则“推理任务类型”默认为“自定义”，支持修改为“文本问答”或“文本生成”。当使用自定义镜像部署推理服务时，“推理任务类型”默认为“自定义”，且不支持修改。参数设置当使用自定义镜像

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

权限管理”，进入“权限管理”页面，单击“添加授权”。在弹出的“访问授权”窗口中，授权对象类型：所有用户委托选择：新增委托权限配置：普通用户选择完成后勾选“我已经详细阅读并同意《ModelArts服务声明》”，然后单击“创建”。完成配置后，在ModelArts控制台的权

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

配置需要的NPU卡。 export ASCEND_RT_VISIBLE_DEVICES=0,1,2,3 0,1,2,3修改为需要使用的卡，如需使用全部8张卡，修改为0,1,2,3,4,5,6,7。配置PYTHONPATH。 export PYTHONPATH=$PYTHONPATH:${vllm_path}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

行训练时，需要修改 install.sh 脚本中的 transformers 的版本。由默认 transformers==4.46.1 修改为：transformers==4.44.2 为了避免因使用不同版本的 transformers 库进行训练和推理而导致冲突的问题，建议用户

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
部署在线服务 - AI开发平台ModelArts

当使用此方式时，输入数据目录下的文件只能以.csv为后缀，且需配置mapping_rule参数，以表达推理请求体中各个参数对应到csv的索引。创建批量服务且输入数据映射方式为file的样例 { "service_name": "batchservicetest", "description":

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
在MaaS中创建模型 - AI开发平台ModelArts

第一处原内容 # Load from model defaults assert self.padding_side == "left" 修改为 # Load from model defaults # assert self.padding_side == "left" 第二处原内容

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

使用环境变量SAVE_PATH重新覆盖权重文件保存路径，作为最终的权重保存路径。修改代码如图2。图2 修改权重保存路径多机训练场景下，需要将CODE_DIR修改为OBS_CODE_DIR目录，则可以使用scripts/tools/sync_with_obs.py工具将其它节点的权重文件同步上传到主节点。修改代码如图3。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

修改pod的卡数。由于本案例中为分布式训练，因此所需卡数修改为8卡。删除已创建的pod。 kubectl delete -f config.yaml 将config.yaml文件中“limit”和“request”改为8。 vi config.yaml 图3 修改卡数重新创建pod。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
查询开发环境实例列表 - AI开发平台ModelArts

me”。 order 否 String 排序方式，支持“asc”和“desc”，默认为“asc”。 offset 否 Integer 起始索引，默认为“0”。 limit 否 Integer 限制本次返回的结果数据条数，取值范围(0,∞)，默认值为“0”，返回全部。 workspace_id

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
ECS中构建新镜像 - AI开发平台ModelArts

进行训练时，需要修改 Dockerfile 中的 transformers 的版本。由默认 transformers==4.47.0 修改为：transformers==4.44.2 执行以下命令制作训练镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网 docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.5.901） > 准备工作 > 准备镜像
ECS中构建新镜像 - AI开发平台ModelArts

进行训练时，需要修改 Dockerfile 中的 transformers 的版本。由默认 transformers==4.47.0 修改为：transformers==4.44.2 执行以下命令制作训练镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网 docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
使用SDK调测单机训练作业 - AI开发平台ModelArts

数，则开始训练时会将Notebook中的训练数据压缩并上传到该位置，不可重复上传。如果第一次上传后，建议将is_local_source修改为False，obs_path指向刚才上传的压缩数据文件位置；如果用户没有填写，则不会进行压缩上传。 local_path：必选参数，Not

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测

总条数： 885

上一页
1
...
4
5
6
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：大模型推理standard常见问题 - AI开发平台ModelArts

查看训练作业日志 - AI开发平台ModelArts

日志提示"write line error" - AI开发平台ModelArts

查询数据集导出任务的状态 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

如何禁止Ubuntu 20.04内核自动升级？ - AI开发平台ModelArts

Qwen-VL基于Lite Server适配PyTorch NPU的Finetune训练指导(6.3.912) - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

查询开发环境实例列表 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

使用SDK调测单机训练作业 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线