搜索_华为云

自动学习训练作业失败 - AI开发平台ModelArts

数据源”，将OBS中的数据重新同步至ModelArts中。检查OBS的访问权限如果OBS桶的访问权限设置无法满足训练要求时，将会出现训练失败。请排查如下几个OBS的权限设置。当前账号具备OBS桶的读写权限（桶ACLs）进入OBS管理控制台，选择当前自动学习项目使用的OBS桶，单击桶名称进入概览页。

帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
使用Notebook进行代码调试 - AI开发平台ModelArts

otebook实例配置信息。挂载OBS并行文件系统：在Notebook实例详情页面，选择“存储配置”页签，单击“添加数据存储”，设置挂载参数。设置本地挂载目录，在“/data/”目录下输入一个文件夹名称，例如：demo。挂载时，后台自动会在Notebook容器“的/data/

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
创建和管理团队 - AI开发平台ModelArts

将被一并删除。其中，“角色”支持“Labeler”、“Reviewer”和“Team Manager”，“Team Manager”只能设置为一个人。需要注意的是：目前不支持从标注任务中删除labeler。labeler的标注必须通过审核后，才能同步到最终结果，不支持单独分离操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
线下容器镜像构建及调试 - AI开发平台ModelArts

${your_container_id}:/xxx/xxx/pytorch.tar.gz . 将pytorch.tar.gz上传到OBS并设置公共读，并在构建时wget获取、解压、清理。新镜像构建基础镜像一般选用ubuntu 18.04的官方镜像，或者nvidia官方提供的带

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
Open-Clip基于Lite Server适配PyTorch NPU训练指导 - AI开发平台ModelArts

资源规格要求推荐使用“西南-贵阳一”Region上的Lite Server资源和Ascend Snt9B单机单卡。表1 环境要求模型版本 CANN cann_8.0.rc1 PyTorch pytorch_2.1.0 获取镜像表2 获取镜像分类名称获取路径基础镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
训练启动脚本说明和参数配置 - AI开发平台ModelArts

规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置规格与节点数 1 llama2 llama2-7b SEQ_LEN=4096 TP(tensor model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
更新网络资源 - AI开发平台ModelArts

Boolean 默认路由开关。响应参数状态码：200 表9 响应Body参数参数参数类型描述 apiVersion String API版本。可选值如下： v1 kind String 资源类型。可选值如下： Network：网络 metadata NeworkMetadata

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
使用MobaXterm工具SSH连接Notebook后，经常断开或卡顿，如何解决？ - AI开发平台ModelArts

如果使用的是专业版的MobaXterm工具，请执行步骤3。如果使用的是专业版的MobaXterm工具，请参考图3 设置“Stop server after”，此参数默认值为360s，将其设置为3600s或更大值。图3 设置“Stop server after” 父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
日志提示“Please set the train_url to an empty obs directory” - AI开发平台ModelArts

对于不支持断点训练的模型，如果选择训练输出路径不是空目录，会出现该报错。处理方法对于不支持断点训练的模型，请您将模型的输出路径train_url设置为空目录。父主题：预置算法运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
创建数据集 - AI开发平台ModelArts

content_id 是 String AI Gallery中数据集资产的ID。 version_id 是 String AI Gallery中数据集资产的版本ID。表4 AnnotationConfig参数参数是否必选参数类型描述 scene 是 String 支持的标注格式场景，可选值如下：

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
标注文本分类数据 - AI开发平台ModelArts

变化，修改用于标注的标签。支持添加、修改和删除标签。添加标签在“未标注”页签下，单击“标签集”右侧的加号，在弹出“新增标签”对话框中，设置“标签名称”和“标签颜色”，然后单击“确定”完成标签添加。修改标签在“已标注”页签中“全部标签”的下方操作列，选择需要修改的标签，单击

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类
使用AWQ量化工具转换权重 - AI开发平台ModelArts

transformers sentencepiece #安装量化工具依赖 export ASCEND_RT_VISIBLE_DEVICES=0 #设置使用NPU单卡执行模型量化 python examples/quantize.py 详细说明可以参考vLLM官网：https://docs

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
分页查询团队标注任务下的样本列表 - AI开发平台ModelArts

分页列表的起始页，默认为0。 process_parameter 否 String 图像缩略设置，同OBS缩略图设置，详见OBS缩略图设置。如：image/resize,m_lfit,h_200表示等比缩放目标缩略图并设置高度为200像素。 sample_state 否 String 样本状态。可选样本状态如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用AWQ量化 - AI开发平台ModelArts

transformers sentencepiece #安装量化工具依赖 export ASCEND_RT_VISIBLE_DEVICES=0 #设置使用NPU单卡执行模型量化 python examples/quantize.py 详细说明可以参考vLLM官网：https://docs

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
推理精度测试 - AI开发平台ModelArts

model_args：标志向模型构造函数提供额外参数，比如指定运行模型的数据类型； vllm_path是模型权重路径； max_model_len 是最大模型长度，默认设置为4096； gpu_memory_utilization是gpu利用率，如果模型出现oom报错，调小参数； tensor_parallel_size是使用的卡数；

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
通过Function Calling扩展大语言模型对外部环境的理解 - AI开发平台ModelArts

Calling扩展大语言模型对外部环境的理解本示例将展示如何定义一个获取送货日期的函数，并通过LLM来调用外部API来获取外部信息。操作步骤设置Maas的api key和模型服务地址。 import requests from openai import OpenAI client

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 通过Function Calling扩展大语言模型交互能力
查询开发环境实例详情 - AI开发平台ModelArts

NoDiscount instance_num Integer 当前用户创建的该规格实例的数量。 duration Integer 启动后设置的自动停止时间，单位为秒。 store_time Integer 该规格实例处于非活跃状态，在数据库最长保存的时长。单位为小时。默认为“-1”

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
日志提示“UnboundLocalError: local variable 'epoch'” - AI开发平台ModelArts

录为“obs://my_bucket/train_url”，则设置参数“checkpoint_url=obs://my_bucket/train_url/last.pt”，并设置参数epochs=80（如果第二次设置参数epochs=30则增量训练只会训练29个epochs）。父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
推理精度测试 - AI开发平台ModelArts

model_args：标志向模型构造函数提供额外参数，比如指定运行模型的数据类型； vllm_path是模型权重路径； max_model_len 是最大模型长度，默认设置为4096； gpu_memory_utilization是gpu利用率，如果模型出现oom报错，调小参数； tensor_parallel_size是使用的卡数；

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
创建工作流定时调度 - AI开发平台ModelArts

定时调度策略中的标记，失败时触发。 on_running String 定时调度策略中的标记，running时触发。请求示例创建Workflow定时调度。设置类型为“time”，动作为“run”，调度策略on_failure为“retry”、on_running为“cancel”。 POST h

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理

总条数： 1342

上一页
1
...
53
54
55
...
68
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自动学习训练作业失败 - AI开发平台ModelArts

使用Notebook进行代码调试 - AI开发平台ModelArts

创建和管理团队 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

Open-Clip基于Lite Server适配PyTorch NPU训练指导 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

更新网络资源 - AI开发平台ModelArts

使用MobaXterm工具SSH连接Notebook后，经常断开或卡顿，如何解决？ - AI开发平台ModelArts

日志提示“Please set the train_url to an empty obs directory” - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

标注文本分类数据 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

分页查询团队标注任务下的样本列表 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

通过Function Calling扩展大语言模型对外部环境的理解 - AI开发平台ModelArts

查询开发环境实例详情 - AI开发平台ModelArts

日志提示“UnboundLocalError: local variable 'epoch'” - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

创建工作流定时调度 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线