搜索_华为云

日志提示“UnboundLocalError: local variable 'epoch'” - AI开发平台ModelArts

象。处理方法第二次增量训练设置的epochs数值需要大于第一次常规训练设置的epochs数值。举例：对一个已经完成的训练作业（假设训练了50个epochs），想要训练更多的epochs（追加30个epochs），假设上一个训练作业的输出目录为“obs://my_bucket

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
创建数据集标签 - AI开发平台ModelArts

Boolean 操作是否执行成功。可选值如下： true：执行成功 false：执行失败请求示例创建数据集标签。设置标签名称为“Cat”，物体检测标签的默认形状为“bndbox”。 { "labels" : [ { "name" : "Cat", "property"

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建工作流定时调度 - AI开发平台ModelArts

定时调度策略中的标记，running时触发。请求示例创建Workflow定时调度。设置类型为“time”，动作为“run”，调度策略on_failure为“retry”、on_running为“cancel”。 POST https://{endpoint}/v2/{proje

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
创建团队标注任务 - AI开发平台ModelArts

参数类型描述 task_id String 团队标注任务ID。请求示例创建团队标注任务。设置任务名称为“task-eb17”，同步更新新增数据为“false”，团队标注任务是否同步智能标注结果为“false”。 { "task_name" : "task-eb17", "synchronize_data"

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

中创建文件夹model/llama-2-13b-hf。利用OBS Browser+工具将下载的模型文件上传至创建的文件夹目录下。在ECS服务器中安装obsutil工具，具体命令可参考obsutil工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

print(resp.text) “body”中的参数名由在线服务的输入参数决定，需要和“类型”为“string”的输入参数“名称”保持一致。此处以“image”为例。“body”中的base64_data值为string类型。方式二：使用Java语言发送预测请求下载Java SDK并在开

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

中创建文件夹model/llama-2-13b-hf。利用OBS Browser+工具将下载的模型文件上传至创建的文件夹目录下。在ECS服务器中安装obsutil工具，具体命令可参考obsutil工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

并且执行“nvidia-smi”也明显变很卡顿。原因分析根据现象描述可能出现了nvidia-smi D+进程。 "D+"表示进程状态为"Uninterruptible Sleep (usually IO)"，即进程正在等待I/O操作完成，此时无法被中断。在正常情况下，nv

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
更新Notebook实例 - AI开发平台ModelArts

SSH：可以通过SSH协议远程连接Notebook。 key_pair_names 否 Array of strings SSH密钥对名称，可以在云服务器控制台（ECS）“密钥对”页面创建和查看。表4 CustomHooks 参数是否必选参数类型描述 container_hooks 否 ContainerHooks

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建Notebook实例 - AI开发平台ModelArts

String 账号ID name String 账号名请求示例创建Notebook实例。设置实例规格为“modelarts.vm.cpu.2u”，存储类型为“EVS”，资源所属为“MANAGED”，存储容量为50G。 { "name" : "notebooks_test", "feature"

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建数据处理任务版本 - AI开发平台ModelArts

数据源所在路径。可选值如下：如果type是OBS，source为OBS路径。如果type是TASK，source为任务ID。如果type是DATASET，source为数据集ID。如果type是CUSTOM且是资源租户调用，source为真实用户的project_id, 否则不需要这个字段。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
图模式 - AI开发平台ModelArts
图模式 - AI开发平台ModelArts

16,32 # 设置动态分档的档位，根据实际情况设置，另外请不要设置档位1(DeepSeek V2 236B W8A8 模型建议最大设置4个档位) export VLLM_ENGINE_ITERATION_TIMEOUT_S=1500 # 设置vllm请求超时时间(DeepSeek

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

称）。 “启动文件”：选择代码目录下上传的训练脚本“train.py”。 “输入”：单击“增加训练输入”，设置训练输入的“参数名称”为“data_url”。设置数据存储位置为您的OBS目录，例如 “/test-modelarts-xx/pytorch/mnist-data/”（t

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
通过API接口查询模型详情，model_name返回值出现乱码 - AI开发平台ModelArts

w"...... 原因分析当模型名称包含下划线时，下划线涉及转义处理。处理方法需要在请求中增加exact_match参数，且参数值设置为true，确保model_name返回值正确。父主题：模型管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
工具介绍及准备工作 - AI开发平台ModelArts

、性能对比、下游任务评测、loss和下游任务对比能力。对比结果以excel文件呈现。方便用户验证发布模型的质量。所有配置都通过yaml文件设置，用户查看默认yaml文件即可知道最优性能的配置。目前仅支持SFT指令监督微调训练阶段。代码目录 benchmark工具脚本存放在代码

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
工具介绍及准备工作 - AI开发平台ModelArts

、性能对比、下游任务评测、loss和下游任务对比能力。对比结果以excel文件呈现。方便用户验证发布模型的质量。所有配置都通过yaml文件设置，用户查看默认yaml文件即可知道最优性能的配置。目前仅支持SFT指令监督微调训练阶段。准备工作参考benchmark-准备工作，开

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练benchmark工具
创建标注团队的成员 - AI开发平台ModelArts

成员描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 emails 是 String 团队成员的邮箱。 role 是 Integer 成员角色。可选值如下： 0：标注人员 1：审核人员 2：团队管理员响应参数无请求示例创建标注团队的成员。设置成员角色为“2”，即团队管理员角色。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建标注团队 - AI开发平台ModelArts

description 否 String 标注团队描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 workforce_name 是 String 标注团队名称，名称只能包含字母、数字、下划线和中划线，长度为1-64位。响应参数状态码： 201 表3 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
如何保证训练和调试时文件路径保持一致 - AI开发平台ModelArts

云上挂载路径 Notebook中挂载SFS后，SFS默认在“/home/ma-user/work”路径下。在创建训练作业时，设置SFS Turbo的“云上挂载路径”为“/home/ma-user/work”，使得训练环境下SFS也在“/home/ma-user/work”路径下。 ln

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
推理精度测试 - AI开发平台ModelArts

host：与起服务的host保持一致，比如起服务为0.0.0.0，host设置也为0.0.0.0。 service_port：服务端口，与启动服务时的端口保持，比如8080。 max_out_len：在运行类似mmlu、ceval等判别式回答时，max_out_len建议设置小一些，比如16。在运行h

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）

总条数： 1061

上一页
1
...
15
16
17
...
54
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

日志提示“UnboundLocalError: local variable 'epoch'” - AI开发平台ModelArts

创建数据集标签 - AI开发平台ModelArts

创建工作流定时调度 - AI开发平台ModelArts

创建团队标注任务 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

更新Notebook实例 - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

创建数据处理任务版本 - AI开发平台ModelArts

图模式 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

通过API接口查询模型详情，model_name返回值出现乱码 - AI开发平台ModelArts

工具介绍及准备工作 - AI开发平台ModelArts

工具介绍及准备工作 - AI开发平台ModelArts

创建标注团队的成员 - AI开发平台ModelArts

创建标注团队 - AI开发平台ModelArts

如何保证训练和调试时文件路径保持一致 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线