搜索_华为云

Eagle投机小模型训练 - AI开发平台ModelArts

Eagle训练适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/spec_decode/EAGLE目录下。在目录下执行如下命令，即可安装Eagle。 bash build.sh 步骤二：非sharegpt格式数据集转换（可选）如果数据集json

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
Eagle投机小模型训练 - AI开发平台ModelArts

Eagle训练适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/spec_decode/EAGLE目录下。在目录下执行如下命令，即可安装Eagle。 bash build.sh 步骤二：非sharegpt格式数据集转换（可选）如果数据集json

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
执行训练任务（推荐） - AI开发平台ModelArts

的值进行整除。 Step4 开启训练故障自动重启功能创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图3 开启故障重启断点续训练是通过ch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
执行训练任务（历史版本） - AI开发平台ModelArts

的值进行整除。 Step4 开启训练故障自动重启功能创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图3 开启故障重启断点续训练是通过ch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
制作自定义镜像用于推理 - AI开发平台ModelArts

制作自定义镜像用于推理模型的自定义镜像制作流程在Notebook中通过镜像保存功能制作自定义镜像用于推理在Notebook中通过Dockerfile从0制作自定义镜像用于推理在ECS中通过Dockerfile从0制作自定义镜像用于推理父主题：制作自定义镜像用于ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
查询处理任务列表 - AI开发平台ModelArts

程。 “数据增强”表示通过简单的数据扩增例如缩放、裁剪、变换、合成等操作直接或间接的方式增加数据量。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Chunked Prefill - AI开发平台ModelArts

ll bool true false true：开启Chunked Prefill特性。 false：不开启Chunked Prefill特性。 max-num-batched-tokens int >=256且是256的倍数在Chunked Prefill模式下，该参数限制最

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
Standard专属资源池 - AI开发平台ModelArts

Standard专属资源池 ModelArts支持使用ECS创建专属资源池吗？在ModelArts中1个节点的专属资源池，能否部署多个服务？在ModelArts中公共资源池和专属资源池的区别是什么？ ModelArts中的作业为什么一直处于等待中？ ModelArts控制台为什么能看到创建失败被删除的专属资源池？

帮助中心 > AI开发平台ModelArts > 常见问题
查询预置算法 - AI开发平台ModelArts

\"required\":true},{\"label\":\"mom\",\"value\":\"0.9\",\"placeholder_cn\":\"训练网络的动量参数\",\"placeholder_en\":\"\",\"required\":true},{\"label\":\"wd\",\"value\":\"0

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
如何登录并上传镜像到SWR？ - AI开发平台ModelArts

earning时，均需要替换为此处实际创建的组织名称。单击右上角“登录指令”，获取登录访问指令。以root用户登录ECS环境，输入登录指令。图1 在ECS中执行登录指令 Step2 上传镜像到SWR 此小节介绍如何上传镜像至容器镜像服务SWR的镜像仓库。登录SWR后，使用docker

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
Eagle投机小模型训练 - AI开发平台ModelArts

idden-state比input token包含更多信息，使得回归hidden-state的任务比预测词的任务简单得多。总之，Eagle在hidden-state层面上进行外推，使用一个小型单层Eagle模型，然后利用基模型的冻结的分类头生成预测的token。如此一来，Eagle投机推理可以带来如下优势：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

OpenSSH默认端口为22端口，开启防火墙22端口号，在CMD执行以下命令： netsh advfirewall firewall add rule name=sshd dir=in action=allow protocol=TCP localport=22 启动OpenSSH服务，在CMD执行以下命令：

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
订阅的模型一直处于等待同步状态 - AI开发平台ModelArts

订阅已过期。执行同步操作时报错：ModelArts.5055: 订阅已过期。处理方法在权限管理页面进行依赖服务的授权。完成委托授权请参考了解ModelArts权限配置。检查是否有OBS权限或者接口操作权限。订阅已过期，可以在AI Gallery确认可以续订后，重新订阅。父主题：模型管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
使用AWQ或SQ压缩后的模型新增版本时，权重校验失败 - AI开发平台ModelArts

使用AWQ或SQ压缩后的模型新增版本时，权重校验失败问题现象使用AWQ或SQ压缩后的模型新增版本时，开启权重校验功能，权重校验失败。原因分析平台暂不支持压缩后的模型进行权重校验。问题影响压缩后的模型无法使用权重检验。处理方法模型压缩后，不建议进行权重校验。父主题：

帮助中心 > AI开发平台ModelArts > 常见问题 > Studio
查询训练作业参数详情 - AI开发平台ModelArts

OBS的桶路径。表5 volumes属性列表参数参数类型说明 nfs Object 共享文件系统类型的存储卷。仅支持运行于已联通共享文件系统网络的资源池的训练作业。具体请参见表6。 host_path Object 主机文件系统类型的存储卷。仅支持运行于专属资源池中的训练作业。具体请参见表7。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
管理训练容器环境变量 - AI开发平台ModelArts

表7 预检相关环境变量变量名说明示例 MA_SKIP_IMAGE_DETECT ModelArts预检是否开启。默认为1，1表示开启预检，0表示关闭预检。推荐开启预检，预检可提前发现节点故障、驱动故障。 “1” 表8 卡死检测相关环境变量变量名说明示例 MA_HANG_DETECT_TIME

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
扩缩容Standard专属资源池 - AI开发平台ModelArts

分任务在不同节点的运行情况不一致，请谨慎操作。存量节点不支持修改容器引擎空间大小。修改操作系统。在“操作系统”下拉列表中指定操作系统版本。指定节点计费模式。用户增加节点数量时，可以打开“节点计费模式”开关，为资源池新扩容的节点设置不同于资源池的计费模式、购买时长和开启自动续费

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
使用CodeLab免费体验Notebook - AI开发平台ModelArts

CodeLab入口 ModelArts管理控制台的“总览”页在“开发工具”区域下方，展示“CodeLab”简介卡片，单击“立即体验”，即可进入。图1 CodeLab入口 AI Gallery页面提供的Notebook样例在AI Gallery页面，单击“资产集市 > 开发 > N

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
创建训练作业 - AI开发平台ModelArts

能与pool_id同时出现。 pool_id 是 String 专属资源池ID。可在ModelArts管理控制台，单击左侧“专属资源池”，在专属资源池列表中查看资源池ID。创建专属池作业时，pool_id必选，且不能与spec_id同时出现。 engine_id 是 Long 训

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
AIGC工具tailor使用指导 - AI开发平台ModelArts

--output_path 指定结果输出路径。 string 否默认为当前目录下。 - --aoe 是否在转换时进行AOE优化。 bool 否 False AOE优化可以提升模型性能，但不是一定有提升，需要注意开启AOE，会导致模型转换耗时极大延长。 --accuracy 指定模型精度，只支持fp16和fp32。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理

总条数： 1315

上一页
1
...
61
62
63
...
66
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Eagle投机小模型训练 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

制作自定义镜像用于推理 - AI开发平台ModelArts

查询处理任务列表 - AI开发平台ModelArts

Chunked Prefill - AI开发平台ModelArts

Standard专属资源池 - AI开发平台ModelArts

查询预置算法 - AI开发平台ModelArts

如何登录并上传镜像到SWR？ - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

订阅的模型一直处于等待同步状态 - AI开发平台ModelArts

使用AWQ或SQ压缩后的模型新增版本时，权重校验失败 - AI开发平台ModelArts

查询训练作业参数详情 - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

扩缩容Standard专属资源池 - AI开发平台ModelArts

使用CodeLab免费体验Notebook - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线