搜索_华为云

在ECS中创建ma-user和ma-group - AI开发平台ModelArts

在ECS中创建ma-user和ma-group 在ModelArts训练平台使用的自定义镜像时，默认用户为ma-user、默认用户组为ma-group。如果在训练时调用ECS中的文件，需要修改文件权限改为ma-user可读，否则会出现Permission denied错误，因此需

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
Controlnet训练 - AI开发平台ModelArts

本章节介绍SDXL&SD 1.5模型的Controlnet训练过程。 Step1 处理fill50k数据集使用ma-user用户在容器上执行如下命令解压数据集。 cd /home/ma-user/datasets/fill50k unzip conditioning_images

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
获取Workflow工作流列表 - AI开发平台ModelArts

描述 total Integer 查询到当前用户名下的所有Workflow总数。 count Integer 查询到当前用户名下的所有符合查询条件的Workflow总数。 items Array of Workflow objects 查询到当前用户名下的所有符合查询条件的Workflow详情。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

池扩容后再进行服务部署。公共资源池扩容，请联系系统管理员。专属资源池扩容，可参考扩缩容资源池。如果磁盘空间不够，可以尝试重试，使实例调度到其他节点。如果单实例仍磁盘空间不足，请联系系统管理员，更换合适的规格。如果是大模型导入的模型部署服务，请确保专属资源池磁盘空间大于1T（1000GB）。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
创建Workflow训练作业节点 - AI开发平台ModelArts

JobClient session初始化 # 如果您在本地IDEA环境中开发工作流，则Session初始化使用如下方式 # 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以ak和sk保存在环境变量中来

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
在Dify中配置支持Function Calling的模型使用 - AI开发平台ModelArts

Call”。 Stream function calling 暂不支持。在Dify中创建Agent进行编配，在右上角单击“Agent 设置”，选择上一步配置好的模型进行使用。在Agent设置中可以看到Dify已自动将Agent Mode切换到了Function Calling模式。图1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 通过Function Calling扩展大语言模型交互能力
投机推理使用说明 - AI开发平台ModelArts

的小模型替代LLM进行投机式地推理（Speculative Inference）。即每次先使用小模型试探性地推理多步，再将这些推理结果收集到一起，一次交由LLM进行验证。如下图所示，在投机模式下，先由小模型依次推理出token 1、2、3，并将这3个token一次性输入大模型L

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
什么是Workflow - AI开发平台ModelArts

中，会根据数据和模型结果进行多轮的实验迭代。算法工程师会根据数据特征以及数据的标签做多样化的数据处理以及多种模型优化，以获得在已有的数据集上更好的模型效果。传统的模型交付会直接在实验迭代结束后以输出的模型为终点。当应用上线后，随着时间的推移，会出现模型漂移的问题。新的数据和新的特

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
不允许子账号使用公共资源池创建作业 - AI开发平台ModelArts

在用户的委托授权中同步增加此策略，避免在租户面通过委托token突破限制。在统一身份认证服务页面的左侧导航中选择委托，找到该用户组在ModelArts上使用的委托名称，单击右侧的“修改”操作，选择“授权记录”页签，单击“授权”，选中上一步创建的自定义策略“不允许用户使用公共资源池”，单击“下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
Eagle投机小模型训练 - AI开发平台ModelArts

Eagle的模型大小及结构，与基模型的某一层完全相同，这使得它的大小远远小于其基模型。解决了对于部分原始LLM模型，找不到合适的投机模型的问题。投机小模型训练端到端示例本章节提供eagle小模型自行训练的能力，客户可通过本章节，使用自己的数据训练eagle小模型，并使用自行训练的小模型进行eagle

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
使用kv-cache-int8量化 - AI开发平台ModelArts

本章节介绍如何在Notebook使用tensorRT量化工具实现推理量化。 Step1使用tensorRT量化工具进行模型量化在GPU机器上使用tensorRT 0.9.0版本工具进行模型量化，工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
新建Workflow Execution - AI开发平台ModelArts

表3 StepExecution 参数是否必选参数类型描述 step_name 否 String 节点的名称，在一个DAG中唯一，1到64位只包含中英文，数字，空格，下划线（_）和中划线（-），并且以中英文开头。 duration 否 Integer Execution执行的运行时长。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
使用kv-cache-int8量化 - AI开发平台ModelArts

本章节介绍如何在Notebook使用tensorRT量化工具实现推理量化。 Step1使用tensorRT量化工具进行模型量化在GPU机器上使用tensorRT 0.9.0版本工具进行模型量化，工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

本章节介绍如何在Notebook使用tensorRT量化工具实现推理量化。 Step1使用tensorRT量化工具进行模型量化在GPU机器上使用tensorRT 0.9.0版本工具进行模型量化，工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

本章节介绍如何在Notebook使用tensorRT量化工具实现推理量化。 Step1使用tensorRT量化工具进行模型量化在GPU机器上使用tensorRT 0.9.0版本工具进行模型量化，工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
订阅Workflow - AI开发平台ModelArts

在ModelArts控制台左侧导航栏，单击Workflow(Beta)。在Workflow列表中，找到从Gallery导入的Workflow，单击“配置”进入到该Workflow。取消或找回已订阅的Workflow 当不需要使用AI Gallery中订阅的Workflow时，可以取消订阅该Work

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
查询训练作业列表 - AI开发平台ModelArts

响应参数状态码： 200 表4 响应Body参数参数参数类型描述 total Integer 查询到当前用户名下的所有作业总数。 count Integer 查询到当前用户名下的所有符合查询条件的作业总数。 limit Integer 查询作业的每页条目数。最小为1，最大为50。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
修改Workflow工作流 - AI开发平台ModelArts

WorkflowStep 参数是否必选参数类型描述 name 是 String Workflow工作流节点的名称，在一个DAG中唯一，1到64位只包含中英文，数字，空格，下划线（_）和中划线（-），并且以中英文开头。 type 否 String 节点的类型，枚举值如下: job

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
Notebook Cache盘告警上报 - AI开发平台ModelArts

则后，系统根据关联SMN主题与消息模板来发送告警通知。更多详情请参考AOM用户指南。根据界面提示填写行动规则名称，选择行动规则类型，选择上一步创建的主题，选择消息模板，然后单击“确定”。图6 新建告警行动规则在之前打开的“创建告警规则”页面的告警通知区域，“行动规则”选择新创建的告警行动规则，单击“立即创建”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

模型提供的推理接口所使用的协议和端口号，请根据模型实际定义的推理接口进行配置。 “镜像复制” 镜像复制开关，选择是否将容器镜像中的模型镜像复制到ModelArts中。关闭时，表示不复制模型镜像，可极速创建模型，更改或删除SWR源目录中的镜像会影响服务部署。开启时，表示复制模型镜像

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型

总条数： 1100

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在ECS中创建ma-user和ma-group - AI开发平台ModelArts

Controlnet训练 - AI开发平台ModelArts

获取Workflow工作流列表 - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

创建Workflow训练作业节点 - AI开发平台ModelArts

在Dify中配置支持Function Calling的模型使用 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

什么是Workflow - AI开发平台ModelArts

不允许子账号使用公共资源池创建作业 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

新建Workflow Execution - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

订阅Workflow - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

修改Workflow工作流 - AI开发平台ModelArts

Notebook Cache盘告警上报 - AI开发平台ModelArts

从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线