搜索_华为云

新建Workflow Execution - AI开发平台ModelArts

objects 节点steps使用到的数据。 parameters 否 Array of WorkflowParameter objects 节点steps使用到的参数。 policies 否 WorkflowDagPolicies object 执行记录使用到的执行策略。表3 StepExecution

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
准备镜像环境 - AI开发平台ModelArts

/etc/sysctl.conf sysctl -p | grep net.ipv4.ip_forward Step2 获取训练镜像建议使用官方提供的镜像部署训练服务。镜像地址{image_url}参见镜像地址获取。 docker pull {image_url} Step3 启动容器镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 准备工作
准备镜像环境 - AI开发平台ModelArts

/etc/sysctl.conf sysctl -p | grep net.ipv4.ip_forward Step2 获取训练镜像建议使用官方提供的镜像部署训练服务。镜像地址{image_url}参见镜像地址获取。 docker pull {image_url} Step3 启动容器镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作
删除节点池 - AI开发平台ModelArts

String 资源规格名称，比如：modelarts.vm.gpu.t4u8。 count Integer 规格保障使用量。 maxCount Integer 资源规格的弹性使用量，物理池该值和count相同。 azs Array of PoolNodeAz objects 资源池中节点的AZ信息。

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
在线服务鉴权 - AI开发平台ModelArts

value 否 Long 付费工作流可使用的时间值。响应参数状态码： 201 表4 响应Body参数参数参数类型描述 result String 认证结果。请求示例对在线服务进行鉴权。设置付费工作流计费周期为“day”，付费工作流可使用的时间为“100”。 POST h

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

/etc/sysctl.conf sysctl -p | grep net.ipv4.ip_forward Step2 获取训练镜像建议使用官方提供的镜像部署训练服务。镜像地址{image_url}参见镜像地址获取。 docker pull {image_url} Step3 启动容器镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 准备工作
1个节点的专属资源池，能否部署多个服务？ - AI开发平台ModelArts

算节点规格”时选择“自定义规格”，设置小一些或者选择小规格的服务节点规格，当资源池节点可以容纳多个服务节点规格时，就可以部署多个服务。如果使用此方式进行部署推理，选择的规格务必满足模型的要求，当设置的规格过小，无法满足模型的最小推理要求时，则会出现部署失败或预测失败的情况。图1

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard资源池
BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明在大模型训练中，BF16（Brain Floating Point）和FP16（Float16）都是使用的半精度浮点数格式，但它们在结构和适用性上有一些重要的区别。 BF16：具有8个指数位和7个小数位。在处理大模型时有优势，能够避免在训练过程中数值的上溢

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明在大模型训练中，BF16（Brain Floating Point）和FP16（Float16）都是使用的半精度浮点数格式，但它们在结构和适用性上有一些重要的区别。 BF16：具有8个指数位和7个小数位。在处理大模型时有优势，能够避免在训练过程中数值的上溢

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
更新Workflow Execution - AI开发平台ModelArts

objects 节点steps使用到的数据。 parameters 否 Array of WorkflowParameter objects 节点steps使用到的参数。 policies 否 WorkflowDagPolicies object 执行记录使用到的执行策略。表3 StepExecution

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
托管数据集到AI Gallery - AI开发平台ModelArts

单击“添加文件”，进入上传文件页面，选择本地的数据文件单击“点击上传”或拖动文件，单击“确认上传”启动上传。上传单个超过5GB的文件时，请使用Gallery CLI工具。CLI工具的获取和使用请参见Gallery CLI配置工具指南。文件合集大小不超过50GB。文件上传完成前，请不要刷新或关闭上传页面，防止意外终止上传任务，导致数据缺失。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
调用MaaS部署的模型服务 - AI开发平台ModelArts

理。 n 否 1 Int 返回多条正常结果。不使用beam_search场景下，n取值建议为1≤n≤10。如果n>1时，必须确保不使用greedy_sample采样，也就是top_k > 1，temperature > 0。使用beam_search场景下，n取值建议为1<n

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

/home/ma-user/ws 使用ma-user用户安装依赖包。 #进入scripts目录换 cd /home/ma-user/ws/llm_train/AscendSpeed #执行安装命令 sh scripts/install.sh 为了避免因使用不同版本的 transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
自动续费 - AI开发平台ModelArts
自动续费 - AI开发平台ModelArts

自动续费自动续费可以减少手动续费的管理成本，避免因忘记手动续费而导致ModelArts中专属资源池不能使用。自动续费的规则如下所述：以专属资源池的到期日计算第一次自动续费日期和计费周期。专属资源池自动续费周期以您选择的续费时长为准。例如，您选择了3个月，专属资源池即在每次到期前自动续费3个月。

帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

ModelArts在数据准备过程中，针对同一数据源的数据，对不同时间处理或标注后的数据，按照版本进行区分方便后续模型构建和开发时选择对应的数据集版本进行使用。关于数据集版本针对刚创建的数据集（未发布前），无数据集版本信息，必须执行发布操作后，才能应用于模型开发或训练。数据集版本，默认按V

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
导出ModelArts数据集中的数据到OBS - AI开发平台ModelArts

导出ModelArts数据集中的数据到OBS 针对数据集中的数据，用户可以选中部分数据或者通过条件筛选出需要的数据，当需要将数据集中的数据存储至OBS用于后续导出使用时，可通过此种方式导出成新的数据集。用户可以通过任务历史查看数据导出的历史记录。目前只有“图像分类”、“物体检测”、“图像分割”类型的数据集支持导出功能。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
Lite功能介绍 - AI开发平台ModelArts

用户的使用场景：用户在包长周期的资源池中无法扩容短周期的节点。用户无法在包周期的资源池中扩容按需的节点（包括AutoScaler场景）。支持SFS产品权限划分支持SFS权限划分特性，可以实现训练场景中，挂载的SFS的文件夹能够权限控制,避免出现所有人都可以挂载使用，导致某用户误删所有数据的情况。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
Yaml配置文件参数配置说明 - AI开发平台ModelArts

json配置文件所属的绝对路径；如使用自定义数据集，yaml配置文件需添加此参数。 template qwen 必须修改。用于指定模板。如果设置为"qwen"，则使用QWEN模板进行训练，模板选择可参照表1中的template列 max_samples 50000 用于指定训练过程中使用的最大样本数量

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

Access Denied." 原因分析 ModelArts.3551：数据输入或者输出的obs目录不存在 ModelArts.3567：使用的数据输入或者输出obs目录存在，但是当前账号无权限访问处理方法 ModelArts.3551：到obs检查输入数据目录是否存在，如果不

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

ip_forward=1/g' /etc/sysctl.conf sysctl -p | grep net.ipv4.ip_forward 步骤二获取训练镜像建议使用官方提供的镜像部署训练服务。镜像地址{image_url}参见镜像地址获取。 docker pull {image_url} 步骤三启动容器镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作

总条数： 2070

上一页
1
...
92
93
94
...
104
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建Workflow Execution - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

删除节点池 - AI开发平台ModelArts

在线服务鉴权 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

1个节点的专属资源池，能否部署多个服务？ - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

更新Workflow Execution - AI开发平台ModelArts

托管数据集到AI Gallery - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

自动续费 - AI开发平台ModelArts

发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

导出ModelArts数据集中的数据到OBS - AI开发平台ModelArts

Lite功能介绍 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线