搜索_华为云

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

推理精度测试推理模型量化 eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题附录：工作负载Pod异常问题和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

推理精度测试推理模型量化 Eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题附录：工作负载Pod异常问题和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

参考pull/push 镜像体验章节，将上一步build的镜像上传到容器镜像服务上。 Step5 使用CCE进行部署在CCE上创建工作负载，创建工作负载时所需的yaml文件可参考在Lite Cluster资源池上使用Snt9B完成推理任务。在CCE上创建服务。父主题：文生图模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

部署推理服务推理性能测试推理精度测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题附录：工作负载Pod异常问题和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
新建Workflow Execution - AI开发平台ModelArts

objects 节点steps使用到的参数。 policies 否 WorkflowDagPolicies object 执行记录使用到的执行策略。表3 StepExecution 参数是否必选参数类型描述 step_name 否 String 节点的名称，在一个DAG中唯一

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
管理Workflow Execution - AI开发平台ModelArts

操作名称，枚举如下: stop 停止 rerun 重跑 policies 否 ExecutionActionPolicy object 动作策略。 parameters 否 Array of WorkflowParameter objects 参数。 data_requirements

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
Notebook Cache盘告警上报 - AI开发平台ModelArts

单击“创建主题”填写主题名称，选择企业项目后，单击确定即可创建一个主题。单击主题名称“操作”列的“更多 > 设置主题策略”。选择APM，即允许AOM的告警触发SMN服务。图5 设置主题策略单击主题名称“操作”列的“添加订阅”。订阅成功后，一旦满足告警条件，那么就会收到通知。选择合适的协

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
查询服务详情 - AI开发平台ModelArts

在线/批量服务使用的AI专属资源池弹性集群的资源池ID，仅当配置专属资源池时返回。 load_balancer_policy String 在线同步服务设置elb后端转发策略详情枚举值：ROUND_ROBIN(加权轮询算法)，LEAST_CONNECTIONS(加权最少连接)，SOURCE_IP(源ip算法) 表4

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

不同模型推荐的参数与NPU卡数设置表1 不同模型推荐的参数与NPU卡数设置模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值优化工具 (Deepspeed) 规格与节点数 Qwen-VL Qwen-VL 7B full 2048 gr

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
更新Workflow Execution - AI开发平台ModelArts

objects 节点steps使用到的参数。 policies 否 WorkflowDagPolicies object 执行记录使用到的执行策略。表3 StepExecution 参数是否必选参数类型描述 step_name 否 String 节点的名称，在一个DAG中唯一

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

不同模型推荐的参数与NPU卡数设置表1 不同模型推荐的参数与NPU卡数设置模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值优化工具 (Deepspeed) 规格与节点数 Qwen-VL Qwen-VL 7B full 2048 gr

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
AI开发基本流程介绍 - AI开发平台ModelArts

实际数据或新产生数据中，进行预测、评价、或以可视化和报表的形式把数据中的高价值信息以精辟易懂的形式提供给决策人员，帮助其制定更加正确的商业策略。父主题： AI开发基础知识

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
使用MaaS压缩模型 - AI开发平台ModelArts

ModelArts Studio大模型即服务平台当前支持SmoothQuant-W8A8和AWQ-W4A16两种压缩策略。表1 压缩策略的适用场景压缩策略场景 SmoothQuant-W8A8 长序列的场景大并发量的场景 AWQ-W4A16 小并发量的低时延场景更少推理卡数部署的场景

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
在JupyterLab中创建定时任务 - AI开发平台ModelArts

formats：执行结果的输出文件类型。 Parameter：单击+，手动设置运行Notebook的python变量。 Schedule：任务执行策略，可以立即运行；也可以设置定时策略运行，支持cron表达式。 cron表达式需要使用linux系统下支持的格式，其他的cron表达式会报错。表达式可能会包含

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
更新服务配置 - AI开发平台ModelArts

es> 服务级别附加属性，便于服务管理。 load_balancer_policy 否 String 只支持在线同步服务设置后端elb转发策略，枚举值：ROUND_ROBIN(加权轮询算法)，LEAST_CONNECTIONS(加权最少连接)，SOURCE_IP(源ip算法) 表4

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
管理Workflow StepExecution - AI开发平台ModelArts

object Execution执行的错误信息。 policy WorkflowStepExecutionPolicy object 节点的执行策略。 conditions_execution WorkflowConditionExecution object 条件执行。 step_title

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
LoRA微调训练 - AI开发平台ModelArts

由于模型中LoRA微调训练存在已知的精度问题，因此不支持TP(tensor model parallel size)张量模型并行策略，推荐使用PP(pipeline model parallel size)流水线模型并行策略，具体详细参数配置如表2所示。 Step2 创建LoRA微调训练任务创建训练作业，并自定义

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
快速配置ModelArts委托授权 - AI开发平台ModelArts

无法完全达到企业对权限最小化的安全管控要求。策略授权：IAM最新提供的一种细粒度授权的能力，可以精确到具体服务的操作、资源以及请求条件等。基于策略的授权是一种更加灵活的授权方式，能够满足企业对权限最小化的安全管控要求。角色与策略相关介绍请参考权限基本概念。 “新增委托 > 权限配置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
查询Workflow Execution - AI开发平台ModelArts

objects 节点steps使用到的参数。 policies WorkflowDagPolicies object 执行记录使用到的执行策略。表3 StepExecution 参数参数类型描述 step_name String 节点的名称，在一个DAG中唯一，1到64位只

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

security_group_id 否 String 安全组，默认为空，当配置了vpc_id则此参数必填。安全组起着虚拟防火墙的作用，为服务实例提供安全的网络访问控制策略。安全组须包含至少一条入方向规则，对协议为TCP、源地址为0.0.0.0/0、端口为8080的请求放行。 subnet_network_id

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理

总条数： 264

上一页
1
...
5
6
7
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

新建Workflow Execution - AI开发平台ModelArts

管理Workflow Execution - AI开发平台ModelArts

Notebook Cache盘告警上报 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

更新Workflow Execution - AI开发平台ModelArts

不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

AI开发基本流程介绍 - AI开发平台ModelArts

使用MaaS压缩模型 - AI开发平台ModelArts

在JupyterLab中创建定时任务 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

管理Workflow StepExecution - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

快速配置ModelArts委托授权 - AI开发平台ModelArts

查询Workflow Execution - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线