搜索_华为云

部署推理服务 - AI开发平台ModelArts

ings”和“seq_length”；如果设置过大，会占用过多显存，影响kvcache的空间。不同模型推理支持的max-model-len长度不同，具体差异请参见附录：基于vLLM不同模型推理支持最小卡数和最大序列说明。 --trust-remote-code：是否相信远程代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
执行预训练任务 - AI开发平台ModelArts

sh scripts/llama2/0_pl_pretrain_70b.sh 以上命令多台机器执行时，只有${NODE_RANK}的节点ID值不同，其他参数都保持一致；其中MASTER_ADDR、 NNODES、 NODE_RANK 为必填。单机启动对于Llama2-7B和Lla

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908）
执行预训练任务 - AI开发平台ModelArts

sh scripts/llama2/0_pl_pretrain_70b.sh 以上命令多台机器执行时，只有${NODE_RANK}的节点ID值不同，其他参数都保持一致；其中MASTER_ADDR、 NNODES、 NODE_RANK 为必填。单机启动对于Llama2-7B和Lla

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909）
执行预训练任务 - AI开发平台ModelArts

sh scripts/llama2/0_pl_pretrain_70b.sh 以上命令多台机器执行时，只有${NODE_RANK}的节点ID值不同，其他参数都保持一致；其中MASTER_ADDR、 NNODES、 NODE_RANK 为必填。单机启动对于Llama2-7B和Lla

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910）
执行预训练任务 - AI开发平台ModelArts

sh scripts/llama2/0_pl_pretrain_70b.sh 以上命令多台机器执行时，只有${NODE_RANK}的节点ID值不同，其他参数都保持一致；其中MASTER_ADDR、 NNODES、 NODE_RANK 为必填。单机启动对于Llama2-7B和Lla

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911）
从0制作自定义镜像用于创建训练作业（Pytorch+Ascend） - AI开发平台ModelArts

"https://docker.jianmuhub.com", "https://huecker.io", "https://dockerhub.timeweb.cloud", "https://dockerhub1.beget.com", "https://noohub.ru"] } 依次执行systemctl

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
AI开发基本流程介绍 - AI开发平台ModelArts

在开始AI开发之前，必须明确要分析什么？要解决什么问题？商业目的是什么？基于商业的理解，整理AI开发框架和思路。例如，图像分类、物体检测等等。不同的项目对数据的要求，使用的AI开发手段也是不一样的。准备数据数据准备主要是指收集和预处理数据的过程。按照确定的分析目的，有目的性的收

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
查询团队标注任务详情 - AI开发平台ModelArts

true：执行完智能标注后，将待确认结果同步至团队成员。 false：不同步智能标注结果（默认值）。 synchronize_data Boolean 团队标注任务是否同步更新新增数据。可选值如下： true：上传文件、同步数据源、导入的未标注文件同步分配至团队成员。 false：不同步更新新增数据（默认值）。 task_id

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

json存在模型对应的路径下，例如：${container_work_dir}/chatglm3-6b/config.json。不同模型推理支持的max-model-len长度不同，具体差异请参见附录：基于vLLM不同模型推理支持最小卡数和最大序列说明。 --max-num-batched-tokens：pref

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
执行训练任务（推荐） - AI开发平台ModelArts

AlpacaStyleInstructionHandler SharegptStyleInstructionHandler 示例值需要根据数据集${dataset}的不同，选择其一。 GeneralPretrainHandler：使用预训练的alpaca数据集。 GeneralInstructionHandler：使用微调的alpaca数据集。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
认证鉴权 - AI开发平台ModelArts
认证鉴权 - AI开发平台ModelArts

可以使用专门的签名SDK对请求进行签名。详细的签名方法和SDK使用方法请参见API签名指南。签名SDK只提供签名功能，与服务提供的SDK不同，使用时请注意。父主题：如何调用API

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
发布Workflow到AI Gallery - AI开发平台ModelArts

白名单列表，仅支持填写domain_id，当visibility为"group"时才需要填写该字段否 list[str] 根据方法的入参不同，主要可分为以下两种使用场景： Workflow.release_to_gallery(title="资产名称")发布Workflow新资产，版本号为"1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
advisor调优总体步骤 - AI开发平台ModelArts

advisor插件进行性能分析，源数据选择OBS并指定profiling所在的OBS路径。由于pp参数为4，考虑到不同pp stage的计算量存在差异，advisor会自动对不同stage进行计算维度的分析，因此在Advanced Setting中设置分析进程为2（不建议设置太大，避免

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
启动推理服务 - AI开发平台ModelArts

json存在模型对应的路径下，例如：${container_work_dir}/chatglm3-6b/config.json。不同模型推理支持的max-model-len长度不同，具体差异请参见表1。 --max-num-batched-tokens：prefill阶段，最多会使用多少tok

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
部署在线服务 - AI开发平台ModelArts

model_id="model_id1", # model_id1和model_id2必须是同一个模型的不同版本对应的model_id weight="70", specification="modelarts.vm

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

当推理服务处于“运行中”时，在服务列表单击操作列的“更多 > 服务详情”，在弹窗中选择“指标效果”页签，可以查看推理效果。支持设置时间区间，查看不同时间下的推理效果。仅当推理服务处于“运行中”，才支持查看监控指标。表2 推理效果的指标介绍指标名称指标说明 CPU使用率在推理服务启动过程中，机器的CPU占用情况。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

仅支持FP16和BF16数据类型推理。本案例仅支持在专属资源池上运行。专属资源池驱动版本要求23.0.6。支持的模型列表和权重文件本方案支持vLLM的v0.5.0版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

用户登录并验证权限。新创建的用户登录控制台，切换至授权区域，验证权限：在“服务列表”中选择ModelArts，进入ModelArts主界面，选择不同类型的专属资源池，在页面单击“创建”，如果无法进行创建（当前权限仅包含ModelArts CommonOperations），表示“ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
使用TMS标签实现资源分组管理 - AI开发平台ModelArts

添加标签用户也可以在ModelArts任务中添加标签时，创建新的标签，直接输入标签键和标签值即可。此处创建的标签仅当前的项目Project可见。不同的项目中查看不到。 Step3 在TMS中根据资源类型查询ModelArts资源使用情况登录TMS控制台，在资源标签页面根据资源类型和资源标签查询指定区域的资源任务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
创建ModelArts数据增强任务 - AI开发平台ModelArts

型与您在本任务中选择的场景类别一致。选择“OBS目录”，存放结构支持“包含图片和标注信息”模式。 “包含图片和标注信息”，根据不同场景类型，结构不同。图像分类场景，其目录结构如下所示。如下目录结构，仅支持单标签场景。 input_path/ --label1/

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据

总条数： 809

上一页
1
...
33
34
35
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署推理服务 - AI开发平台ModelArts

执行预训练任务 - AI开发平台ModelArts

执行预训练任务 - AI开发平台ModelArts

执行预训练任务 - AI开发平台ModelArts

执行预训练任务 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Pytorch+Ascend） - AI开发平台ModelArts

AI开发基本流程介绍 - AI开发平台ModelArts

查询团队标注任务详情 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

认证鉴权 - AI开发平台ModelArts

发布Workflow到AI Gallery - AI开发平台ModelArts

advisor调优总体步骤 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

使用TMS标签实现资源分组管理 - AI开发平台ModelArts

创建ModelArts数据增强任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线