搜索_华为云

Prefix Caching - AI开发平台ModelArts

Cache复用。 Prefix Caching参数设置启动推理服务时，使用Prefix Cache特性需要配置的补充参数如表1所示，对应的代码样例如表2所示。表1 Prefix Cache特性参数服务启动方式配置项取值类型取值范围配置说明 offline enable_prefix_caching

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
非分离部署推理服务 - AI开发平台ModelArts

建议使用官方提供的镜像部署推理服务。镜像地址{image_url}获取请参见表1。 docker pull {image_url} 步骤三上传代码包和权重文件上传安装依赖软件推理代码AscendCloud-LLM-6.3.909-xxx.zip和算子包AscendCloud-OPP-6.3.909-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
用户名密码认证模式 - AI开发平台ModelArts

用户名密码认证模式本模式支持OBS管理、训练管理、模型管理、服务管理的鉴权。示例代码账号与用户的概念介绍，请参见IAM基本概念。获取您的账号、用户名等信息，请参见获取用户名、用户ID、项目名称、项目ID。使用账号认证 “username”填写您的账号名。 1 2 from

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
Pytorch Mox日志反复输出 - AI开发平台ModelArts

的被导入，导致打印很多Mox的版本信息。处理方法为避免训练作业Pytorch Mox日志反复输出的问题，需要您在“启动文件”中添加如下代码，当“MOX_SILENT_MODE = “1””时，可在日志中屏蔽mox的版本信息： import os os.environ["MOX_SILENT_MODE"]

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
从0制作自定义镜像用于创建训练作业（Pytorch+Ascend） - AI开发平台ModelArts

0.0 代码目录：设置为OBS中存放启动脚本文件的目录，例如：“obs://test-modelarts/pytorch/demo-code/”，训练代码会被自动下载至训练容器的“${MA_JOB_DIR}/demo-code”目录中，“demo-code”为OBS存放代码路径的最后一级目录，可以根据实际修改。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本教程案例是基于ModelArts Lite Server运行的，需要购买并开通Server资源。准备代码准备AscendSpeed训练代码、分词器Tokenizer和推理代码。准备数据准备训练数据，可以用本案使用的数据集，也可以使用自己准备的数据集。准备镜像准备训练模型适用的容器镜像。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909）
ModelArts Standard训练作业和模型部署如何收费？ - AI开发平台ModelArts

ModelArts支持将模型按照业务需求部署为服务。训练类型不同，部署后的计费方式不同。将模型部署为服务时，根据数据集大小评估模型的计算节点个数，根据实际编码情况选择计算模式。具体计费方式请参见ModelArts产品价格详情。父主题：计费FAQ

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本教程案例是基于ModelArts Lite Server运行的，需要购买并开通Server资源。准备代码准备AscendSpeed训练代码、分词器Tokenizer和推理代码。准备数据准备训练数据，可以用本案使用的数据集，也可以使用自己准备的数据集。准备镜像准备训练模型适用的容器镜像。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）
在ModelArts中导入模型对于镜像大小有什么限制？ - AI开发平台ModelArts

在创建资源池时自定义设置，设置专属资源池容器引擎空间不会造成额外费用增加。如果使用的是OBS导入或者训练导入，则包含基础镜像、模型文件、代码、数据文件和下载安装软件包的大小总和。如果使用的是自定义镜像导入，则包含解压后镜像和镜像下载文件的大小总和。父主题： Standard推理部署

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
Bert基于DevServer适配MindSpore Lite推理指导(6.3.910) - AI开发平台ModelArts

不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。获取代码并上传上传推理代码AscendCloud-CV-6.3.910-xxx.zip到宿主机的工作目录中，包获取路径请参见表2。上传代码到宿主机时使用的是root用户，此处需要在容器中执行如下命令统一文件属主为ma-user用户。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
LLaVA-NeXT基于Lite Server适配PyTorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

ma-user:ma-group ${container_work_dir} 此步骤可能需要密码或root权限。步骤五下载代码安装环境下载华为侧插件代码包AscendCloud-AIGC-6.3.912-xxx.zip文件，获取路径参见表1 获取软件和镜像。 mv AscendCloud-AIGC-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
推理场景介绍 - AI开发平台ModelArts

AscendCloud-6.3.909-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的推理部署代码和推理评测代码、推理依赖的算子包。代码包具体说明请参见模型软件包结构说明。获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件信

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）
创建训练作业参数 - AI开发平台ModelArts

String 训练作业的代码目录。如：“/usr/app/”。应与boot_file_url一同出现，若填入model_id则app_url/boot_file_url和engine_id无需填写。 boot_file_url 是 String 训练作业的代码启动文件，需要在代码目录下，如：“/usr/app/boot

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
Manifest管理概述 - AI开发平台ModelArts

注内容的对应关系。Manifest文件中也可以只有原始文件信息，没有标注信息，如生成的未标注的数据集。 Manifest文件使用UTF-8编码，Manifest处理程序需具备UTF-8处理能力。 Manifest文件中文本分类的source数值可以包含中文，其他字段不建议用中文。

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

3.905-xxx.zip文件中的ascendcloud-aigc-poc-sdxl-finetune.tar.gz代码包。解压后上传到宿主机上。依赖的插件代码包、模型包和数据集存放在宿主机上的本地目录结构如下，供参考。 [root@devserver-ei-cto-office-ae06cae7-tmp1216

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
多模态 - AI开发平台ModelArts
多模态 - AI开发平台ModelArts

--gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0.9。 --trust-remote-code：是否相信远程代码。 --chat-template：对话构建模板，可选参数。如：llava chat-template：${vllm_path}/examples/template_llava

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

modeling_xxx.py （可选）自定义模型的代码文件，继承自PretrainedModel，包含实现自定义推理逻辑的代码。 configuration_xxx.py （可选）自定义配置的代码文件，继承自PretrainedConfig，包含实现自定义配置的逻辑代码。父主题：构建模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
Standard模型训练 - AI开发平台ModelArts

如何在ModelArts训练作业中加载部分训练好的参数？ ModelArts训练时使用os.system('cd xxx')无法进入文件夹怎么办？在ModelArts训练代码中，如何获取依赖文件所在的路径？自如何获取ModelArts训练容器中的文件实际路径？ ModelArts训练中不同规格资源“/cache”目录的大小是多少？

帮助中心 > AI开发平台ModelArts > 常见问题
部署在线服务 - AI开发平台ModelArts

部署在线服务predictor。部署批量服务transformer。部署服务返回服务对象Predictor，其属性包括服务管理章节下的所有功能。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
创建训练作业 - AI开发平台ModelArts

是否必选类型描述 code_dir 是 String 训练作业的代码目录，是一个OBS路径，需要以"obs:/"开头，如"obs://xx/yy/"。 boot_file 是 String 训练作业的代码启动文件，需要在代码目录下，可填写相对路径，如"boot_file.py"，也可

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业

总条数： 1361

上一页
1
...
55
56
57
...
69
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Prefix Caching - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

用户名密码认证模式 - AI开发平台ModelArts

Pytorch Mox日志反复输出 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Pytorch+Ascend） - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

ModelArts Standard训练作业和模型部署如何收费？ - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在ModelArts中导入模型对于镜像大小有什么限制？ - AI开发平台ModelArts

Bert基于DevServer适配MindSpore Lite推理指导(6.3.910) - AI开发平台ModelArts

LLaVA-NeXT基于Lite Server适配PyTorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

创建训练作业参数 - AI开发平台ModelArts

Manifest管理概述 - AI开发平台ModelArts

SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

多模态 - AI开发平台ModelArts

使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线