搜索_华为云

Wav2Lip推理基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

推荐使用“西南-贵阳一”Region上的Lite Server资源和Ascend Snt9B单机单卡。表1 环境要求名称版本 PyTorch pytorch_2.1.0 驱动 23.0.6 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
获取模型推理的Profiling数据 - AI开发平台ModelArts

I/O等）的使用情况、程序的运行时间、函数的调用频率等数据，以发现系统性能瓶颈，优化程序代码和系统配置。目前支持两种获取Profiling数据的方法，分别是通过LLM对象的start_profile、stop_profile接口和offline_profile.py脚本。 Profiling结果的格

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理服务性能评测
数据准备使用流程 - AI开发平台ModelArts

提供对数据进行多维筛选的能力，用户可以根据样本属性、标注信息等进行样本筛选。提供12+标注工具，方便用户进行精细化、场景化和专业化的数据标注。提供基于样本和标注结果进行特征分析，帮助用户整体了解数据的质量。提升用户数据准备的效率。提供数据版本管理能力，帮助用户提升数据管理的效率。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
使用AWQ量化工具转换权重 - AI开发平台ModelArts

/pile-val", split="validation") 运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers sentencepiece #安装量化工具依赖 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

/pile-val", split="validation") 运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers sentencepiece #安装量化工具依赖 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
AI Gallery简介 - AI开发平台ModelArts

Gallery的AI说模块为开发者提供自由分享各类AI领域内知识和经验的平台。开发者既可以发布个人技术文章，也可以阅读和学习他人分享的技术文章。案例库介绍 AI Gallery的案例库是面向场景化交付的AI资产的组合和使用案例。案例中沉淀了基于业务场景的AI知识、经验和部分通用的业务逻辑，能够为某些具体的业务场景提供AI环节的解决方案。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
免费资产和商用资产 - AI开发平台ModelArts

免费资产和商用资产 AI Gallery既有免费分享的AI资产，也有商业售卖的AI资产。免费资产无需支付费用，只需要支付在使用过程中消耗的硬件资源，硬件资源费用将根据实际使用情况由华为云ModelArts等管理控制台向使用方收取。当前支持免费分享和订阅的资产类型有：Noteb

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
订阅Workflow - AI开发平台ModelArts

注册并登录华为云，且创建好OBS桶用于存储算法和Workflow。订阅免费Workflow 登录“AI Gallery”。选择“资产集市 > MLOps > Workflow”，进入Workflow页面，该页面展示了所有共享的Workflow。搜索业务所需的免费Workflow，请参见查找和收藏资产。单击目标Workflow进入详情页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
创建AI应用 - AI开发平台ModelArts

EXACT：和指定的版本完全一致。 ATLEAST：不低于指定的版本。 ATMOST：不高于指定的版本。表9 CreateModelRequestModelApis 参数是否必选参数类型描述 protocol 否 String 请求协议，可选HTTP和HTTPS。 method

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
创建在线服务包 - AI开发平台ModelArts

ages 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是 String 工作流的ID。请求参数表2 请求Body参数参数是否必选参数类型描述 status

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
SD3基于Lite Server适配PyTorch NPU的训练指导（6.3.912） - AI开发平台ModelArts

推荐使用“西南-贵阳一”Region上的Server资源和Ascend Snt9B单机。表1 环境要求名称版本 driver 23.0.6 PyTorch pytorch_2.1.0 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

当前推理业务的操作系统及版本，如：Ubuntu 22.04。是否使用容器化运行业务，以及容器中OS版本，HostOS中是否有业务软件以及HostOS的类型和版本。需要评估是否愿意迁移到华为云的通用OS。 - AI引擎及版本当前引擎（TF/PT/LibTorch），是否接受切换MindSpore。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
删除API - AI开发平台ModelArts
删除API - AI开发平台ModelArts

_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 service_id 是 String 服务ID。 api_id 是 String API ID。表2 Query参数参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
修改工作空间 - AI开发平台ModelArts

PUBLIC：租户内部公开访问。 PRIVATE：仅创建者和主账号可访问。 INTERNAL：创建者、主账号、指定IAM子账号可访问，需要与grants参数配合使用。 name 否 String 工作空间名称。长度限制为4-64字符，支持中文、大小写字母、数字、中划线和下划线。同时'default'为系

 帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
配置授权 - AI开发平台ModelArts
配置授权 - AI开发平台ModelArts

project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 user_id 否 String 用户ID，获取方法请参见获取用户ID和名称。当user_id为all时，表示对所有IAM子用户进行授权，如果已有部分用户已授权，则更新授权。

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
SD3 Diffusers框架基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

本文档适配昇腾云ModelArts 6.3.907版本，请参考表1获取配套版本的软件包和镜像，请严格遵照版本配套关系使用本文档。确保容器可以访问公网。资源规格要求推荐使用“西南-贵阳一”Region上的Lite Server资源和Ascend Snt9B。软件配套版本表1 获取软件分类名称

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
创建ModelArts委托 - AI开发平台ModelArts

/v2/{project_id}/agency 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 agency_name_suffix 否 String 委托名称后缀。

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
查询OS的配额 - AI开发平台ModelArts

/v1/{project_id}/quotas 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型描述 quotas Quota object 资源配额。

帮助中心 > AI开发平台ModelArts > API参考 > 配额管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

911版本仅是使用run_type来指定训练的类型，只能区分预训练、全参微调和lora微调但实际上预训练和sft是训练的不同阶段，全参、lora是训练参数设置方式。为了更加明确的区分不同策略，以及和llama-factory对齐，6.3.912版本调整以下参数：新增STAGE，表示训练的阶段，可以选择的参数包括:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite Server上的预训练和全量微调方案。训练框架使用的是ModelLink。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911）

总条数： 1277

上一页
1
...
55
56
57
...
64
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Wav2Lip推理基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

获取模型推理的Profiling数据 - AI开发平台ModelArts

数据准备使用流程 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

AI Gallery简介 - AI开发平台ModelArts

免费资产和商用资产 - AI开发平台ModelArts

订阅Workflow - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

创建在线服务包 - AI开发平台ModelArts

SD3基于Lite Server适配PyTorch NPU的训练指导（6.3.912） - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

删除API - AI开发平台ModelArts

修改工作空间 - AI开发平台ModelArts

配置授权 - AI开发平台ModelArts

SD3 Diffusers框架基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

创建ModelArts委托 - AI开发平台ModelArts

查询OS的配额 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线