搜索_华为云

已找到以下 742 条记录

产品选择

AI开发平台ModelArts

所有产品

弹性云服务器 ECS

华为云Flexus云服务

裸金属服务器 BMS

云手机服务器 CPH

专属主机 DeH

弹性伸缩 AS

镜像服务 IMS

函数工作流 FunctionGraph

VR云渲游平台 CVR

Huawei Cloud EulerOS

云耀云服务器（旧版）

对象存储服务 OBS

云硬盘 EVS

云备份 CBR

弹性文件服务 SFS

存储容灾服务 SDRS

云硬盘备份 VBS

云服务器备份 CSBS

数据快递服务 DES

云存储网关 CSG

专属分布式存储服务 DSS

数据工坊 DWR

地图数据 MapDS

键值存储服务 KVS

高性能弹性文件服务 SFS Turbo

虚拟私有云 VPC

弹性公网IP EIP

弹性负载均衡 ELB

NAT网关 NAT

云专线 DC

虚拟专用网络 VPN

云连接 CC

VPC终端节点 VPCEP

企业路由器 ER

企业交换机 ESW

全球加速 GA

企业连接 EC

云容器引擎 CCE

Autopilot集群

云容器实例 CCI

容器镜像服务 SWR

云原生服务中心 OSC

应用服务网格 ASM

华为云UCS

内容分发网络 CDN

智能边缘云 IEC

智能边缘平台 IEF

CloudPond云服务

云数据库 RDS

数据复制服务 DRS

文档数据库服务 DDS

分布式数据库中间件 DDM

云数据库 GaussDB

云数据库 GeminiDB

数据管理服务 DAS

数据库和应用迁移 UGO

云数据库 GaussDB(for MySQL)

安全技术与应用

Web应用防火墙 WAF

企业主机安全 HSS

云防火墙 CFW

安全云脑 SecMaster

DDoS防护 AAD

数据加密服务 DEW

数据库安全服务 DBSS

云堡垒机 CBH

数据安全中心 DSC

云证书管理服务 CCM

威胁检测服务 MTD

态势感知 SA

认证测试中心 CTC

AI开发平台ModelArts

华为HiLens

图引擎服务 GES

图像识别 Image

文字识别 OCR

自然语言处理 NLP

内容审核 Moderation

图像搜索 ImageSearch

医疗智能体 EIHealth

企业级AI应用开发专业套件 ModelArts Pro

人脸识别服务 FRS

对话机器人服务 CBS

语音交互服务 SIS

知识图谱 KG

人证核身服务 IVS

视频智能分析服务 VIAS

城市智能体

自动驾驶云服务 Octopus

盘古大模型 PanguLargeModels

MapReduce服务 MRS

数据湖探索 DLI

表格存储服务 CloudTable

可信智能计算服务 TICS

推荐系统 RES

云搜索服务 CSS

数据可视化 DLV

数据接入服务 DIS

数据仓库服务 GaussDB(DWS)

数据治理中心 DataArts Studio

湖仓构建 LakeFormation

智能数据洞察 DataArts Insight

设备接入 IoTDA

IoT物联网

全球SIM联接 GSL

IoT数据分析 IoTA

路网数字化服务 DRIS

IoT边缘 IoTEdge

设备发放 IoTDP

微服务引擎 CSE

分布式消息服务Kafka版

分布式消息服务RabbitMQ版

分布式消息服务RocketMQ版

API网关 APIG

分布式缓存服务 DCS

多活高可用服务 MAS

事件网格 EG

域名注册服务 Domains

云解析服务 DNS

企业门户 EWP

ICP备案

商标注册

华为云WeLink

华为云会议 Meeting

隐私保护通话 PrivateNumber

语音通话 VoiceCall

消息&短信 MSGSMS

云管理网络

SD-WAN 云服务

边缘数据中心管理 EDCM

云桌面 Workspace

应用与数据集成平台 ROMA Connect

ROMA资产中心 ROMA Exchange

API全生命周期管理 ROMA API

政企自服务管理 ESM

应用平台 AppStage

开天企业工作台 MSSE

开天集成工作台 MSSI

API中心 API Hub

云消息服务 KooMessage

交换数据空间 EDS

云地图服务 KooMap

云手机服务 KooPhone

组织成员账号 OrgID

云空间服务 KooDrive

实时音视频 SparkRTC

视频直播 Live

视频点播 VOD

媒体处理 MPC

视频接入服务 VIS

数字内容生产线 MetaStudio

统一身份认证服务 IAM

消息通知服务 SMN

云监控服务 CES

应用运维管理 AOM

应用性能管理 APM

云日志服务 LTS

云审计服务 CTS

标签管理服务 TMS

配置审计 Config

应用身份管理服务 OneAccess

资源访问管理 RAM

组织 Organizations

资源编排服务 RFS

优化顾问 OA

IAM 身份中心

云运维中心 COC

资源治理中心 RGC

主机迁移服务 SMS

对象存储迁移服务 OMS

云数据迁移 CDM

迁移中心 MGC

区块链服务 BCS

可信跨链服务 TCS

可信分布式身份服务 TDIS

数字资产链 DAC

华为云区块链引擎服务 HBS

专属计算集群 DCC

高性能计算 HPC

SAP

混合云灾备

开天工业工作台 MIW

Haydn解决方案工厂

数字化诊断治理专家服务

SDK开发指南

API签名指南

DevStar

华为云命令行工具服务 KooCLI

Huawei Cloud Toolkit

CodeArts API

成本优化最佳实践

专属云商业逻辑

云架构中心

云商店

合作伙伴中心

华为云开发者学堂

华为云慧通差旅

账号中心

费用中心

成本中心

资源中心

企业管理

工单管理

客户运营能力

国际站常见问题

支持计划

专业服务

合作伙伴支持计划

我的凭证

华为云公共事业服务云平台

管理控制台

消息中心

产品价格详情

系统权限

客户关联华为云合作伙伴须知

公共问题

宽限期保留期

奖励推广计划

活动

云服务信任体系能力说明

工业数字模型驱动引擎

硬件开发工具链平台云服务

软件开发生产线 CodeArts

需求管理 CodeArts Req

流水线 CodeArts Pipeline

代码检查 CodeArts Check

编译构建 CodeArts Build

部署 CodeArts Deploy

测试计划 CodeArts TestPlan

制品仓库 CodeArts Artifact

移动应用测试 MobileAPPTest

CodeArts IDE Online

Classroom

开源镜像站 Mirrors

性能测试 CodeArts PerfTest

应用管理与运维平台 ServiceStage

云应用引擎 CAE

开源治理服务 CodeArts Governance

Astro轻应用 AstroZero

CodeArts IDE

Astro工作流 AstroFlow

代码托管 CodeArts Repo

漏洞管理服务 CodeArts Inspector

联接 CodeArtsLink

软件建模 CodeArts Modeling

Astro企业应用 AstroPro

智能开发助手 CodeArtsSnap

Astro大屏应用 AstroCanvas

没有找到结果，请重新输入

产品选择

AI开发平台ModelArts

产品选择

取消所有产品

弹性云服务器 ECS

华为云Flexus云服务

裸金属服务器 BMS

云手机服务器 CPH

专属主机 DeH

弹性伸缩 AS

镜像服务 IMS

函数工作流 FunctionGraph

VR云渲游平台 CVR

Huawei Cloud EulerOS

云耀云服务器（旧版）

对象存储服务 OBS

云硬盘 EVS

云备份 CBR

弹性文件服务 SFS

存储容灾服务 SDRS

云硬盘备份 VBS

云服务器备份 CSBS

数据快递服务 DES

云存储网关 CSG

专属分布式存储服务 DSS

数据工坊 DWR

地图数据 MapDS

键值存储服务 KVS

高性能弹性文件服务 SFS Turbo

虚拟私有云 VPC

弹性公网IP EIP

弹性负载均衡 ELB

NAT网关 NAT

云专线 DC

虚拟专用网络 VPN

云连接 CC

VPC终端节点 VPCEP

企业路由器 ER

企业交换机 ESW

全球加速 GA

企业连接 EC

云容器引擎 CCE

Autopilot集群

云容器实例 CCI

容器镜像服务 SWR

云原生服务中心 OSC

应用服务网格 ASM

华为云UCS

内容分发网络 CDN

智能边缘云 IEC

智能边缘平台 IEF

CloudPond云服务

云数据库 RDS

数据复制服务 DRS

文档数据库服务 DDS

分布式数据库中间件 DDM

云数据库 GaussDB

云数据库 GeminiDB

数据管理服务 DAS

数据库和应用迁移 UGO

云数据库 GaussDB(for MySQL)

安全技术与应用

Web应用防火墙 WAF

企业主机安全 HSS

云防火墙 CFW

安全云脑 SecMaster

DDoS防护 AAD

数据加密服务 DEW

数据库安全服务 DBSS

云堡垒机 CBH

数据安全中心 DSC

云证书管理服务 CCM

威胁检测服务 MTD

态势感知 SA

认证测试中心 CTC

AI开发平台ModelArts

华为HiLens

图引擎服务 GES

图像识别 Image

文字识别 OCR

自然语言处理 NLP

内容审核 Moderation

图像搜索 ImageSearch

医疗智能体 EIHealth

企业级AI应用开发专业套件 ModelArts Pro

人脸识别服务 FRS

对话机器人服务 CBS

语音交互服务 SIS

知识图谱 KG

人证核身服务 IVS

视频智能分析服务 VIAS

城市智能体

自动驾驶云服务 Octopus

盘古大模型 PanguLargeModels

MapReduce服务 MRS

数据湖探索 DLI

表格存储服务 CloudTable

可信智能计算服务 TICS

推荐系统 RES

云搜索服务 CSS

数据可视化 DLV

数据接入服务 DIS

数据仓库服务 GaussDB(DWS)

数据治理中心 DataArts Studio

湖仓构建 LakeFormation

智能数据洞察 DataArts Insight

设备接入 IoTDA

IoT物联网

全球SIM联接 GSL

IoT数据分析 IoTA

路网数字化服务 DRIS

IoT边缘 IoTEdge

设备发放 IoTDP

微服务引擎 CSE

分布式消息服务Kafka版

分布式消息服务RabbitMQ版

分布式消息服务RocketMQ版

API网关 APIG

分布式缓存服务 DCS

多活高可用服务 MAS

事件网格 EG

域名注册服务 Domains

云解析服务 DNS

企业门户 EWP

ICP备案

商标注册

华为云WeLink

华为云会议 Meeting

隐私保护通话 PrivateNumber

语音通话 VoiceCall

消息&短信 MSGSMS

云管理网络

SD-WAN 云服务

边缘数据中心管理 EDCM

云桌面 Workspace

应用与数据集成平台 ROMA Connect

ROMA资产中心 ROMA Exchange

API全生命周期管理 ROMA API

政企自服务管理 ESM

应用平台 AppStage

开天企业工作台 MSSE

开天集成工作台 MSSI

API中心 API Hub

云消息服务 KooMessage

交换数据空间 EDS

云地图服务 KooMap

云手机服务 KooPhone

组织成员账号 OrgID

云空间服务 KooDrive

实时音视频 SparkRTC

视频直播 Live

视频点播 VOD

媒体处理 MPC

视频接入服务 VIS

数字内容生产线 MetaStudio

统一身份认证服务 IAM

消息通知服务 SMN

云监控服务 CES

应用运维管理 AOM

应用性能管理 APM

云日志服务 LTS

云审计服务 CTS

标签管理服务 TMS

配置审计 Config

应用身份管理服务 OneAccess

资源访问管理 RAM

组织 Organizations

资源编排服务 RFS

优化顾问 OA

IAM 身份中心

云运维中心 COC

资源治理中心 RGC

主机迁移服务 SMS

对象存储迁移服务 OMS

云数据迁移 CDM

迁移中心 MGC

区块链服务 BCS

可信跨链服务 TCS

可信分布式身份服务 TDIS

数字资产链 DAC

华为云区块链引擎服务 HBS

专属计算集群 DCC

高性能计算 HPC

SAP

混合云灾备

开天工业工作台 MIW

Haydn解决方案工厂

数字化诊断治理专家服务

SDK开发指南

API签名指南

DevStar

华为云命令行工具服务 KooCLI

Huawei Cloud Toolkit

CodeArts API

成本优化最佳实践

专属云商业逻辑

云架构中心

云商店

合作伙伴中心

华为云开发者学堂

华为云慧通差旅

账号中心

费用中心

成本中心

资源中心

企业管理

工单管理

客户运营能力

国际站常见问题

支持计划

专业服务

合作伙伴支持计划

我的凭证

华为云公共事业服务云平台

管理控制台

消息中心

产品价格详情

系统权限

客户关联华为云合作伙伴须知

公共问题

宽限期保留期

奖励推广计划

活动

云服务信任体系能力说明

工业数字模型驱动引擎

硬件开发工具链平台云服务

软件开发生产线 CodeArts

需求管理 CodeArts Req

流水线 CodeArts Pipeline

代码检查 CodeArts Check

编译构建 CodeArts Build

部署 CodeArts Deploy

测试计划 CodeArts TestPlan

制品仓库 CodeArts Artifact

移动应用测试 MobileAPPTest

CodeArts IDE Online

Classroom

开源镜像站 Mirrors

性能测试 CodeArts PerfTest

应用管理与运维平台 ServiceStage

云应用引擎 CAE

开源治理服务 CodeArts Governance

Astro轻应用 AstroZero

CodeArts IDE

Astro工作流 AstroFlow

代码托管 CodeArts Repo

漏洞管理服务 CodeArts Inspector

联接 CodeArtsLink

软件建模 CodeArts Modeling

Astro企业应用 AstroPro

智能开发助手 CodeArtsSnap

Astro大屏应用 AstroCanvas

没有找到结果，请重新输入

使用MaaS部署模型服务 - AI开发平台ModelArts

“事件”：选择要订阅的事件类型。例如“创建中”、“已完成”、“运行失败”等。说明：需要为消息通知服务中创建的主题添加订阅，当订阅状态为“已确认”后，方可收到事件通知。订阅主题的详细操作请参见添加订阅。使用消息通知服务会产生相关服务费用，详细信息请参见计费说明。自动停止当使用付费资源时，可以选择是否打开“自动停止”开关。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
AI应用的自定义镜像制作流程 - AI开发平台ModelArts

"" ]; then sleep 60 kill -15 $gunicorn_pid # 传递 SIGTERM 给gunicorn进程 wait $gunicorn_pid # 等待gunicorn进程完全终止 fi }

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

vm.ai1.snt3(需申请)/custom(仅支持在部署到专属资源池时使用)，需申请的规格请提交工单，由ModelArts运维工程师添加权限。若配置为custom，需同时指定custom_spec参数。 weight 否 Integer real-time类型必选。权重百分

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用kv-cache-int8量化 - AI开发平台ModelArts

t8的scale系数的抽取和加载。 Step3 启动kv-cache-int8量化服务在使用OpenAI接口或vLLM接口启动推理服务时添加如下参数： --kv-cache-dtype int8 #只支持int8，表示kvint8量化 --quantization-param-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

nnel粒度量化，否则为per-tensor粒度量化。启动smoothQuant量化服务。参考Step6 启动推理服务，启动推理服务时添加如下命令。 -q smoothquant 或者 --quantization smoothquant --dtype=float16 父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

nnel粒度量化，否则为per-tensor粒度量化。启动smoothQuant量化服务。参考Step3 启动推理服务，启动推理服务时添加如下命令。 -q smoothquant 或者 --quantization smoothquant --dtype=float16 父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

nnel粒度量化，否则为per-tensor粒度量化。启动smoothQuant量化服务。参考Step3 启动推理服务，启动推理服务时添加如下命令。 -q smoothquant 或者 --quantization smoothquant --dtype=float16 父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

该桶下创建文件夹目录用于后续存储代码使用，例如：training_data。创建VPC 虚拟私有云（Virtual Private Cloud）可以为您构建隔离的、用户自主配置和管理的虚拟网络环境，操作指导请参考创建虚拟私有云和子网。创建SFS Turbo SFS Turbo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

该桶下创建文件夹目录用于后续存储代码使用，例如：training_data。创建VPC 虚拟私有云（Virtual Private Cloud）可以为您构建隔离的、用户自主配置和管理的虚拟网络环境，操作指导请参考创建虚拟私有云和子网。创建SFS Turbo SFS Turbo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Browser+、obsutil等工具访问和管理OBS桶，将代码、模型文件、数据集等数据上传或下载进行备份。创建VPC 虚拟私有云（Virtual Private Cloud）可以为您构建隔离的、用户自主配置和管理的虚拟网络环境，操作指导请参考创建虚拟私有云和子网。创建SFS Turbo SFS Turbo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作
模型训练使用流程 - AI开发平台ModelArts

模型训练使用流程 AI模型开发的过程，称之为Modeling，一般包含两个阶段：开发阶段：准备并配置环境，调试代码，使代码能够开始进行深度学习训练，推荐在ModelArts开发环境中调试。实验阶段：调整数据集、调整超参等，通过多轮实验，训练出理想的模型，推荐在ModelArts训练中进行实验。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

nnel粒度量化，否则为per-tensor粒度量化。启动smoothQuant量化服务。参考Step3 启动推理服务，启动推理服务时添加如下命令。 -q smoothquant 或者 --quantization smoothquant 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

nnel粒度量化，否则为per-tensor粒度量化。启动smoothQuant量化服务。参考Step6 启动推理服务，启动推理服务时添加如下命令。 -q smoothquant 或者 --quantization smoothquant 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

hannel粒度量化，否则为per-tensor粒度量化。启动smoothQuant量化服务。参考步骤六启动推理服务，启动推理服务时添加如下命令。 -q smoothquant 或者 --quantization smoothquant --dtype=float16 父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

nnel粒度量化，否则为per-tensor粒度量化。启动smoothQuant量化服务。参考Step3 启动推理服务，启动推理服务时添加如下命令。 -q smoothquant 或者 --quantization smoothquant 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

nnel粒度量化，否则为per-tensor粒度量化。启动smoothQuant量化服务。参考Step6 启动推理服务，启动推理服务时添加如下命令。 -q smoothquant 或者 --quantization smoothquant --dtype=float16 父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
部署推理服务 - AI开发平台ModelArts

/home/ma-user/ws 解压算子包并将相应算子安装到环境中。 unzip AscendCloud-OPP-*.zip pip install ascend_cloud_ops-1.0.0-py3-none-any.whl pip install cann_ops-1.0.0-py3-none-any.whl

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
模型配置文件编写说明 - AI开发平台ModelArts

持pip安装方式。dependency结构数组说明如表6所示。如果模型包内没有推理代码customize_service.py文件，则该字段可不填。自定义镜像模型不支持安装依赖包。说明： “dependencies”参数支持多个“dependency”结构数组，以list格式

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用规范参考
Wav2Lip训练基于DevServer适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
使用kv-cache-int8量化 - AI开发平台ModelArts

t8的scale系数的抽取和加载。 Step3 启动kv-cache-int8量化服务在使用OpenAI接口或vLLM接口启动推理服务时添加如下参数： --kv-cache-dtype int8 #只支持int8，表示kvint8量化 --quantization-param-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化

总条数： 742

上一页
1
...
30
31
32
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用MaaS部署模型服务 - AI开发平台ModelArts

AI应用的自定义镜像制作流程 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

模型训练使用流程 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

模型配置文件编写说明 - AI开发平台ModelArts

Wav2Lip训练基于DevServer适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线