检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用GPTQ量化 当前版本使用GPTQ量化仅支持W8A16 perchannel的量化形式,使用W8A16的量化不仅可以保证精度在可接受的范围内,同时也有一定的性能收益。 GPTQ W8A16量化支持的模型请参见表3。 本章节介绍如何在GPU的机器上使用开源GPTQ量化工具GPTQ
使用GPTQ量化 当前版本使用GPTQ量化仅支持W8A16 perchannel的量化形式,使用W8A16的量化不仅可以保证精度在可接受的范围内,同时也有一定的性能收益。 GPTQ W8A16量化支持的模型请参见表3。 本章节介绍如何在GPU的机器上使用开源GPTQ量化工具GPTQ
准备环境 本文档中的模型运行环境是ModelArts Lite的Server。请参考本文档要求准备资源环境。 资源规格要求 计算规格:不同模型训练推荐的NPU卡数请参见表1。 硬盘空间:至少200GB。 Ascend资源规格: Ascend: 1*ascend-snt9b表示Ascend单卡。
准备环境 本文档中的模型运行环境是ModelArts Lite Server。请参考本文档要求准备资源环境。 资源规格要求 计算规格:不同模型训练推荐的NPU卡数请参见表2。 硬盘空间:至少200GB。 Ascend资源规格: Ascend: 1*ascend-snt9b表示Ascend单卡。
准备环境 本文档中的模型运行环境是ModelArts Lite的Server。请参考本文档要求准备资源环境。 资源规格要求 计算规格:不同模型训练推荐的NPU卡数请参见表1。 硬盘空间:至少200GB。 Ascend资源规格: Ascend: 1*ascend-snt9b表示Ascend单卡。
附录:训练常见问题 问题1:在训练过程中遇到NPU out of memory 解决方法: 容器内执行以下命令,指定NPU内存分配策略的环境变量,开启动态内存分配,即在需要时动态分配内存,可以提高内存利用率,减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF
执行训练任务 步骤一:上传训练权重文件和数据集 如果在准备代码和数据阶段已经上传权重文件、自定义数据集,可以忽略此步骤。 未上传训练权重文件,具体参考上传代码和权重文件到工作环境。 使用自定义数据集训练未上传自定义数据集。具体参考上传自定义数据到指定目录章节并更新dataset_info
-v ${work_dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录,目录下存放着训练所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。
“导入路径”:数据存储的OBS路径。 “数据标注状态”:已标注。 “高级特征选项 ”:默认关闭,可通过勾选高级选项提供增强功能。 如“按标签导入”:系统将自动获取此数据集的标签,您可以单击“添加标签”添加相应的标签。此字段为可选字段,您也可以在导入数据集后,在标注数据操作时,添加或删除标签。
Server时空数据云服务平台界面。 图3 时空数据云服务平台-专业制图与智能分析 不同帐号登录PIE-Engine Server时空数据云服务平台后的界面略有区别,下面将以功能最全的界面为例进行说明。 用户通过PIE-Engine Server时空数据云服务平台界面上方导航栏能够轻松
配置思路 组建堆叠系统。 在华为乾坤云平台添加设备和创建堆叠。 准备IP网络环境,在DHCP服务器中配置选项148。本案例以FW作为DHCP服务器,且AR设备已注册至华为乾坤云平台。 堆叠设备上电启动,确保设备以空配置启动,如果存在配置文件,可以执行reset saved-con
集成架构 应用/大屏/移动端接入ISDP+平台时,集成架构如图1所示。 图1 集成架构 父主题: 应用/大屏/移动端接入
在进行Windows的Demo使用或集成SDK时,提示微软C++标准库缺失,该如何获取? 请下载对应平台的微软C++标准库,安装成功后,重新运行即可。 父主题: 产品咨询
能否限制某个应用或某个签名发短信的额度? 平台不支持限制应用或签名发短信的额度,请客户自行控制限额。 父主题: 短信发送相关
配置AP业务 配置RU的上行接口 RU上行接口连接中心AP,在华为乾坤云平台上,采用默认配置即可。 配置中心AP接口 登录华为乾坤控制台。 单击页面左上角按钮,单击“我的服务 > 云管理网络”,在页面右上角选择“ > 高级配置”。 在高级配置界面,单击“网络配置 > 站点配置 >
if err != nil { return fmt.Errorf("failed to get accountLock state: %v", err) } if accountLockBytes == nil { return nil } accountLock
如何提高SFS Turbo文件系统复制和删除操作的效率? Linux常用cp、rm、tar命令,默认属于串行操作,无法发挥网络文件系统的并发优势,需要用户并发执行以上命令,提升执行效率。 父主题: SFS Turbo删除类问题
参考设置AstroZero系统参数中操作,新建系统参数“appkey”,值填写为ROMA应用的请求密钥。 由于“X-HW-APPKEY”为ROMA应用的请求密钥,可能发生变化,您可以新建系统参数,加密存储此入参,并通过公式引用。当请求密钥变化时,修改系统参数即可。 图19 新建系统参数appkey
方案概述 应用场景 该解决方案基于华为云弹性文件服务SFS Turbo,快速帮助用户在华为云上搭建SFS Turbo训练加速架构。实现快速AI训练作业,提供故障快速恢复,高速缓存,数据预热功能。适用于以下场景:AI开发,训练作业,推理服务。 方案架构 该解决方案部署架构如下图所示:
传即可。 网站取名工信部备案网站域名未查询到的 看是否为提供的域名填错。 可到信息备案管理系统自检。 签名来源为电商店铺名,未提供所属电商平台 请在“电商平台店铺地址”输入框中填写电商平台店铺链接。 自建商城的可填写商城链接以供核实。 涉及第三方,上传的营业执照是申请方的 涉及第