检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
推理性能测试 benchmark方法介绍 性能benchmark包括两部分。 静态性能测试:评估在固定输入、固定输出和固定并发下,模型的吞吐与首token延迟。该方式实现简单,能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。 动态性能测试:评估在请求并发在一定范围内波动
创建项目时,如何快速创建OBS桶及文件夹? 在创建项目时需要选择训练数据路径,本章节将指导您如何在选择训练数据路径时,快速创建OBS桶和OBS文件夹。 在创建自动学习项目页面,单击数据集输入位置右侧的“”按钮,进入“数据集输入位置”对话框。 单击“新建对象存储服务(OBS)桶”,
创建Workflow模型注册节点 功能介绍 通过对ModelArts模型管理的能力进行封装,实现将训练后的结果注册到模型管理中,便于后续服务部署、更新等步骤的执行。主要应用场景如下: 注册ModelArts训练作业中训练完成的模型。 注册自定义镜像中的模型。 属性总览 您可以使用
准备数据 本教程使用到的训练数据集是Alpaca数据集。您也可以自行准备数据集。 Alpaca数据集 本教程使用Alpaca数据集,数据集的介绍及下载链接如下。 Alpaca数据集是由OpenAI的text-davinci-003引擎生成的包含52k条指令和演示的数据集。这些指令
常见错误原因和解决方法 显存溢出错误 网卡名称错误 父主题: 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导(6.3.909)
准备环境 本文档中的模型运行环境是ModelArts Lite Server。请参考本文档要求准备资源环境。 资源规格要求 计算规格:不同模型训练推荐的NPU卡数请参见表2。 硬盘空间:至少200GB。 Ascend资源规格: Ascend: 1*ascend-snt9b表示Ascend单卡。
附录:训练常见问题 问题1:在训练过程中遇到NPU out of memory 解决方法: 容器内执行以下命令,指定NPU内存分配策略的环境变量,开启动态内存分配,即在需要时动态分配内存,可以提高内存利用率,减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF
准备镜像环境 准备训练模型适用的容器镜像,包括获取镜像地址,了解镜像中包含的各类固件版本,配置物理机环境操作。 镜像地址 本教程中用到的训练和推理的基础镜像地址和配套版本关系如下表所示,请提前了解。 表1 基础容器镜像地址 镜像用途 镜像地址 基础镜像 swr.cn-southwest-2
推理性能测试 benchmark方法介绍 性能benchmark包括两部分。 静态性能测试:评估在固定输入、固定输出和固定并发下,模型的吞吐与首token延迟。该方式实现简单,能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。 动态性能测试:评估在请求并发在一定范围内波动
重新安装Metrics Server 安装Metrics Server失败后,可以执行本操作重新安装。 重新安装Metrics Server插件过程中由于无法正常进行弹性伸缩,如果操作过程中流量异常可能会导致组件服务异常。 前提条件 待操作Metrics Server插件已经安装,请参考安装Metrics
使用可视化分析运行日志 可视化提供对已完成结构化配置后的日志字段进行SQL查询与分析的功能。对原始日志结构化后,等待1~2分钟左右即可对结构化后的日志进行SQL查询与分析。 前提条件 日志流已完成结构化配置。 组件已关联LTS日志组,请参考关联LTS日志组。 使用可视化分析运行日志
IP费用: 1LCU | 全动态BGP 带宽: 全动态BGP | 带宽 | 4Mbit/s 1 5185.92 Anti-DDoS流量清洗 Anti-DDoS流量清洗 1 0 态势感知 最大配额数: 1个 1 100 企业主机安全 规格: 企业版 1 900 漏洞扫描服务 服务类型:
图2 作业策略管理2 作业计划场景 数据服务共享平台为开发人员提供按照计划自动执行作业的能力,支持在计划中配置自定义的频度、日历、作业、作业执行优先级等内容。 图3 作业计划场景1 图4 作业计划场景2 作业图形编排 数据服务共享平台为开发人员提供图形编排调度作业的能力,包括作业的设计优先级,依赖关系等。
安全 SAP系统中的数据是企业的核心数据,通过云平台安全和网络配置保障SAP系统的安全性。 详情请参见SAP安全白皮书。 云平台安全 基础设施安全 华为在物理环境,网络,平台,数据四个方面,按照安全合规标准,结合自身经验积累进行设计开发,确保华为云基础设施安全。 运营运维安全 适
注册客户 服务对象 合作伙伴的客户 场景描述 客户在合作伙伴销售平台可完成注册,伙伴销售平台将同步创建华为云账号,并将客户在伙伴销售平台上的账号与华为云账号建立映射关系。同时,创建的华为云账号与伙伴账号关联绑定,成为伙伴的客户。 相关API列表 开放接口 接口定义链接 校验客户注册信息
管理客户账户 服务对象 合作伙伴 场景描述 合作伙伴可以在伙伴销售平台上向客户账户拨款。只有客户账户有足够消费额度,客户才能通过合作伙伴销售平台进行华为云产品购买、续订等操作。 当客户不再使用华为云产品,合作伙伴可以在合作伙伴销售平台回收客户账户余额。 相关API列表 开放接口 接口定义链接
对员工有线终端进行802.1X认证,认证点在接入交换机,认证服务器是华为乾坤云平台。 认证服务器侧的配置思路 802.1X认证采用华为乾坤云平台内置的RADIUS服务器组件。 在认证服务器侧的整个配置过程如下: 在华为乾坤云平台创建用户组Wire_Dumb_Group,把同一类认证方式的用户放
对员工有线终端进行802.1X认证,认证点在接入交换机,认证服务器是华为乾坤云平台。 认证服务器侧的配置思路 802.1X认证采用华为乾坤云平台内置的RADIUS服务器组件。 在认证服务器侧的整个配置过程如下: 在华为乾坤云平台创建用户组Wire_Employee_Group,把同一类认证方式
AR设备上报性能数据时,会携带时间戳,如果AR的时间和华为乾坤云平台不一致,则会导致管理员在查看该设备的性能数据时,性能数据的时间与实际不符,站点流量和质量数据无法显示。所以华为乾坤云平台通过配置NTP,使站点设备和华为乾坤云平台的时间保持一致。 RR角色的Hub站点需要“手动配置”,规
订阅推送的示意图如下图所示: 推送机制:物联网平台向用户推送消息后,如果用户接收成功,会向物联网平台回复响应(推荐自动响应方式)。如果用户建立链接后不拉取数据,则会导致数据积压在服务端。服务端仅保存最近24小时,且占用磁盘容量小于1GB的数据,如果用户不及时拉取数据,物联网平台会滚动清除超期和超出容量