检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建Workflow模型注册节点 功能介绍 通过对ModelArts模型管理的能力进行封装,实现将训练后的结果注册到模型管理中,便于后续服务部署、更新等步骤的执行。主要应用场景如下: 注册ModelArts训练作业中训练完成的模型。 注册自定义镜像中的模型。 属性总览 您可以使用
准备数据 本教程使用到的训练数据集是Alpaca数据集。您也可以自行准备数据集。 Alpaca数据集 本教程使用Alpaca数据集,数据集的介绍及下载链接如下。 Alpaca数据集是由OpenAI的text-davinci-003引擎生成的包含52k条指令和演示的数据集。这些指令
常见错误原因和解决方法 显存溢出错误 网卡名称错误 父主题: 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导(6.3.909)
准备环境 本文档中的模型运行环境是ModelArts Lite Server。请参考本文档要求准备资源环境。 资源规格要求 计算规格:不同模型训练推荐的NPU卡数请参见表2。 硬盘空间:至少200GB。 Ascend资源规格: Ascend: 1*ascend-snt9b表示Ascend单卡。
附录:训练常见问题 问题1:在训练过程中遇到NPU out of memory 解决方法: 容器内执行以下命令,指定NPU内存分配策略的环境变量,开启动态内存分配,即在需要时动态分配内存,可以提高内存利用率,减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF
准备镜像环境 准备训练模型适用的容器镜像,包括获取镜像地址,了解镜像中包含的各类固件版本,配置物理机环境操作。 镜像地址 本教程中用到的训练和推理的基础镜像地址和配套版本关系如下表所示,请提前了解。 表1 基础容器镜像地址 镜像用途 镜像地址 基础镜像 swr.cn-southwest-2
推理性能测试 benchmark方法介绍 性能benchmark包括两部分。 静态性能测试:评估在固定输入、固定输出和固定并发下,模型的吞吐与首token延迟。该方式实现简单,能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。 动态性能测试:评估在请求并发在一定范围内波动
重新安装Metrics Server 安装Metrics Server失败后,可以执行本操作重新安装。 重新安装Metrics Server插件过程中由于无法正常进行弹性伸缩,如果操作过程中流量异常可能会导致组件服务异常。 前提条件 待操作Metrics Server插件已经安装,请参考安装Metrics
使用可视化分析运行日志 可视化提供对已完成结构化配置后的日志字段进行SQL查询与分析的功能。对原始日志结构化后,等待1~2分钟左右即可对结构化后的日志进行SQL查询与分析。 前提条件 日志流已完成结构化配置。 组件已关联LTS日志组,请参考关联LTS日志组。 使用可视化分析运行日志
Token作为调用OptVerse服务的临时凭证,有效期为24h 若涉及二次验证,需在“Body”配置项中需添加totp认证信息。 二次认证方式建议使用短信或邮箱验证码 二次验证配置及使用具体可参考获取iam用户token(使用密码+虚拟mfa)。 父主题: 使用Postman调试API接口
单击“访问密钥”页签,在页签中,单击“新增访问密钥”。 在“身份验证”对话框中,输入当前用户的登录密码,通过邮箱或者手机进行验证,输入对应的验证码。 单击“确定”,下载认证账号的AK/SK,请妥善保管AK/SK信息。
企业设置类 城市规则创建 路径:社保福利-企业规则-城市规则,进入列表页面 图1 城市规则 修改城市规则 单击列表中任意一条数据,查看城市规则详情,单击编辑按钮:可修改已存在的城市平均工资、最低工资。 图2 查看城市规则 新建城市规则 单击新建,填写信息-单击确定即可。 图3 新建城市规则
员工设置类 员工社保公积金信息维护 路径:社保福利-人员管理-员工社保公积金信息,进入员工社保公积金信息列表页面,单击任意一行可查看员工的社保公积金规则详情也可进行创建员工社保公积金规则。 图1 员工社保公积金信息 手动维护员工社保公积金信息 进入并单击创建社保公积金规则,填写相
维护个税信息 个税管理的功能主要包括: 企业类:扣缴义务人规则维护 员工类:员工个税信息维护,员工增减报维护; 以及最终薪酬批次完成后,生成的ITS个税申报表; 创建扣缴义务人 路径:个税管理-扣缴义务人 单击扣缴义务人能看到当前所有扣缴义务人及员工数等信息。 图1 扣缴义务人 单击任意一条扣缴义务人编辑或查看详情。
如何将多个物体检测的数据集合并成一个数据集? 可以在OBS桶中创建一个父级目录,目录下面设置不同的文件夹,将多个数据集分别导出到这些文件夹里面,最后用父目录创数据集即可。 登录ModelArts管理控制台,选择“数据管理>数据集”进入数据集概览页,单击右上角“导出”,将对应的数据
使用从OBS选择的数据创建表格数据集如何处理Schema信息? Schema信息表示表格的列名和对应类型,需要跟导入数据的列数保持一致。 若您的原始表格中已包含表头,需要开启“导入是否包含表头”开关,系统会导入文件的第一行(表头)作为列名,无需再手动修改Schema信息。 若您的
JavaScript SDK使用说明 操作场景 使用JavaScript语言调用APP认证的API时,您需要先获取SDK,然后新建工程,最后参考API调用示例调用API。 JavaScript SDK支持Node.js和浏览器两种运行环境,本章节Node.js开发环境为例介绍。 前提条件
其他语言客户端使用说明 MQS完全兼容Kafka开源客户端。 如果您使用其他语言,也可以从Kafka官网获取客户端,按照Kafka官网提供的连接说明,与MQS对接。 获取客户端的地址请参考Kafka官网。 父主题: MQS连接开发(开源客户端)
镜像保存时报错“container size %dG is greater than threshold %dG”如何解决? 问题现象 在Notebook里保存镜像时报错“container size %dG is greater than threshold %dG”。 原因分析
如何使用资源管理插件 在常规代码开发中,通常会将一些高频率用到的一些代码片段抽离出来业务代码,使其成为一个公共函数,减少重复的代码,从而达到代码复用的目的。 同样,在编排流程元模板中,不可避免地需要编写一些高代码进行组合开发,这里同样存在存储一些公共函数以供各处调用需求。资源管理