正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
推理模型量化 使用AWQ量化工具转换权重 使用SmoothQuant量化工具转换权重 使用kv-cache-int8量化 父主题: 主流开源大模型基于Standard适配PyTorch NPU推理指导(6.3.907)
准备工作 准备环境 准备代码 准备数据 准备镜像 父主题: Qwen系列模型基于DevServer适配PyTorch NPU训练指导(6.3.904)
常见问题 访问容器目录时提示Permission denied 如何在容器中安装依赖包 训练时报“EI0006: Getting socket times out” 父主题: Qwen系列模型基于DevServer适配PyTorch NPU训练指导(6.3.904)
LoRA微调训练 前提条件 已上传训练代码、训练权重文件和数据集到SFS Turbo中,具体参考代码上传至OBS和使用Notebook将OBS数据导入SFS Turbo。 Step1 在Notebook中修改训练超参配置 以llama2-13b LORA微调为例,执行脚本0_pl_lora_13b
查看日志和性能 单击作业详情页面,则可查看训练过程中的详细信息。 图1 查看训练作业 在作业详情页的日志页签,查看最后一个节点的日志,其包含“elapsed time per iteration (ms)”数据,可换算为tokens/s/p的性能数据。 吞吐量(tokens/s/p):global
预训练 前提条件 已上传训练代码、训练权重文件和数据集到OBS中,具体参考代码上传至OBS。 Step1 创建训练任务 创建训练作业,并自定义名称、描述等信息。选择自定义算法,启动方式自定义,以及选择上传的镜像。 代码目录选择:OBS桶路径下的llm_train/AscendSpeed代码目录。
为什么“物料信息查询”页面导入物料信息提示物料不存在? 在“物料信息查询”页面导入物料信息时请参考“导入模板”当中的示例填写数据。其中,物料编码和物料版本需要和系统中“发布”状态的Part数据保持一致。 父主题: 数字化制造基础服务
仓库类型设置 以工厂为维度维护仓库类型的LookUP值。 前提条件 已登录MBM Space,且拥有该菜单栏目的操作权限。 已维护工厂建模。 注意事项 用户进入“仓库类型设置”配置数据时必须选择工厂。 “生效标识”为“否”的数据,对外提供的查询接口将被过滤,其他功能模块也无法引用。
生产物料上载 支持对线体加工工单的批次物料、资源上载或卸载。 前提条件 已登录MBM Space,且拥有该菜单栏目的操作权限。 已维护派工看板。 已维护资源实物BOM。 已维护物料信息查询。 注意事项 条码采集时,物料对应“物料信息查询”页面的“物料条码”,工装对应“资源实物BO
工单质检单 支持查询工单质检单信息以及质检项内容。 前提条件 已登录MBM Space,且拥有该菜单栏目的操作权限。 注意事项 已开工且开工生成质检单的工单才能查询出工单质检单数据。 查询工单质检单信息 在顶部导航栏中,选择“质量管理 > 质量计划 > 工单质检单”。 进入“工单质检单”页面。
栅格布局(行容器) 使用场景 通过基础的24分栏结构,迅速简便地创建栅格布局。 组件图标: 基本属性 表1 基础信息 序号 属性名 说明 设置器类型 可选值 默认值 支持变量绑定 1 栅格 一行中栅格的分栏数 布局选择器 24,12:12,6:18,18:6,16:8,8:8:8
控制 控制连接器包含“中断”“条件判断”“继续”“遍历集合元素”“分支”“数据分片”“多分支条件”“终止”“流程块”“循环”“异常监控和处理”执行动作。 连接参数 控制连接器无需认证,无连接参数。 中断 中断(break),设置了中断节点,流运行到中断节点后,不会再往后面执行,并
SD WebUI推理方案概览 本文档主要介绍如何在ModelArts的DevServer和ModelArts Standard环境上部署Stable Diffusion的WebUI套件,使用NPU卡进行推理。 约束限制 本方案目前仅适用于部分企业客户,完成本方案的部署,需要先联系您所在企业的华为方技术支持。
如何添加构建服务器地址到Maven服务器安全组? 背景信息 将构建集群的构建节点弹性IP添加到Maven私有服务所在节点的安全组中,以便构建服务访问Maven私有服务器下载依赖包。 操作步骤 获取构建镜像的集群名称和过滤节点标签信息。 应用组件构建,请参考编辑源码构建工程,获取“构建集群”和“过滤节点标签”。
部署在云上的微服务如何进行排错? 对于问题的定界,可以使用微服务仪表盘,通过仪表盘可以看到系统内所有微服务及其实例的实时运行情况,找到没有正常工作的节点。 找到问题节点后,可以通过APM查看问题节点的应用日志来分析具体问题。 父主题: 应用开发问题
查询团队角色 功能介绍 查询团队角色。 URI POST /unidata/public/api/v1/team-role/list 请求参数 表1 请求Header参数 参数 是否必选 参数类型 描述 Authorization 是 String JWTToken 表2 请求Body参数
团队与团队角色关联接口 团队下批量创建团队角色 团队与团队角色下批量创建用户 查询团队与团队角色关联关系 团队下批量更新团队角色状态 团队与团队角色下批量更新用户 父主题: 用户组织管理API
训练专属资源池如何与SFS弹性文件系统配置对等链接? 配置训练专属资源池与SFS弹性文件系统的对等链接,需要资源池打通VPC,使得资源池与SFS弹性文件系统所配置的VPC相同。配置完成后,在创建训练作业时,就可以看到SFS的配置选项。 打通VPC步骤请参考打通VPC。 父主题: Standard资源池
自动学习使用子账号单击开始训练出现错误Modelarts.0010 用主账号给子账号配置ModelArts所使用的OBS桶的ACL权限即可。 父主题: 模型训练
自动学习中偏好设置的各参数训练速度大概是多少 偏好设置中: performance_first:性能优先,训练时间较短,模型较小。对于TXT、图片类训练速度为10毫秒。 balance:平衡 。对于TXT、图片类训练速度为14毫秒 。 accuracy_first:精度优先,训练