华为云用户手册

  • 步骤三:在服务编排中调用模板发送邮件 创建一个服务编排,添加一个“调用模板”图元,实现邮件发送功能。 在应用设计器的左侧导航栏中,选择“逻辑”,单击编排后的“+”。 设置服务编排的标签和名称,单击“添加”。 图17 新建服务编排 表8 新建服务编排参数说明 参数 说明 示例 标签 服务编排的标签名,用于在界面展示,创建后可修改。 取值范围:1~64个字符。 邮件 名称 服务编排在系统中的唯一标识,创建后不支持修改。命名要求如下: 长度不能超过64个字符,包括前缀命名空间的长度。 标识前模糊掉的内容为命名空间,在华为云Astro轻应用中为了避免不同租户间数据的重名,租户在首次创建应用时需要先定义一个命名空间。一个租户只能创建一个命名空间,创建后不支持修改。 名称必须以英文字母开头,只能由英文字母、数字或单下划线组成,且不能以下划线结尾。 email 创建全局上下文变量。 在服务编排设计页面,选中开始节点,单击。 在全局上下文中,单击变量后的,新建变量“variable0”。 单击“variable0”变量后的,选择“设置”。 将变量的“名称”设置为“companyName”,单击“保存”。 图18 新建companyName变量 按照上述操作,创建表9中的变量。 图19 查看已创建的变量 表9 需要创建的全局上下文变量 名称 数据类型 companyName(已创建) 文本 customerCompanyName 文本 name 文本 添加调用模板图元。 在“基本”中,拖拽“调用模板”图元到开始图元后。 图20 拖拽调用模板图元到画布中 选中调用模板图元Template0,单击,设置调用模板。 图21 设置调用模板图元 表10 调用模板图元参数说明 参数 说明 示例 请选择模板场景 选择调用模板图元关联的模板场景,即1中创建的。 命名空间__notify 请选择模板类型 选择待调用模板的类型。 邮件 请选择文档模板 选择模板场景中创建的邮件模板,即4中创建的。 命名空间__emailModel 在“向模板传入数据”中,单击“新增行”,将3中创建的变量拖到服务编排入参中,作为服务编排的输入参数。 图22 设置服务编排入参 连接图元指定逻辑关系,即从开始图元连向调用模板图元。 图23 指定图元逻辑关系 单击页面上方的,保存服务编排。 单击,进入服务编排调试页面。 在输入参数中,输入如下内容,并单击“运行”。 图24 调试服务编排 { "companyName": "A公司", "customerCompanyName": "B公司", "name": "张三" } 运行成功后,5中设置的邮件收件人,即可收到节日问候邮件,如图25。 图25 节日问候邮件 单击页面上方的,启用服务编排。
  • 应用模板 为了降低应用开发成本,让用户通过拖拽的方式零代码或者低代码快速完成应用的搭建,华为云Astro轻应用提供了丰富的应用模板。应用模板涵盖了人事管理、办公管理、问卷调查、项目管理,以及通用应用等领域,用户可以直接使用应用模板快速创建应用,基于应用模板创建应用后,用户还可快速定制和扩展应用,满足自身业务的个性化诉求。 更多关于应用模板的介绍请参见应用模板,应用模板端到端的使用示例请参见快速入门。
  • 标准页面 标准页面基于Vue技术栈,平台预置丰富基础组件,也可以支持扩展,多用于表格表单等后端管理页面的快速开发。 标准页面开发界面提供图形化、无码化在线页面开发功能,通过标准页面开发界面能够快速构建各种复杂表单表格页面、以及其他一些灵活布局页面。支持在开发界面中将组件面板上的页面组件拖拽至页面工作区域,并对组件的属性、事件进行设置,再配合事件编排完成复杂的业务功能。支持用户以积木组装的方式快速构建应用页面,提升开发效率和质量,及时响应业务需求和价值实现。 更多关于标准页面的介绍请参见标准页面,标准页面端到端的使用示例请参见标准页面专项。
  • 命名空间 由于不同租户间的数据可打包共享,为了避免数据命名的重复(例如数据对象、应用、服务编排等),租户在首次创建应用前,需要先定义一个命名空间。 命名空间唯一且每个租户只能创建一个命名空间。命名空间一旦设定不能修改,请慎重定义,建议使用公司或团队的缩写作为命名空间。命名空间创建后,后续创建的应用、数据对象、脚本、服务编排、页面等应用元素的名称前,系统会为其增加命名空间。例如,将命名空间定义为“CNAME”,后续创建的所有应用、应用元素(数据对象、脚本、页面等)都将以“CNAME__”开头。
  • 华为云Astro轻应用中的用户 华为云Astro轻应用中存在两类账号:用户(User)和业务用户(PortalUser)。用户为应用的开发者,业务用户为应用的使用者,用户开发的应用游客(Guest)可直接使用。关于用户和业务用户的更多介绍,请参见图解华为云Astro轻应用中用户那些事。 在华为云Astro轻应用中,支持在同一个华为账号下,通过添加开发者账号(用户)的方式实现多人协同开发,详细介绍请参见添加华为云Astro轻应用开发者用户。同样,您也可以为应用添加多个业务用户,详细介绍请参见为华为云Astro轻应用开发的应用添加业务用户。 图1 华为云Astro轻应用中用户行为
  • 在华为云Astro轻应用中,哪些场景需要访问数据库? 华为云Astro轻应用访问数据库的场景主要包括如下几类: 业务数据模型构建 通过华为云Astro轻应用提供的Object可视化创建的方式进行构建。 业务数据CRUD操作 通过华为云Astro轻应用脚本中的数据库db标准库的相关方法实现,也可以通过服务编排中的相关图元可视化编排来实现。 业务数据简单查询测试 通过华为云Astro轻应用控制台工具“数据调试”,进行相关表数据sql查询操作,详情请参见使用控制台分析查询SQL。 业务数据前端显示 前端页面通过访问数据库,获取数据源进行展示。 父主题: 产品咨询类
  • 操作步骤 创建BO,将需要调用的资源封装为BO中的公共接口。 参考创建BO中操作,创建一个标签和名称为“BOTest”的BO。 在BO中,新建需要调用的资源“命名空间__FlowC”,并启用。 参考图1中操作,在BO中新建开放接口,该接口用于封装“命名空间__FlowC”。 图1 新建接口封装“命名空间__FlowC” 进入服务编排所属的应用,引入BO,在服务编排中使用BO图元调用接口,从而调用资源。 进入服务编排“命名空间__FlowA”所在应用的设计器。 在应用设计器的左侧导航栏中,单击“设置”。 选择“依赖与开放”,在应用依赖中,单击“添加依赖”。 选择待添加的BO,单击“确认”,添加后在该应用的服务编排中,才可以调用BO服务。 图2 选择待添加的BO 参考图3,服务编排“命名空间__FlowA”改用BO图元,调用该公共接口,注意API类型选择“REST”。 在服务编排“命名空间__FlowA”编辑器页面左侧,选择“BO”,从“Others”下拖拽1.a中定义的“BOTest”至画布。在画布中,选中BO图元,单击,在“BO”页面进行配置,使用BO图元调用接口。 图3 调用BO
  • 解决方法 最新版本华为云Astro轻应用的服务编排、BPM流程编排只允许调用当前应用下的资源(例如脚本、服务编排、对象),不允许跨应用调用资源。 若老版本中创建的服务编排、BPM流程编排调用了不同应用下的资源,不会影响运行态效果,在开发环境的服务编排、BPM流程编排中无法编辑其调用的资源。 问题描述示例中,如果需要编辑“命名空间__FlowB”出参入参,处理思路为:如果多个应用需要调用某个共同的资源,建议在BO中新建公共资源,在应用里内部依赖或者外部依赖导入BO,再调用该资源。 创建BO,将需要调用的资源封装为BO中的公共接口。 参考创建BO中操作,创建一个标签和名称为“BOTest”的BO。 在BO中,新建需要调用的资源“命名空间__FlowC”,该资源与需要调用的资源“命名空间__FlowB”定义相同。 参考图2中操作,在BO中新建开放接口,该接口用于封装“命名空间__FlowC”。 图2 新建接口封装“命名空间__FlowC” 进入服务编排所属的应用,引入BO,在服务编排中使用BO图元调用接口,从而调用资源。 进入服务编排“命名空间__FlowA”所在应用的设计器。 在应用设计器的左侧导航栏中,单击“设置”。 选择“依赖与开放”,在应用依赖中,单击“添加依赖”。 选择待添加的BO,单击“确认”,添加后在该应用的服务编排中,才可以调用BO服务。 图3 选择待添加的BO 参考图4,服务编排“命名空间__FlowA”改用BO图元,调用该公共接口,注意API类型选择“REST”。 在服务编排“命名空间__FlowA”编辑器页面左侧,选择“BO”,从“Others”下拖拽1.a中定义的“BOTest”至画布。在画布中,选中BO图元,单击,在“BO”页面进行配置,使用BO图元调用接口。 图4 调用BO
  • 华为云Astro轻应用支持接入哪些类型的数据? 华为云Astro轻应用的数据连接可以分为以下几类: 消息类的数据 通过华为云Astro轻应用提供的数据接入能力,从外部数据源(如ROMA的MQS、Kafka、 设备接入IoTDA 等)获取数据,详情请参见如何配置数据接入。 接口类的数据 通过华为云Astro轻应用提供的Rest服务、SOAP服务或脚本的http标准库,进行第三方接口请求。 父主题: 产品咨询类
  • 1、试用或购买华为云Astro轻应用实例 在使用华为云Astro轻应用开发零代码应用前,需要先申请华为云Astro轻应用免费试用或购买华为云Astro轻应用商用实例。华为云Astro轻应用实例是一个独立的资源空间,所有的操作都是在实例内进行,不同实例间的资源相互隔离。 申请华为云Astro轻应用免费试用:华为云Astro轻应用支持申请免费试用,试用版提供了开发零代码应用的运行环境,但是使用的资源有限。 购买华为云Astro轻应用标准版实例:华为云Astro轻应用为零代码开发者提供了一个标准版实例,供您专门用于零代码应用的开发。除此之外,华为云Astro轻应用专业版实例也提供了零代码开发能力,更多介绍请参见产品规格差异。
  • 2、创建零代码应用 华为云Astro轻应用零代码平台的模板中心内置了20+模板,覆盖疫情管控、问卷/考试系统、假期出行申请等众多热门场景。单击小试牛刀,创建您的第一个应用吧,让想法快速上线。 在华为云Astro轻应用零代码平台中,您可以通过如下方式创建应用。 创建空白应用:创建一个空白应用,创建后需要为应用添加工作表。 使用模板创建应用:当您的业务与零代码应用模板中的场景相似度较高时,可以尝试使用应用模板创建,并在模板应用的基础上继续改造应用。 创建同款/克隆应用:通过创建同款应用或克隆应用,实现秒级无边界克隆,即搭即用、边改边用,让团队效率加倍。
  • 4、熟练使用视图,在不同场景下只显示期望的数据和展示效果 华为云Astro轻应用零代码中的每个工作表默认都会存在一个名叫“全部”的表格视图,您也可以根据自身业务需求,定制个性化视图。 了解视图的作用:视图是业务数据在不同场景的展示页面,其功能是根据不同的用户角色或不同的业务场景,展现出不同的目标数据。一个表单中,可以包含多个视图,同一个表单中的所有视图共用一套数据,如果数据被修改,则该数据所在的所有视图中也会同步修改。 创建视图:为表单添加一个或多个视图。
  • 3、创建工作表 在华为云Astro轻应用零代码平台中,搭建应用从创建一张工作表开始,掌握20+种控件,定制出符合要求的个性化表单。 创建空白表单:在表单画布中,根据字段数据类型选择合适的组件,通过拖拽编排实现表单的构建。表单及其对应的视图、统计表等组成了应用。 从Excel创建表单:在Excel中设计好表单字段结构及相关数据,通过导入方式快速实现表单构建。 创建流程表单:在出差审批申请、工单派发流程等场景中,需要多个角色人员按流程分步骤互相协作,这时可使用创建流程表单来实现。 对于一些简单的业务应用,创建好一张工作表,您就可以开始进行数据的录入和管理了。
  • 5、配置权限,让不同成员拥有不同的操作权限 应用中,用户的权限角色分为系统角色(零码开发者、数据管理员和企业成员)和自定义角色两种。 应用角色分类:一个完整的应用,少不了多角色用户的协作,每个角色对数据具有不同的管理权限。零代码应用中,用户的权限角色分为系统角色和自定义角色两种。 创建系统角色:除了系统预置的零码开发者、数据管理员和企业成员三个系统角色外,应用管理员还可以按需创建新的系统角色。 为角色添加成员:在业务管理中,应用管理员可以为各个角色添加用户,也可以管理使用各个业务应用的用户,如新建、删除和管理用户。 在应用中激活用户:通过设置应用安全,应用创建者可邀请其他用户一同管理应用和后台数据。 为单个表单设置权限:在表单编辑页面的权限配置中,可为当前表单分配可见权限。 为应用自定义角色:当前系统预置角色不能满足需求时,可根据自身业务需求,通过自定义角色来为用户分发相关页面和权限,控制用户可见内容及操作。
  • 透视图 透视图用于将数据通过不同的维度进行分类汇总,可以设置多个不同的维度(行维度、列维度),来展现在当前维度下的目标数值。在报表编辑页面,拖拽“透视图”组件到中间区域,右侧可设置组件属性。 图1 透视图 显示名称:该组件在页面呈现给用户的名称,可以设置为中文,也可以设置为英文。 数据 维度(行):单击“添加维度(行)”,勾选所需的行,单击“确定”。单击,可重命名维度、统计空值和设置维度排序方式(如升序、倒序等)。 维度(列):单击“添加维度(列)”,勾选所需的列,单击“确定”。单击,可重命名维度、统计空值和设置维度排序方式(如升序、倒序等)。 数值:单击“添加数值”,勾选所需的数值,单击“确定”。单击,可重命名数值、统计空值。 图表联动:有多张透视表时,可选择联动透视图。主联动表中,单击某个维度,在被联动表中会出现与之对应的数据。 数据更新方式:图表是否需要实时更新,支持设置实时更新时间间隔。 筛选数据:单击“添加筛选条件”,设置数据筛选条件。 外观 大小:设置图表大小,如小、大、中、全屏等。 汇总:图表是否显示行汇总、列汇总,支持设置汇总行/列名称、汇总方式。“汇总方式”设置为“平均值”时,支持设置是否统计行/列汇总空值,即不勾选后计算平均数时取值为0的列/行,不计入平均数。 图2 统计行汇总空值 冻结:是否冻结维度行或列,当前仅对PC端生效。 区间配色:给在一定数值范围内的数据,添加配色标记。 单击“设置规则”,进入设置区间配色规则页面。 如果数值同时满足多个条件区间,则默认取按顺序排列的第一个条件设置。 单击“选择数值字段”,选择对应的数值字段,按需设置字段区间配色。 图3 设置区间配色规则 属性:勾选后,页面上会隐藏该字段。 宽度:组件框的宽度,占页面宽度的比例。 父主题: 统计页面组件介绍
  • 什么是工作台 工作台,即零代码开发平台的首页,包括任务中心、公告、全部应用和模板中心等,功能介绍请参见表1。 图1 华为云Astro轻应用零代码工作台页面 表1 华为云Astro轻应用零代码工作台介绍 功能 功能介绍 任务中心 任务管理中心,显示“我的待办”、“我的申请”、“我已处理”和“抄送我的”任务项。 公告 华为云Astro轻应用零代码公告栏。 在公告中,您可以根据业务需求新建通知、新闻和活动三类公告。公告创建后,支持编辑、删除和批量删除公告。 全部应用 创建零代码应用的入口区域,并展示当前用户开发的、最近使用的、收藏的和公开应用。 模板中心 单击“模板中心”,进入零代码应用模板中心,华为云Astro轻应用内置了丰富的零代码应用模板,可以直接使用这些预置的应用模板快速创建零代码应用。 右上角区域 自定义:自定义零代码开发平台布局。 :微信扫一扫,可关注华为云Astro轻应用公众号。 中文/English:单击可切换系统语言。 :查看系统消息。 :华为云Astro轻应用版本升级公告。 :华为云Astro轻应用帮助文档入口。 工单:支持与服务控制台入口,在控制台中可以进行新建工单、查看我的工单等。 用户名:显示当前登录账号的名称,单击账号名称,选择不同的弹出菜单,可以查看系统版本信息、退出系统等操作。
  • 用户如何登录零代码工作台 华为云Astro轻应用中用户的权限配置(Profile)有System Administrator Profile(管理员权限,拥有华为云Astro轻应用全部权限)和Developer Profile(开发者权限,可直接使用零代码开发平台创建并开发应用)两种,这两种角色可以直接登录并创建零码应用。 登录华为云Astro轻应用服务控制台。 在主页中,单击“进入首页”。 在顶部菜单栏中,选择“工作台”,即可进入零代码应用开发的工作台页面。
  • 柱状图 柱状图组件用于实现柱状图样式数据报表统计。在报表编辑页面,拖拽“柱状图”组件到中间区域,右侧可设置组件属性。 图1 柱状图 显示名称:该组件在页面呈现给用户的名称,可以设置为中文,也可以设置为英文。 数据 维度:选择字段作为维度字段。单击,可设置维度排序方式(如升序、倒序等)和维度名称相同时是否合并。 柱状图支持将矩阵量表的选项字段作为柱状图维度,每一个量级作为柱状图的一个数值字段进行展示。 第几个柱子后合并为其他:设置第几个柱子后,合并为其他。 数值:选择展示数值的字段。 数据更新方式:图表是否需要实时更新,支持设置实时更新时间间隔。 筛选数据:单击“+添加筛选条件”,设置过滤条件。设置后,可根据条件统计数据。 外观 大小:设置图表的大小。 样式:选择图表的样式。 横轴标签 标签换行:横轴标签字数过多时是否换行。 单行最多字数:横轴标签字数过多时单行最多字数,没有设置换行多余字数会省略。 标签旋转角度:标签旋转角度设置。 纵轴范围 最小值:设置纵坐标的最小值,默认为自动。 最大值:设置纵坐标的最大值,默认为自动。 刻度数量:设置纵坐标的最大值,默认为自动。 布局:是否开启自动布局功能,默认为开启。如果不开启,可根据实际需求进行如下设置。 列表布局:设置图例的列表布局,如垂直、水平。 标签换行:是否开启标签换行。开启后,当标签字数超过设置的单行最多字数时会自动换行。 单行最多字数:设置图例单行最多显示多少字,取值为1~50。 列表项间距:设置图例列表项的间隔距离,单位px。 图例位置(上边距):设置图例到组件边框顶部的百分比。 图例位置(右边距):设置图例到组件边框右侧的百分比。 宽度:设置柱状图中,图柱的宽度。 图2 宽度 属性:勾选后,页面上会隐藏该字段。 宽度:该组件框的宽度,占页面宽度的比例。 父主题: 统计页面组件介绍
  • 规则介绍 自动续费可以减少手动续费的管理成本,避免因忘记手动续费而导致华为云Astro轻应用无法使用。自动续费的规则如下所述: 以华为云Astro轻应用的到期日计算第一次自动续费日期和计费周期。 华为云Astro轻应用自动续费周期,以您选择的套餐版本时长为准。 华为云Astro轻应用到期前均可开通自动续费,到期前7日凌晨3:00首次尝试自动续费,如果扣款失败,每天凌晨3:00尝试一次,直至华为云Astro轻应用到期或者续费成功。 开通自动续费后,还可以手动续费华为云Astro轻应用。手动续费后,自动续费仍然有效,在新的到期时间前的第7天开始扣款。 自动续费的到期前7日自动扣款属于系统默认配置,您也可以根据需要修改此扣款日,如到期前6日、到期前5日等。 更多关于自动续费的规则介绍,请参见自动续费规则说明。
  • 包年/包月资源 对于包年/包月计费模式的华为云Astro轻应用,用户在购买时会一次性付费,服务将在到期后自动停止使用。 如果在计费周期内不再使用包年/包月的华为云Astro轻应用,可以执行退订操作,系统将根据资源是否属于五天无理由退订、是否使用代金券和折扣券等条件返还一定金额到您的账户。详细的退订规则,请参见云服务退订规则概览。 如果已开启“自动续费”功能,为避免继续产生费用,请在自动续费扣款日(默认为到期前7日)之前关闭自动续费。
  • 创建SFS Turbo SFS Turbo HPC型文件系统为用户提供一个完全托管的共享文件存储。SFS Turbo文件系统支持无缝访问存储在OBS对象存储桶中的对象,用户可以指定SFS Turbo内的目录与OBS对象存储桶进行关联,然后通过创建导入导出任务实现数据同步。通过OBS与SFS Turbo存储联动,可以将最新的训练数据导入到SFS Turbo,然后在训练作业中挂载SFS Turbo到容器对应ckpt目录,实现分布式读取训练数据文件。 创建SFS Turbo文件系统前提条件: 创建SFS Turbo文件系统前,确认已有可用的VPC。 图4 创建SFS Turbo 需要由 IAM 用户设置SFS Turbo FullAccess权限,用于授权ModelArts云服务使用SFS Turbo。 详细操作指导请参考创建SFS Turbo文件系统。 其中,文件系统类型推荐选用500MB/s/TiB或1000MB/s/TiB,应用于AI大模型场景中。存储容量推荐使用 6.0~10.8TB ,以存储更多模型文件。 图5 SFS类型和容量选择
  • kubectl访问集群配置 本步骤需要在节点机器,对kubectl进行集群访问配置。 首先进入已创建的 CCE 集群控制版面中。根据图1的步骤进行操作,单击kubectl配置时,会弹出图2步骤页面。 图1 配置中心 根据图2,按步骤进行:判断是否安装 kubectl、下载kubectl配置文件、在机器中安装和配置kubectl。 图2 kubectl 访问集群配置 在节点机器中,输入命令,查看Kubernetes集群信息。若显示如图图3的内容,则配置成功。 kubectl cluster-info 图3 查看 Kubernetes 集群信息正确弹出内容
  • CCE集群关联SFS Turbo 进入已购买创建的CCE集群,选择存储,随后单击“创建存储卷声明PVC”。 选择“极速文件存储”,随后输入PVC名称。 选择“新建存储卷PV”,并单击“选择极速文件存储”。 进入选择页面,选择已经创建好的SFS Turbo,最后输入PV名称。 接下来需要通过访问集群节点,挂载SFS Turbo。 可通过ssh登录CCE集群中的某个节点(ssh使用的是eip地址)。 创建/mnt/sfs_turbo目录作为挂载目录 ,命令为:mkdir /mnt/sfs_turbo SFS Turbo存储手动挂载到安装节点中,挂载命令如下截图: 挂载完成后,可通过以下步骤获取到代码和数据,并上传至/mnt/sfs_turbo路径下。
  • 步骤四:根据config.yaml启动作业 启动作业命令如下。首先会根据config.yaml创建pod,继而在pod容器内自动启动训练作业。 kubectl apply -f config.yaml 启动后,可通过以下命令获取所有已创建的pod信息。若pod已全部启动,则状态为:Running。 kubectl get pod -A -o wide 若查看启动作业日志信息,可通过以下命令打印正在启动的日志信息。其中${pod_name}为上述pod信息中的NAME,例如vcjob-main-0。 kubectl logs -f ${pod_name}
  • 训练支持的模型列表 本方案支持以下模型的训练,如表1所示。 表1 支持的模型列表 序号 支持模型 支持模型参数量 权重文件获取地址 1 Qwen2 qwen2-0.5b https://huggingface.co/Qwen/Qwen2-0.5B-Instruct 2 qwen2-1.5b https://huggingface.co/Qwen/Qwen2-1.5B-Instruct 3 qwen2-7b https://huggingface.co/Qwen/Qwen2-7B-Instruct 4 qwen2-72b https://huggingface.co/Qwen/Qwen2-72B-Instruct 5 GLMv4 glm4-9b https://huggingface.co/THUDM/glm-4-9b-chat 6 mixtral mixtral-8x7b https://huggingface.co/mistralai/Mixtral-8x7B-Instruct-v0.1 7 llama3.1 llama3.1-8b https://huggingface.co/meta-llama/Meta-Llama-3.1-8B-Instruct 8 llama3.1-70b https://huggingface.co/meta-llama/Meta-Llama-3.1-70B-Instruct 9 Qwen2.5 qwen2.5-0.5b https://huggingface.co/Qwen/Qwen2.5-0.5B-Instruct 10 qwen2.5-7b https://huggingface.co/Qwen/Qwen2.5-7B-Instruct 11 qwen2.5-14b https://huggingface.co/Qwen/Qwen2.5-14B-Instruct 12 qwen2.5-32b https://huggingface.co/Qwen/Qwen2.5-32B-Instruct 13 qwen2.5-72b https://huggingface.co/Qwen/Qwen2.5-72B-Instruct 14 llama3.2 llama3.2-1b https://huggingface.co/meta-llama/Llama-3.2-1B-Instruct 15 llama3.2-3b https://huggingface.co/meta-llama/Llama-3.2-3B-Instruct 16 DeepSeek DeepSeek-V3 https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main 17 DeepSeek-R1 https://huggingface.co/deepseek-ai/DeepSeek-R1/tree/main
  • 下线模型 以下模型已不再跟随版本演进维护,如训练以下模型可参考6.5.901版本训练文档: Llama2/3:llama2-7b/13b/70b、llama3-8b/70b Qwen/Qwen1.5:qwen-7b/14b/72b、qwen1.5-7b/14b/32b/72b Yi:yi-6b、yi-32b BaiChuan2:baichuan2-7b、baichuan2-13b mistral-7b、glm3-6b
  • Llama-Factory glm4-9b模型 在训练开始前,需要修改glm4-9b模型中的tokenizer文件modeling_chatglm.py内容,具体步骤如下: 进入到tokenizer(权重)目录下,修改modeling_chatglm.py文件内容 vim modeling_chatglm.py # 注释掉以下两行内容 # if attention_mask is not None # attention_mask = ~attention_mask 样例图:
  • 软件配套版本 本方案支持的软件配套版本和依赖包获取地址如表2所示。 表2 软件配套版本和获取地址 软件名称 说明 下载地址 AscendCloud-6.5.902-xxx.zip 说明: 软件包名称中的xxx表示时间戳。 包含了本教程中使用到的推理部署代码和推理评测代码、推理依赖的算子包。代码包具体说明请参见软件包结构说明。 获取路径:Support-E,在此路径中查找下载ModelArts 6.5.902 版本。 说明: 如果上述软件获取路径打开后未显示相应的软件信息,说明您没有下载权限,请联系您所在企业的华为方技术支持下载获取。
  • 软件包结构说明 本教程需要使用到的AscendCloud-xxx中的AscendCloud-LLM-xxx.zip软件包和算子包AscendCloud-OPP,AscendCloud-LLM关键文件介绍如下。 |——AscendCloud-LLM ├──llm_inference # 推理代码 ├──ascend_vllm ├── vllm_npu # 推理源码 ├── ascend_vllm-0.7.2-py3-none-any.whl # 推理安装包 ├── build.sh # 推理构建脚本 ├── vllm_install.patch # 社区昇腾适配的补丁包 ├── Dockerfile # 推理构建镜像dockerfile ├── build_image.sh # 推理构建镜像启动脚本 ├── install_vllm.sh # vllm安装脚本 ├── reasoning-content.patch # reasoning-content功能补丁包 ├──llm_tools # 推理工具包 ├──AutoSmoothQuant # W8A8量化工具 ├── ascend_autosmoothquant_adapter # 昇腾量化使用的算子模块 ├── autosmoothquant_ascend # 量化代码 ├── build.sh # 安装量化模块的脚本 ├──AutoAWQ # W4A16量化工具 ├──convert_awq_to_npu.py # awq权重转换脚本 ├──quantize.py # 昇腾适配的量化转换脚本 ├──build.sh # 安装量化模块的脚本 ├──llm_evaluation # 推理评测代码包 ├──benchmark_tools #性能评测 ├── benchmark.py # 可以基于默认的参数跑完静态benchmark和动态benchmark ├── benchmark_parallel.py # 评测静态性能脚本 ├── benchmark_serving.py # 评测动态性能脚本 ├── benchmark_utils.py # 抽离的工具集 ├── generate_datasets.py # 生成自定义数据集的脚本 ├── requirements.txt # 第三方依赖
  • 资源规格要求 本文档中的模型运行环境是ModelArts Lite的弹性节点Server。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。 请参考Lite Server资源开通,购买Lite Server资源,并确保机器已开通,密码已获取,能通过SSH登录,不同机器之间网络互通。 当容器需要提供服务给多个用户,或者多个用户共享使用该容器时,应限制容器访问Openstack的管理地址(169.254.169.254),以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。
共100000条
提示

您即将访问非华为云网站,请注意账号财产安全