检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
准备工作 在定位精度问题之前,首先需要排除训练脚本及参数配置等差异的干扰。目前大部分精度无法对齐的问题都是由于模型超参数、Python三方库版本、模型源码等与标杆环境(GPU/CPU)设置的不一致导致,为了在定位过程中少走弯路,需要在定位前先对训练环境及代码做有效排查。此外,问题
准备Notebook ModelArts Notebook云上云下,无缝协同,更多关于ModelArts Notebook的详细资料请查看Notebook使用场景介绍。本案例中使用ModelArts的开发环境Notebook部署推理服务进行调试,请按照以下步骤完成Notebook的创建。
LoRA微调训练 前提条件 已上传训练代码、训练权重文件和数据集到OBS中,具体参考代码上传至OBS。 Step1 创建训练任务 创建训练作业,并自定义名称、描述等信息。选择自定义算法,启动方式自定义,以及选择上传的镜像。 代码目录选择:OBS桶路径下的llm_train/AscendSpeed代码目录。
查看日志和性能 单击作业详情页面,则可查看训练过程中的详细信息。 图1 查看训练作业 在作业详情页的日志页签,查看最后一个节点的日志,其包含“elapsed time per iteration (ms)”数据,可换算为tokens/s/p的性能数据。 吞吐量(tokens/s/p):global
场景介绍 方案概览 本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件,为用户提供了常见主流开源大模型在ModelArts Lite Server上的预训练和全量微调方案。训练框架使用的是ModelLink。 本方案目前仅适用于部分企业客户,完成本方案
查看日志和性能 单击作业详情页面,则可查看训练过程中的详细信息。 图1 查看训练作业 在作业详情页的日志页签,查看最后一个节点的日志,其包含“elapsed time per iteration (ms)”数据,可换算为tokens/s/p的性能数据。 吞吐量(tokens/s/p):global
场景介绍 方案概览 本文档利用训练框架LlamaFactory+华为自研Ascend Snt9B硬件,为用户提供了常见主流开源大模型在ModelArts Lite DevServer上的不同训练阶段方案,包括指令监督微调、DPO偏好训练、RM奖励模型训练、PPO强化训练方案。 DPO(Direct
通过调整模型参数对异常告警调优 由于超参设置或是数据特征发生变化,导致预测的数据不够准确,出现误告警,可以通过调整模型参数,对生成的异常告警进行调优。本章节介绍不同类型异常告警及调优方法。 调优配置方法 在“异常检测”页面,单击异常检测任务所在行“操作”列的“模型”,默认显示“算法配置”页签,参考表1配置参数。
与其他云服务的关系 与消息中心的关系 消息中心是为您提供各类通知消息的接收和管理的服务平台。通过消息中心,设置“服务单提醒”通知,方便您及时了解服务单进展,从而避免信息遗漏造成不必要的损失。 关于消息中心的详细介绍,请参见《消息中心用户指南》。 与统一身份认证服务的关系 统一身份认证服务(Identity
web端用户工作台概述 开天企业工作台是以行业解决方案为核心的一站式企业沟通与协作平台,整合行业应用、即时消息、日程、通讯录、工作台等功能于一体,打造高效的行业解决方案,助力企业工作高效协同快速发展。 父主题: 普通用户指南(web)
# 基于AscendSpeed的训练代码 |──ascendcloud_patch/ # 针对昇腾云平台适配的功能补丁包 |──scripts/ # 训练需要的启动脚本
# 基于AscendSpeed的训练代码 |──ascendcloud_patch/ # 针对昇腾云平台适配的功能补丁包 |──scripts/ # 训练需要的启动脚本
查询套餐内使用量 服务对象 客户 场景描述 客户购买包年/包月资源后,在自建平台可以查询套餐内的使用量。 相关API列表 开放接口 接口定义链接 查询套餐内使用量 https://support.huaweicloud.com/api-oce/api_order_00006.html
硬终端怎么自定义会场名? 在“WeLink会议管理平台”的“硬件终端管理”中修改该终端的“名称”,重启终端后生效。 父主题: 业务使用
NCE-Campus? iMaster NCE-Campus是云管理网络的核心部件,也可以叫做云管理平台,是基于云的网络管理运维和控制系统;除了可以对云化设备的基本管理配置、远程运维监控、用户的准入控制外,基于大数据平台还可以实现多样的增值业务。
执行完性能自动化用例后为什么没有看到执行结果? 首先请确认执行性能自动化用例必须在解决方案工作台上启动执行; 如果在CPTS平台直接启动测试,则需要手动在解决方案工作台该用例页面同步CPTS的测试结果。 上述两点都解决不了的话请联系解决方案工作台客服。 父主题: 验证中心
接入平台,您可以根据自己的设备选择合适的方式。 前提条件 已完成平台侧开发。 直接接入平台 针对已实现TCP/IP协议栈的设备,可以直接与平台进行通信,常见的设备包括网关、以太网设备、NB-IoT设备等。 根据设备自身硬件的特点不同,华为物联网平台提供四种方式直接接入,您需要根据
输入激活码。 配置前需确认该会议设备已在“WeLink会议管理平台”上添加完成。 激活码有效期为10天,时间自会议设备在“WeLink会议管理平台”上添加完成之日起计算。如激活码已失效,请登录“WeLink会议管理平台”,重置该会议设备的激活码。 安全起见,如您在五分钟内,激活码
在数据总览页面可查看平台数据服务的统计数据,帮助用户快速了解各项数据关键指标和业务的健康情况。 进入总览数据页面: 登录Octopus服务平台,在左侧菜单栏中单击“数据资产 > 数据总览”。 图1 数据总览 表1 总览页面说明 序号 区域名称 说明 1 采集数据统计 平台数据量的统计信息,并图形化展现历史数据趋势。
用上线。华为乾坤云平台添加了设备信息后,会向华为注册查询中心同步,包括自身的地址和端口号。交换机在获取管理IP地址后,可以主动向华为注册查询中心发起HTTP2.0连接请求,然后获取华为乾坤云平台的地址和端口号,最终完成上线。 交换机如果不是第一次向华为乾坤云平台注册,则会优先使用