检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
预训练 前提条件 已上传训练代码、训练权重文件和数据集到SFS Turbo中,具体参考代码上传至OBS和使用Notebook将OBS数据导入SFS Turbo。 Step1 在Notebook中修改训练超参配置 以llama2-13b预训练为例,执行脚本0_pl_pretrain_13b
查看批量服务的事件 服务的(从用户可看见部署服务任务开始)整个生命周期中,每一个关键事件点在系统后台均有记录,用户可随时在对应服务的详情页面进行查看。 方便用户更清楚的了解服务部署和运行过程,遇到任务异常时,更加准确的排查定位问题。可查看的事件点包括: 表1 事件 事件类型 事件
组织信息 超级管理员可对组织信息进行维护和修改。 修改组织信息 当组织信息(如名称、联系人信息等)变更时,超级管理员可以在组织信息页面更新相关信息。 在角色桌面首页,选择左上角的,单击“管理中心”。 选择“用户及授权管理 > 用户管理 > 组织信息”,进入“组织信息”页面。 单击“更新”,修改组织基本信息和联系信息。
添加通用清单卡片 前提条件 已进入IPDCenter基础服务首页。 您已获取通用数据清单卡片的配置文件。 如未获取,请参考通用清单模板卡片配置进行配置。 使用须知 上传的配置文件仅支持json格式,文件大小不能超过1MB。 仅支持上传一个配置文件,如果上传后再次上传配置文件,会覆盖原有的配置文件。
从这里开始 通用(精炼)生产方案向导 高阶(精细)生产方案向导 父主题: 制造数据模型管理
生产管理 生产准备 生产执行 生产入库 生产看板 父主题: MBM Space界面使用指导
主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导(6.3.907) 场景介绍 准备工作 预训练 SFT全参微调训练 LoRA微调训练 查看日志和性能 训练脚本说明 常见错误原因和解决方法 父主题: LLM大语言模型训练推理
主流开源大模型基于Server适配PyTorch NPU推理指导(6.3.909) 推理场景介绍 部署推理服务 推理性能测试 推理精度测试 推理模型量化 附录:基于vLLM不同模型推理支持最小卡数和最大序列说明 附录:大模型推理常见问题 父主题: LLM大语言模型训练推理
新增业务报表页面 业务报表以页面来呈现和管理,本章节介绍如何新建业务报表页面。 前提条件 已新增业务报表数据源。 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 新建业务报表页面 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 >
接入CES指标并生成业务报表 AppStage运维中心监控服务支持采集CES收集的监控指标数据,并且可以快速创建指标及业务报表。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已购买并配置相应的华为云资源,如ECS、VPN、OBS等。 接入CES指标并生成业务报表
管理业务报表页面 对于已新增的页面,需要发布后,其他成员才能在“业务报表”页面进行查看,并且支持对页面进行管理操作。 发布页面 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“监控 > 报表开发”。
创建和管理资源 在SLB中创建资源 在SLB中创建资源组 父主题: 配置运维中心负载均衡
资源准备 为了使迁移顺利进行,您需要准备如下工作。 准备网络环境。 根据组网方案连接华为云与源端,云专线打通或VPN配置等,请参考SAP部署指南相关章节。 华为云网络环境搭建,即创建VPC、子网、定义安全组等,详情请参考SAP部署指南相关章节。 准备迁移需要用到的软件工具,例如S
在系统登录页面,单击激活License,并按照要求上传License文件或者填写License识别码后,单击激活按钮来激活License。 激活成功后,平台下的用户可登录系统。 配额计算:DOCC平台对的license中不对OmniAgent进行限制,只对CDC扩展插件进行配额校验,即成功安装一个CDC扩展消耗一个
构。 物联网平台支持设备通过LoRa网络接入,但LoRaWAN设备不能直连物联网平台,需要经过LoRa服务商提供的LoRa Server接入物联网平台,如下图所示。 LoRa Server:由LoRa服务商提供的LoRa接入服务器,LoRa Server与物联网平台之间通过MQT
故障处理响应时间为24 小时。 根据故障实际情况判断故障处理完成时限,并告知用户。 每次现场支持提供相应的技术报告。 父主题: 智慧大气智能化大气监测管治平台Alpha Maps
是否必选 参数类型 描述 cust_flag 是 String 创建解析任务时填写用户唯一标识,手机号码或者任何的唯一标识,唯一标识不超过64个字符。 发送智能信息时则必须填客户的手机号码。样例为:130****0001。 最大长度:64 dync_params 否 Map<String
# 基于AscendSpeed的训练代码 |──ascendcloud_patch/ # 针对昇腾云平台适配的功能补丁包 |──scripts/ # 训练需要的启动脚本
Cluster上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件,为用户提供推理部署方案,帮助用户使能大模型业务。 约束限制 本方案目前仅适用于部分企业客户。
IP地址/范围或MAC地址: 10.1.1.0/24 10.1.2.0/23 10.1.4.0/23 10.1.6.0/23 父主题: 在云管理平台上配置租户网络业务