检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
管理已纳管的ELB ENS支持对纳管的ELB创建监听器,监听器负责监听负载均衡器上的请求,根据配置流量分配策略,分发流量到后端服务器处理。同时支持对ELB进行锁定和解锁,锁定后该ELB不能使用IaC更新。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
添加版本交付件模板 组织管理员可以为交付件规划版本活动添加交付件模板,添加后创建的版本交付件规划会继承模板配置。 前提条件 已获取组织管理员角色权限,权限申请方法请参见申请权限。 添加交付件模板 在开发中心首页右上角选择“工具链 > 版本活动管理”。 在“版本活动管理”页面,单击“交付件规划”卡片。
查看实时运行日志 为组件关联LTS日志组后,您可以查看实时上报的组件运行日志。 前提条件 组件已关联LTS日志组,请参考关联LTS日志组。 查看实时运行日志 登录ServiceStage控制台。 选择以下任意方式进入组件“运行日志”页面: 在“应用管理”页面,单击组件所属应用名称
GPT-2基于Server适配PyTorch GPU的训练推理指导 场景描述 本文将介绍在GP Ant8裸金属服务器中,使用DeepSpeed框架训练GPT-2(分别进行单机单卡和单机多卡训练)。 训练完成后给出自动式生成内容,和交互式对话框模式。 背景信息 Megatron-DeepSpeed
根据泳道组ID修改泳道组网关路由配置 功能介绍 此API用于根据泳道组ID修改泳道组网关路由配置。 调试 您可以在API Explorer中调试该接口。 URI PUT /v3/{project_id}/cas/swimlane-group/{lane_group_id}/route
用户使用ma-cli制作自定义镜像失败,报错文件不存在(not found) 问题现象 用户使用ma-cli制作自定义镜像失败,报错文件目录不存在。 图1 报错xxx not found 原因分析 复制的文件需要放在Dockerfile同级文件夹或者子目录中,不能放在Dockerfile上层目录。
查看AstroZero账号的业务阈值 创建AstroZero实例时,系统会根据所选的规格分配不同级别的业务阈值,从而对账号分配相应的系统资源。本章节将指导您查看当前账号下可以再创建多少App、应用菜单、服务编排、流程编排等,以及查看该账号是否具有数据接入、高级页面等功能。 查看业务阈值
使用GPTQ量化 当前版本使用GPTQ量化仅支持W8A16 perchannel的量化形式,使用W8A16的量化不仅可以保证精度在可接受的范围内,同时也有一定的性能收益。 GPTQ W8A16量化支持的模型请参见支持的模型列表和权重文件。 本章节介绍如何在GPU的机器上使用开源GPTQ量化工具GPTQ
LoRA微调训练 前提条件 已上传训练代码、训练权重文件和数据集到SFS Turbo中。 Step1 修改训练超参配置 以llama2-13b LORA微调为例,执行脚本0_pl_lora_13b.sh 。 修改模型训练脚本中的超参配置,必须修改的参数如表1所示。其他超参均有默认值,可以参考表1按照实际需求修改。
查看日志和性能 单击作业详情页面,则可查看训练过程中的详细信息。 图1 查看训练作业 在作业详情页的日志页签,查看最后一个节点的日志,其包含“elapsed time per iteration (ms)”数据,可换算为tokens/s/p的性能数据。 吞吐量(tokens/s/p):global
预训练任务 步骤一 上传训练权重文件和数据集 如果在准备代码和数据阶段已经上传权重文件和数据集到容器中,可以忽略此步骤。 如果未上传训练权重文件和数据集到容器中,具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。
准备权重 获取对应模型的权重文件,获取链接参考表1。 权重文件下载有如下几种方式,但不仅限于以下方式: 方法一:网页下载:通过单击表格中权重文件获取地址的访问链接,即可在模型主页的Files and Version中下载文件。 方法二:huggingface-cli:huggingface-cli是
SD WebUI推理性能测试 以下性能测试数据仅供参考。 开启Flash Attention 生成1280x1280图片,使用Ascend: 1* ascend-snt9b(64GB),约耗时7.5秒。 图1 生成图片耗时(1) 生成1280x1280图片,使用Ascend: 1*
迁移Standard专属资源池和网络至其他工作空间 背景信息 专属资源池的工作空间关联了企业项目,企业项目涉及到账单归集。为隔离不同子用户操作资源的权限,ModelArts提供了工作空间功能,管理员可以根据工作空间,隔离不同子用户操作工作空间内资源的权限。工作空间迁移包括资源池迁移和网络迁移,具体方法可见下文说明。
ma-cli ma-job训练作业支持的命令 使用ma-cli ma-job命令可以提交训练作业,查询训练作业日志、事件、使用的AI引擎、资源规格及停止训练作业等。 $ ma-cli ma-job -h Usage: ma-cli ma-job [OPTIONS] COMMAND
可以对华为云外的站点提供服务吗? 该服务目前不支持对华为云外的站点提供服务。 父主题: 关于服务咨询
用? Q:实况/录像播放一直在缓冲中是什么原因? Q:人群态势当前包含哪些算法?设备支持哪些算法?APP端在哪里查看? Q:电脑WEB端上语音对讲摄像机处可以听到声音,但在手机APP上对讲听到的却全是杂音,是什么原因导致? Q:SDC通过NVR连接行业视频管理服务(原好望云服务),(单击智能服务
删除安全组规则:当安全组规则入方向、出方向源地址/目的地址有变化时,或者不需要开放某个端口时,您可以参考删除安全组规则进行安全组规则删除。 修改初始化密码。登录华为云服务器控制台,参考在控制台重置弹性云服务器密码,进行密码重置。 登录ECS弹性云服务器控制平台,单击远程登录,或者使用其他的远程登录工具进入Linux弹性云服务器。
d/model/权重文件夹名称,如:/home/mind/model/chatglm3-6b。 /home/mind/model路径为推理平台固定路径,部署服务时会将Step1 准备模型文件和权重文件OBS路径下的文件传输至/home/mind/model路径下。 --tenso
使用AstroZero创建原生服务 操作场景 AstroZero平台提供了创建原生服务工程的能力,原生服务工程本质上起到一种桥接的作用,用于将运行于AstroZero平台之外的原生服务的API集成到AstroZero,使得运行于AstroZero之上的应用,更容易地使用原生服务的API。