检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
--max-num-batched-tokens=4096 \ --tensor-parallel-size=1 \ --block-size=128 \ --host=${docker_ip} \ --port=8080 \ --gpu-memory-utilization=0.9 \ --num-scheduler-steps=8
pem文件转成.ppk文件 Step3 使用SSH工具连接云上Notebook实例 运行PuTTY。 单击“Session”,填写以下参数。 Host Name (or IP address):云上开发环境Notebook实例的访问地址,即在Notebook实例详情页获取的地址。例如:
、“限制”和“评论”等信息。 在详情页面单击“订阅”。 如果订阅的是非华为云官方资产,则会弹出“温馨提示”页面,勾选并阅读《数据安全与隐私风险承担条款》和《华为云AI Gallery服务协议》后,单击“继续订阅”才能继续进行模型订阅。 Workflow被订阅后,详情页的“订阅”按
--max-num-batched-tokens=4096 \ --tensor-parallel-size=1 \ --block-size=128 \ --host=${docker_ip} \ --port=8080 \ --gpu-memory-utilization=0.9 \ --num-scheduler-steps=8
--cpus 192 \ --memory 1000g \ --shm-size 200g \ --net=host \ -v ${work_dir}:${container_work_dir} \ --name ${container_name}
--cpus 192 \ --memory 1000g \ --shm-size 200g \ --net=host \ -v ${work_dir}:${container_work_dir} \ --name ${container_name}
xxx.xxx.xxx" --build-arg "http_proxy=http://xxx.xxx.xxx.xxx" --network=host -t <镜像名称>:<版本名称> . <镜像名称>:<版本名称>:定义镜像名称。示例:pytorch_2_1_ascend:20240606
流水线并行。建议值单机1,双机2。 RUN_TYPE sft 必填。表示训练类型。sft表示SFT微调。 MASTER_ADDR localhost 多机必填。主节点IP地址,多台机器中指定一个节点ip为主节点ip,一般指定第一个节点ip为主节点IP。 NNODES 1 多机必填。节点总数,如为双机,则写2。
执行。 # 单机执行命令为:sh demo.sh <MASTER_ADDR=localhost> <NNODES=1> <NODE_RANK=0> sh demo.sh localhost 1 0 单机如需指定训练卡数训练可使用ASCEND_RT_VISIBLE_DEVICES
执行。 # 单机执行命令为:sh demo.sh <MASTER_ADDR=localhost> <NNODES=1> <NODE_RANK=0> sh demo.sh localhost 1 0 单机如需指定训练卡数训练可使用ASCEND_RT_VISIBLE_DEVICES
pretrain:表示预训练 retrain:表示断点续训 sft:表示SFT微调训练 lora:表示LoRA微调训练 MASTER_ADDR localhost 多机必填。主节点IP地址,多台机器中指定一个节点ip为主节点ip,一般指定第一个节点ip为主节点IP。 NNODES 1 多机必填。节点总数,如为双机,则写2。
参数类型 说明 nfs object 共享文件系统类型的存储卷。仅支持运行于已联通共享文件系统网络的资源池的训练作业。具体请参见表14。 host_path object 主机文件系统类型的存储卷。仅支持运行于专属资源池中的训练作业。具体请参见表15。 表14 nfs属性列表 参数
执行。 # 单机执行命令为:sh demo.sh <MASTER_ADDR=localhost> <NNODES=1> <NODE_RANK=0> sh demo.sh localhost 1 0 单机如需指定训练卡数训练可使用ASCEND_RT_VISIBLE_DEVICES
Gallery,免费订阅此模型。 单击案例链接商超商品识别,进入模型详情页。 完成模型订阅。 在模型详情页,单击“订阅”,阅读并勾选同意《数据安全与隐私风险承担条款》 和 《华为云AI Gallery服务协议》,单击“继续订阅”。订阅模型完成后,页面的“订阅”按钮显示为“已订阅”。 从模型详情
存成一个镜像。 方式一:保存镜像需要指定镜像名称、镜像标签、SWR服务的组织等信息,保存镜像需要等待几分钟时间,期间不能对Notebook有额外操作。 SWR服务的组织可以在SWR服务中进行创建,也可以使用SDK创建默认的SWR组织,默认最多只能创建5个组织。 在“/home/m
参数类型 说明 nfs 否 Object 共享文件系统类型的存储卷。仅支持运行于已联通共享文件系统网络的资源池的训练作业。具体说明请参见表6。 host_path 否 Object 主机文件系统类型的存储卷。仅支持运行于专属资源池中的训练作业。具体说明请参见表7。 表12 nfs属性列表
xxx.xxx.xxx" --build-arg "http_proxy=http://xxx.xxx.xxx.xxx" --network=host -t <镜像名称>:<版本名称> . <镜像名称>:<版本名称>:定义镜像名称。示例:pytorch_2_1_ascend:20240606
区、内存展开和同步指令插入等。 性能分析工具 msprof命令行工具提供了采集通用命令以及AI任务运行性能数据、昇腾AI处理器系统数据、Host侧系统数据和采集和解析能力。面向推理的场景,可以对于模型的执行性能数据进行收集,可基于收集的性能数据进行性能分析。 父主题: GPU推理业务迁移至昇腾的通用指导
{image_url} 步骤三 启动容器镜像 启动容器镜像,启动前可以根据实际需要增加修改参数。 docker run -itd --net=host \ --device=/dev/davinci0 \ --device=/dev/davinci1 \ --device=/dev/davinci2
执行。 # 单机执行命令为:sh demo.sh <MASTER_ADDR=localhost> <NNODES=1> <NODE_RANK=0> sh demo.sh localhost 1 0 单机如需指定训练卡数训练可使用ASCEND_RT_VISIBLE_DEVICES