检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Step4 启动AWQ量化服务 参考部署推理服务,使用量化后权重部署AWQ量化服务。 注:Step3 创建服务启动脚本启动脚本中,服务启动命令需添加如下命令。 -q awq 或者--quantization awq 父主题: 推理模型量化
方法二:用户在Notebook中直接编辑scripts/llama2/1_preprocess_data.sh脚本,自定义环境变量的值,并在脚本的首行中添加 cd /home/ma-user/work/llm_train/AscendSpeed/ModelLink 命令,随后在Notebook中运行该脚本。
ning下,修改main.py文件,在第10行添加如下代码。 import torch_npu from torch_npu.contrib import transfer_to_npu 同样,修改train.py文件,在第11行添加如上代码,如图1所示。 图1 修改train.py文件
p4(需申请)/modelarts.vm.ai1.a310(需申请),需申请权限才能使用的规格请在华为云创建工单,由ModelArts运维工程师添加权限。 instance_count 是 Integer 模型部署的实例数,当前限制最大实例数为128,如需使用更多的实例数,需提交工单申请。
开关。对于同一个数据集,可以创建多个团队标注任务。 图2 打开启用团队标注 只有当创建团队标注任务时,标注人员才会收到邮件。创建标注团队及添加标注团队的成员并不会发送邮件。此外,当所有样本都是已标注状态时,创建团队标注任务也不会收到邮件。 标注任务创建完成后,会将所有未标注状态的
读写权限:readwrite(创建开发环境实例modelarts:notebook:create仅支持配置readwrite) 如果需要在一个自定义策略中添加多个不同的sfsOption,需要“Statement”中新增JSON结构体,例如: { "Version": "1.1",
OUTPUT_SAVE_DIR:训练完成后指定的输出模型路径。 HF_SAVE_DIR:训练完成的权重文件自动转换为Hugging Face格式权重输出的路径(确保添加CONVERT_MG2HF环境变量并设置为True)。 分别单击“输入”和“输出”的数据存储位置,如图所示,选择OBS桶中指定的目录。OR
OUTPUT_SAVE_DIR:训练完成后指定的输出模型路径。 HF_SAVE_DIR:训练完成的权重文件自动转换为Hugging Face格式权重输出的路径(确保添加CONVERT_MG2HF环境变量并设置为True)。 分别单击“输入”和“输出”的数据存储位置,如图所示,选择OBS桶中指定的目录。OR
5-7b块。 exp_name:实验块,训练策略-序列长度所需参数配置。 样例yaml文件仅展示常用实验配置,如需其他配置需根据样例自行添加,样例截图如下: 步骤二:执行训练任务 进入test-benchmark目录执行训练命令,可以多次执行,卡数及其它配置参考NPU卡数取值表按自己实际情况决定
“策略配置方式”为“JSON视图”。 “策略内容”请参见ModelArts开发环境使用权限的自定义策略样例,ModelArts自定义策略中可以添加的授权项(Action)请参见《ModelArts API参考》>权限策略和授权项。 如果您需要对除ModelArts和OBS之外的其它服
“策略配置方式”为“JSON视图”。 “策略内容”请参见ModelArts开发环境使用权限的自定义策略样例,ModelArts自定义策略中可以添加的授权项(Action)请参见《ModelArts API参考》>权限策略和授权项。 如果您需要对除ModelArts和OBS之外的其它服
cess_data 【可选】如已有预处理完成数据可指定此目录,训练过程中会优先加载此目录,跳过数据预处理过程;默认无此参数,用户自定义自行添加 ORIGINAL_HF_WEIGHT /home/ma-user/work/models/llama-2-13b-chat-hf 【必改
当模型配置了健康检查,部署的服务在收到停止指令后,会延后3分钟才停止。 “模型说明” 为了帮助其他模型开发者更好的理解及使用您的模型,建议您提供模型的说明文档。单击“添加模型说明”,设置“文档名称”及其“URL”。模型说明支持增加3条。 “部署类型” 选择此模型支持部署服务的类型,部署上线时只支持部署为此处
driver driver object 资源池驱动信息。 parent String 资源池父节点名称,物理池为空。 root String 资源池根节点名称,物理池为自己的名称。 表20 resources 参数 参数类型 描述 creating PoolResourceFlavorCount
索引,此处可以根据此时间进行搜索。可选值如下: month:搜索往前30天至今天内添加的样本 day:搜索昨天(往前1天)至今天内添加的样本 yyyyMMdd-yyyyMMdd:搜索指定时间段内添加的样本,格式为“起始日期-结束日期”,查询天数不能超过30天。例如:“201909
}/llm_tools 其中,`${root_path_of_AscendCloud-LLM}`为AscendCloud-LLM包解压后的根路径。 当使用昇腾云的官方指导文档制作推理镜像时,可直接基于该固定路径配置环境变量: export LLM_TOOLS_PATH=/home
可以依据用户设置的相似程度阈值完成图像去重处理。图像去重是图像数据处理常见的数据处理方法。图像重复指图像内容完全一样,或者有少量的尺度、位移、色彩、亮度变化,或者是添加了少量其他内容等。 图4 SimDeduplication效果图 表1 高级参数说明 参数名 是否必选 默认值 参数说明 simlarity_threshold
OUTPUT_SAVE_DIR:训练完成后指定的输出模型路径。 HF_SAVE_DIR:训练完成的权重文件自动转换为Hugging Face格式权重输出的路径(确保添加CONVERT_MG2HF环境变量并设置为True)。 分别单击“输入”和“输出”的数据存储位置,如图所示,选择OBS桶中指定的目录。OR
OUTPUT_SAVE_DIR:训练完成后指定的输出模型路径。 HF_SAVE_DIR:训练完成的权重文件自动转换为Hugging Face格式权重输出的路径(确保添加CONVERT_MG2HF环境变量并设置为True)。 分别单击“输入”和“输出”的数据存储位置,如图所示,选择OBS桶中指定的目录。OR
obs:object:PutObjectAcl permission 子用户没有OBS的obs:object:PutObjectAcl权限,为子用户添加委托权限。FAQ 异常 镜像构建任务超时。限制超时时间为xxx分钟。 Image building task timeout. The %s-minute