检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
demo workflow", steps=[service_step] ) 更新在线服务 使用场景:使用新版本的模型对已有的服务进行更新,需要保证新版本的模型与已部署服务的模型名称一致。 import modelarts.workflow as wf # 通过Servi
labels与input_ids对应,用-100替换user_ids的token,只保留assistant_ids attention_mask是和input_ids等长的全1序列 返回input_ids\attention_mask\labels的字典 处理完单一sample 注:labels中用-100填充的
labels与input_ids对应,用-100替换user_ids的token,只保留assistant_ids attention_mask是和input_ids等长的全1序列 返回input_ids\attention_mask\labels的字典 处理完单一sample 注:labels中用-100填充的
出现,但不可与data_url或data_source同时出现。 dataset_version_id 否 String 训练作业的数据集版本ID。应与dataset_id同时出现,但不可与data_url或data_source同时出现。 data_source 否 JSON Array
用户项目ID。获取方法请参见获取项目ID和名称。 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 apiVersion 是 String API版本。可选值如下: v1 kind 是 String 资源类型。可选值如下: Network:网络 metadata 是 NetworkMetadataCreation
labels与input_ids对应,用-100替换user_ids的token,只保留assistant_ids attention_mask是和input_ids等长的全1序列 返回input_ids\attention_mask\labels的字典 处理完单一sample 注:labels中用-100填充的
labels与input_ids对应,用-100替换user_ids的token,只保留assistant_ids attention_mask是和input_ids等长的全1序列 返回input_ids\attention_mask\labels的字典 处理完单一sample 注:labels中用-100填充的
labels与input_ids对应,用-100替换user_ids的token,只保留assistant_ids attention_mask是和input_ids等长的全1序列 返回input_ids\attention_mask\labels的字典 处理完单一sample 注:labels中用-100填充的
包含了本教程中使用到的模型训练代码。代码包具体说明请参见模型软件包结构说明。 获取路径:Support-E,在此路径中查找下载ModelArts 6.3.912 版本。 说明: 如果上述软件获取路径打开后未显示相应的软件信息,说明您没有下载权限,请联系您所在企业的华为方技术支持下载获取。 模型软件包结构说明
|──llm_inference # 推理代码包 |──llm_tools # 推理工具 代码上传至OBS 将AscendSpeed代码包AscendCloud-LLM-xxx.zip在本地解压缩后,将llm_train文件上传至OBS中。
labels与input_ids对应,用-100替换user_ids的token,只保留assistant_ids attention_mask是和input_ids等长的全1序列 返回input_ids\attention_mask\labels的字典 处理完单一sample 注:labels中用-100填充的
用户项目ID。获取方法请参见获取项目ID和名称。 job_id 是 Long 训练作业的ID。 version_id 是 Long 训练作业的版本ID。 表2 Query参数 参数 是否必选 参数类型 说明 base_line 否 String 日志的基准位置,根据接口返回获得,为空的时候代表获取最新的日志。
包含了本教程中使用到的模型训练代码。代码包具体说明请参见模型软件包结构说明。 获取路径:Support-E,在此路径中查找下载ModelArts 6.3.912 版本。 说明: 如果上述软件获取路径打开后未显示相应的软件信息,说明您没有下载权限,请联系您所在企业的华为方技术支持下载获取。 模型软件包结构说明
Lite资源池对应的CCE集群需要安装1.10.12及以上版本的华为云版Volcano插件。Volcano调度器的安装升级请参见Volcano调度器。仅华为云版Volcano插件支持开启路由加速特性。 训练使用的Python版本是3.7或3.9,否则无法实现ranktable路由加速。
服务网段(固定是10.247.0.0/16) 确认无误后,单击“确定”。 步骤二:打通VPC(可选) 通过打通VPC,可以方便用户跨VPC使用资源,提升资源利用率。 在“网络”页签,单击网络列表中某个网络操作列的“打通VPC”。 图3 打通VPC 在打通VPC弹框中,打开“打通VPC”开关,在下拉框中选择可用的VPC和子网。
表1 NPU卡数、加速框架、梯度配置取值表 模型 Template 模型参数量 训练策略类型 序列长度cutoff_len 梯度累积值 优化工具(Deepspeed) 规格与节点数 llama2 llama2 7B lora 4096/8192 gradient_accumulation_steps:
SAVE_INTERVAL 1000 用于模型中间版本地保存。 当参数值>=TRAIN_ITERS时,生成模型仅保存经过TRAIN_ITERS次训练后的最后一个版本。 当参数值<TRAIN_ITERS时,生成模型会每经过SAVE_INTERVAL次,保存一次模型版本。 模型版本保存次数=TRAIN_IT
SAVE_INTERVAL 1000 用于模型中间版本地保存。 当参数值>=TRAIN_ITERS时,生成模型仅保存经过TRAIN_ITERS次训练后的最后一个版本。 当参数值<TRAIN_ITERS时,生成模型会每经过SAVE_INTERVAL次,保存一次模型版本。 模型版本保存次数=TRAIN_IT
在ModelArts的Notebook中JupyterLab默认工作路径是什么? 如何查看ModelArts的Notebook使用的cuda版本? 在ModelArts的Notebook中如何获取本机外网IP? ModelArts的Notebook有代理吗?如何关闭? 在Model
String 镜像所述的SWR组织。 update_at Long 镜像最后更新的时间,UTC毫秒。 version_count Integer 镜像版本个数。 请求示例 GET https://{endpoint}/v1/{project_id}/images/group 响应示例 状态码:200