检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
桶)前,需要用户通过IAM委托向ModelArts显式授权,ModelArts在需要时使用用户的委托获取临时认证凭据用于操作用户资源,见“添加授权”。 图1 委托授权 如图1所示,用户向ModelArts授权后,ModelArts使用委托授权的临时凭证访问和操作用户资源,协助用户
39 } 根据“description”和“name”字段选择创建Notebook实例所需要的镜像,并记录对应的“id”,本章以TensorFlow引擎为例创建Notebook实例,记录“id”为"e1a07296-22a8-4f05-8bc8-e936c8e54100" 调用创建N
storages=[input_storage, output_storage] # 注意在整个工作流中使用到的Storage对象需要在这里添加 ) 开发态配置 调用工作流对象的run方法,在开始运行时展示输入框,等待用户输入,如下所示: 图1 等待用户输入 要求用户输入已存在的路
rainingLogParser查看loss收敛情况。 其它注意事项 默认500step保存一个checkpoint,可以通过在启动脚本里添加参数--checkpointing_steps=num修改。 若显存较低可以调整batch_size保证正常运行,改为8或者更小。 本次训
aMA-Factory/data 【可选】dataset_info.json配置文件所属的绝对路径;如使用自定义数据集,yaml配置文件需添加此参数。 template qwen 必须修改。用于指定模板。如果设置为"qwen",则使用QWEN模板进行训练,模板选择可参照表1中的template列
训练在子任务状态信息。 running_records Array of RunningRecord objects 训练作业运行及故障恢复记录。 表8 TaskStatuses 参数 参数类型 描述 task String 训练作业子任务名称。 exit_code Integer
":"cabinet"}”,如图2所示。 图2 Volcano调度器的高级配置 是,则执行2。 否,则在高级配置的“plugins”参数下添加“{"name":"cabinet"}”,单击下方的“安装”使Volcano调度器更新配置,完成滚动重启。 修改torch_npu训练启动脚本。
在“服务列表”中选择“管理与监管 > 云监控服务”,进入“云监控服务”管理控制台。 在左侧导航栏,选择“云服务监控 > ModelArts”。 选择需要添加告警规则的在线服务名称,单击操作列的“创建告警规则”。 在“创建告警规则”界面,根据界面提示设置ModelArts在线服务和模型负载的告警规则。
length_penalty表示在beam search过程中,对于较长的序列,模型会给予较大的惩罚。 如果要使用length_penalty,必须添加如下三个参数,并且需将use_beam_search参数设置为true,best_of参数设置大于1,top_k固定为-1。 "top_k":
解决方案2 在程序开头设置“os.environ["NCCL_NET_GDR_LEVEL"] = '0'”关闭使用GDR,或者寻找运维人员将机器添加GDR。 问题现象3 NCCL信息中报出Got completion with error 12, opcode 1, len 32478
Administrator 云硬盘EVS EVS FullAccess 如果系统预置的权限,不满足您的授权要求,可以创建自定义策略。自定义策略中可以添加的授权项(Action)请参考ModelArts资源权限项。 目前支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略
OUTPUT_SAVE_DIR:训练完成后指定的输出模型路径。 MG_TO_HF_PATH:训练完成的权重文件自动转换为Hugging Face格式权重输出的路径(确保添加CONVERT_MG2HF环境变量并设置为True)。 分别单击“输入”和“输出”的数据存储位置,如图所示,选择OBS桶中指定的目录。OR
aMA-Factory/data 【可选】dataset_info.json配置文件所属的绝对路径;如使用自定义数据集,yaml配置文件需添加此参数。 template qwen 必须修改。用于指定模板。如果设置为"qwen",则使用QWEN模板进行训练,模板选择可参照表1中的template列
aMA-Factory/data 【可选】dataset_info.json配置文件所属的绝对路径;如使用自定义数据集,yaml配置文件需添加此参数。 template qwen 必须修改。用于指定模板。如果设置为"qwen",则使用QWEN模板进行训练,模板选择可参照表1中的template列
云上迁移适配故障 无法导入模块 训练作业日志中提示“No module named .*” 如何安装第三方包,安装报错的处理方法 下载代码目录失败 训练作业日志中提示“No such file or directory” 训练过程中无法找到so文件 ModelArts训练作业无法解析参数,日志报错
aMA-Factory/data 【可选】dataset_info.json配置文件所属的绝对路径;如使用自定义数据集,yaml配置文件需添加此参数。 template qwen 必须修改。用于指定模板。如果设置为"qwen",则使用QWEN模板进行训练,模板选择可参照表1中的template列
产品变更公告 网络调整公告 预测API的域名停用公告
访问这些依赖服务。 使用华为云账号登录ModelArts管理控制台,在左侧导航栏单击“权限管理”,进入“权限管理”页面,单击“添加授权”。 在弹出的“添加授权”窗口中,选择: 授权对象类型:所有用户 委托选择:新增委托 权限配置:普通用户 选择完成后勾选“我已经详细阅读并同意《M
训练的数据集预处理说明 以 llama2-13b 举例,运行:0_pl_pretrain_13b.sh 训练脚本后,脚本检查是否已经完成数据集预处理的过程。 若已完成数据集预处理,则直接执行预训练任务。若未进行数据集预处理,则会自动执行 scripts/llama2/1_preprocess_data
访问这些依赖服务。 使用华为云账号登录ModelArts管理控制台,在左侧导航栏单击“权限管理”,进入“权限管理”页面,单击“添加授权”。 在弹出的“添加授权”窗口中,选择: 授权对象类型:所有用户 委托选择:新增委托 权限配置:普通用户 选择完成后勾选“我已经详细阅读并同意《M