检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
具体支持如下使用场景: 下载单个文件 下载多个文件 下载文件到指定路径 下载单个AI Gallery仓库 准备工作 获取“repo_id”和待下载的文件名。 获取“repo_id” 在AI Gallery页面的资产详情页,单击复制完整的资产名称,如图1所示,获取到的信息即为“re
/NPU的平均利用率低于50%时,在训练作业列表中会进行告警提示。 图2 作业列表显示作业资源利用率情况 此处的作业资源利用率只涉及GPU和NPU资源。作业worker-0实例的GPU/NPU平均利用率计算方法:将作业worker-0实例的各个GPU/NPU加速卡每个时间点的利用率汇总取平均值。
例中的桶名称“test-modelarts” 和文件夹名称均为举例,请替换为用户自定义的名称。 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。 请确保您使用的OBS与ModelArts在同一区域。 表1 OBS桶文件夹列表 文件夹名称 用途 “obs://test-mo
实例正常,有的实例异常。正常的实例会产生费用,此时服务状态是concerning。 failed:失败,服务部署失败,失败原因可以查看事件和日志标签。 stopped:停止。 finished:只有批量服务会有这个状态,表示运行完成。 sort_by 否 String 指定排序字
vors 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 表2 Query参数 参数 是否必选 参数类型 描述 flavor_type 否 String 查询训练作业规格的类型,不填为查询所有。枚举值:
例描述、创建时间等单个筛选或组合筛选。 给子账号配置查看所有Notebook实例的权限 当子账号被授予“listAllNotebooks”和“listUsers”权限时,在Notebook页面上,单击“查看所有”,可以看到IAM项目下所有子账号创建的Notebook实例 。配置该
服务编号,可通过查询服务列表获取。 api_id 是 String APP编号。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 表2 Query参数 参数 是否必选 参数类型 描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工
例描述、创建时间等单个筛选或组合筛选。 给子账号配置查看所有Notebook实例的权限 当子账号被授予“listAllNotebooks”和“listUsers”权限时,在Notebook页面上,单击“查看所有”,可以看到IAM项目下所有子账号创建的Notebook实例 。配置该
从最新生成权重文件处继续训练。详见断点续训和故障快恢说明 CKPT_LOAD_TYPE 1 可选【0、1、2】,默认为1 0: 不加载权重 1:加载权重不加载优化器状态【增量训练】 2:加载权重且加载优化器状态【 断点续训】详见断点续训和故障快恢说明 USER_CONVERTED_CKPT_PATH
从最新生成权重文件处继续训练。详见断点续训和故障快恢说明 CKPT_LOAD_TYPE 1 可选【0、1、2】,默认为1 0: 不加载权重 1:加载权重不加载优化器状态【增量训练】 2:加载权重且加载优化器状态【 断点续训】详见断点续训和故障快恢说明 USER_CONVERTED_CKPT_PATH
将自定义的推理文件和模型配置文件保存在训练生成的模型文件目录下。如训练生成的模型保存在“/home/ma-user/work/tensorflow_mlp_mnist_local_mode/train/model/”中,则推理文件“customize_service.py”和模型配置文件“config
best_of:大于1 ignore_eos 否 False Bool ignore_eos表示是否忽略EOS并且继续生成Token。 普通requests包和curl命令的返回示例如下所示: { "id": "cmpl-29f7a172056541449eb1f9d31c*****",
从最新生成权重文件处继续训练。详见断点续训和故障快恢说明 CKPT_LOAD_TYPE 1 可选【0、1、2】,默认为1 0: 不加载权重 1:加载权重不加载优化器状态【增量训练】 2:加载权重且加载优化器状态【 断点续训】详见断点续训和故障快恢说明 USER_CONVERTED_CKPT_PATH
从最新生成权重文件处继续训练。详见断点续训和故障快恢说明 CKPT_LOAD_TYPE 1 可选【0、1、2】,默认为1 0: 不加载权重 1:加载权重不加载优化器状态【增量训练】 2:加载权重且加载优化器状态【 断点续训】详见断点续训和故障快恢说明 USER_CONVERTED_CKPT_PATH
kers 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_id 是 String 标注团队ID。 表2 Query参数 参数 是否必选 参数类型 描述 limit 否 Integer
并选中,“操作”中查找写操作“modelarts:trainJob:create”、“modelarts:notebook:create”和“modelarts:service:create”并选中。“所有资源”选择“默认值”。“请求条件”中单击“添加条件”,设置“条件键”为“m
该场景一般用于将预训练、SFT或LoRA训练好的Megatron模型重新转回HuggingFace格式。 本章节以Llama2-70B为例,对于Llama2-7B和Llama2-13B,操作过程与Llama2-70B相同,只需修改对应参数即可。 一般训练都是多卡分布式训练,权重结果文件为多个且文件为Me
pi/log/” 用于存储训练日志文件。 Step2 准备脚本文件并上传至OBS中 准备本案例所需的MPI启动脚本run_mpi.sh文件和训练脚本mpi-verification.py文件,并上传至OBS桶的“obs://test-modelarts/mpi/demo-code/”文件夹下。
dependency结构数组 运行代码及模型需安装的包。 model_metrics String 模型评测参数,仅当source_job_id和source_job_version有值且对应的训练作业有评测结果时会返回该结果。 apis String 模型所有的apis入参出参信息。
支持按照检索参数查询服务列表,返回满足检索条件的服务list,检索参数如表1所示。 在查询列表时,返回list的同时,默认会打印模型列表的详细信息,如表2和表3所示。 表1 查询检索参数说明 参数 是否必选 参数类型 描述 session 是 Object 会话对象,初始化方法见Session鉴权。