检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
model_name_or_path /home/ma-user/ws/tokenizers/Qwen2-72B 必须修改。加载tokenizer与Hugging Face权重时,对应的存放绝对或相对路径。请根据实际规划修改。 do_train true 指示脚本执行训练步骤,用来控制是
更新API授权 更新API的授权关系。 解除API对APP的授权 解除指定的API对APP的授权。 获取API授权关系列表 获取指定的API与APP授权关系列表。 服务管理接口 表12 服务管理接口 API 说明 部署服务 部署服务。 查询服务列表 查询服务列表。 查询服务详情 查询服务详情,根据服务ID查询服务详情。
像仓库。 如果容器引擎客户端机器为云上的ECS或CCE节点,根据机器所在区域有两种网络链路可以选择: 如果机器与容器镜像仓库在同一区域,则上传镜像走内网链路。 如果机器与容器镜像仓库不在同一区域,则上传镜像走公网链路,机器需要绑定弹性公网IP。 使用客户端上传镜像,镜像的每个layer大小不能大于10G。
dataset_version 否 String 数据集版本(用于区分标注任务解耦前的数据集和解耦后的数据集)。可选值如下: v1:数据集与标注任务解耦前的数据集(默认值) v2:数据集与标注任务解耦后的数据集 all:所有数据集 请求参数 无 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型
zip文件上传到容器的/home/ma-user目录下。获取路径参见获取软件和镜像。 解压AscendCloud-AIGC-*.zip文件,解压后将里面指定文件与对应CogVideo文件进行替换,执行以下命令即可。 cd /home/ma-user unzip AscendCloud-AIGC-*.zip
制台实际显示为准。 RoCE网络 当前使用A系列GPU时,进行分布式训练为了将硬件上的RoCE网卡使用起来,需要配置RoCE网络。 该参数与所选规格有关,若未选中规格或规格不支持RoCE网络,则不显示。 若规格支持RoCE网络但未创建过,单击“新建RoCE网络”即可完成创建。 若
ModelArts不支持加密的OBS桶,创建OBS桶时,请勿开启桶加密。 由于训练作业运行需消耗资源,为了避免训练失败请确保账户未欠费。 确保使用的OBS目录与ModelArts在同一区域。 检查是否配置了访问授权。如果未配置,请参见配置ModelArts Standard访问授权完成操作。 已经准备好训练算法,具体操作请参见创建算法。
400 ModelArts.2846 TrainingExperimentTypeMismatch 训练作业的类型(%s)与训练实验的类型(%s)不匹配 请选择与训练作业类型一致的训练实验。 400 ModelArts.2847 IEFNodeUnavailable 边缘节点(%s)
zip文件上传到容器的/home/ma-user目录下。获取路径参见表2。 解压AscendCloud-AIGC-*.zip文件,解压后将里面指定文件与对应MiniCPM-V文件进行替换。 cd /home/ma-user unzip AscendCloud-AIGC-*.zip -d ./AscendCloud
如下信息。 图5 服务端返回信息 带controlnet运行,默认使用canny。 图6 带controlnet运行 可以观察到输出的图片与canny输入图片很相近,坐姿和样子比较符合,如下图所示。 图7 文生图 使用后台API调用文生图接口。 curl -kv -X POST
自定义监控指标上报到AOM 用户有一些自定义的指标数据需要保存到AOM,ModelArts提供了命令方式将用户的自定义指标上报保存到AOM。 约束与限制 ModelArts以10秒/次的频率调用自定义配置中提供的命令或http接口获取指标数据。 自定义配置中提供的命令或http接口返回的指标数据文本不能大于8KB。
/home/ma-user/work/models/official/cv/resnet/requirements.txt 图5 执行命令 云端调试与运行。 打开训练文件。文件所在路径为“/home/ma-user/work/models/official/cv/resnet/train.py”
像仓库。 如果容器引擎客户端机器为云上的ECS或CCE节点,根据机器所在区域有两种网络链路可以选择: 如果机器与容器镜像仓库在同一区域,则上传镜像走内网链路。 如果机器与容器镜像仓库不在同一区域,则上传镜像走公网链路,机器需要绑定弹性公网IP。 使用客户端上传镜像,镜像的每个layer大小不能大于10G。
String 否 自定义镜像路径,格式为:组织名/镜像名:镜像版本。当用户设置“feature”为“custom”时,该参数生效。用户可通过与“feature”参数配合使用,指定作业运行使用自定义的Spark镜像。 -obs / --obs-bucket String 否 保存Sp
add_argument('--custom_data', default='true') 然后直接运行代码示例“main.py”即可,创建训练作业的参数与上图相同。 2、为什么DDP可以不输入主节点ip? “parser.add_argument('--init_method', default=None
是否呈现独立的可视化节点 否 bool,默认为True 对于输出的metrics文件,数据内容必须为标准的json数据,大小限制为1M,并且与当前支持的几种数据格式保持一致: 键值对类型的数据 [ { "key": "loss", "title":
ModelArts job”。算法依赖的是id为3f5d6706-7b67-408d-8ba0-ec08048c45ed的算法,该算法未定义inputs与outputs,规格选用的是gpu免费规格。 POST https://endpoint/v2/{project_id}/training-jobs