检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
据集保存路径+数据集名称(例如:moss-003-sft-data)。 --tokenizer-type:tokenizer的类型,可选项有['BertWordPieceLowerCase','BertWordPieceCase','GPT2BPETokenizer','Pret
数据集保存路径+数据集名称(例如:alpaca_gpt4_data)。 --tokenizer-type:tokenizer的类型,可选项有['BertWordPieceLowerCase','BertWordPieceCase','GPT2BPETokenizer','Pret
授权用户列表,默认为空。需要与“auth_type”参数配合使用,且仅当授权类型为“INTERNAL”时才会生效。 auth_type 否 String 授权类型。可选值有PUBLIC、PRIVATE、INTERNAL。默认值为PUBLIC。 PUBLIC:租户内部公开访问。 PRIVATE:仅创建者和主账号可访问。
True:训练数据保存在notebook中,由local_path指定。 obs_path:obs地址。根据is_local_source值的变化,有不同的含义。 is_local_source=False,此时是必选参数,代表训练数据位置,支持文件夹和压缩文件。 is_local_sou
建议迭代1~2个epoch。 总Iterations = 整个数据集完整训练需要的Iterations * epoch。例如,当一个数据集有3200条数据,完整训练一个数据集的Iterations为100,迭代2个epoch,总Iterations就是200。 取值范围:0~100000
String 此规格应用于模型的类型,取值为空或auto,默认为空,代表是用户自己产生的模型;取值为auto时,代表是自动学习训练的模型,计费方式有差别。 is_free Boolean 当前规格是否是免费规格,“true”表示是免费规格。 over_quota Boolean 当前规格
“ATLEAST”表示安装版本不小于给定版本。 “ATMOST”表示安装包版本不大于给定版本。 说明: 如果对版本有明确要求,优先使用“EXACT”;如果使用“EXACT”与系统安装包有冲突,可以选择“ATLEAST” 如果对版本没有明确要求,推荐不填写“restraint”、“packa
提供了简洁易用的管理控制台,包含自动学习、数据管理、开发环境、模型训练、模型管理、部署上线等端到端的AI开发工具链,实现AI全流程生命周期管理。 面向有AI开发平台诉求的用户。 ModelArts用户指南(Standard) ModelArts Studio 大模型即服务平台(后续简称为MaaS服务)
使用 nerdctl 工具进行镜像拉取。 nerdctl --namespace k8s.io pull {image_url} 注意:集群有多个节点,要确保每个节点都拥有镜像。 镜像获取完成后可通过如下其中一个命令进行查看: # ctr 工具查看 ctr -n k8s.io image
训练作业的数据集版本ID。应与dataset_id同时出现,但不可与data_url同时出现。 type 否 String 数据集类型。可选值有“obs”、“dataset”。obs与dataset不可同时出现。 data_url 否 String OBS的桶路径,不可与datase
"role": "assistant", "content": "你好!很高兴能为你提供帮助。有什么问题我可以回答或帮你解决吗?" }, "logprobs": null,
er_lite命令式通过--configFile参数指定配置文件路径,配置文件通过precision_mode参数指定精度模式。可选的参数有“enforce_fp32”,“preferred_fp32”,“enforce_fp16”,“enforce_origin”或者“pref
U(Ascend)硬件由于存在一定细小的差别,很难确保完全一致,较难达成生成图片100%匹配,建议通过盲测的方式对效果进行验证。 模型精度有问题怎么办? 首先考虑通过FP16的方式进行转换和执行,再通过精度诊断工具来进行分析,更进一步可以到华为云官网上提交工单处理。 模型转换失败时如何查看日志和定位原因?
多个属性值之间的关系。可选值如下: AND:与关系 OR:或关系 props 否 Map<String,Array<String>> 属性的搜索条件,可以有多个属性条件。 响应参数 状态码: 200 表8 响应Body参数 参数 参数类型 描述 create_time Long 任务创建时间。 error_code
在线服务的简要说明。 填写资源池和AI应用配置等关键信息,详情请参见表2。 表2 参数说明 参数名称 子参数 说明 “资源池” “公共资源池” 公共资源池有CPU或GPU两种规格,不同规格的资源池,其收费标准不同,详情请参见价格详情说明。当前仅支持按需付费模式。 “专属资源池” 在专属资源池规格
菜单栏中,选择“ModelArts >Training Job > Stop ”停止训练作业。 图6 停止作业 查看训练日志 查看训练日志有2种方式,在OBS查看和在PyCharm ToolKit工具中查看。 在OBS查看训练日志 提交训练作业时,系统将自动在您配置的OBS Pa
格式转换为,json 格式。可使用代码中提供的 scripts/tools/ExcelToJson.py 工具,其转换的要求为: 本脚本可以处理的格式有:.xls .xlsx .csv .xlsb .xlsm .xlst MOSS 数据集的 Excel 中需要有三个列名称:conversation_id
格式转换为,json 格式。可使用代码中提供的 scripts/tools/ExcelToJson.py 工具,其转换的要求为: 本脚本可以处理的格式有:.xls .xlsx .csv .xlsb .xlsm .xlst MOSS 数据集的 Excel 中需要有三个列名称:conversation_id
的策略更新,从而减少了训练过程中的不稳定性和样本复杂性。 指令监督式微调(Self-training Fine-tuning):是一种利用有标签数据进行模型训练的方法。 它基于一个预先训练好的模型,通过调整模型的参数,使其能够更好地拟合特定任务的数据分布。 与从头开始训练模型相比
数据类型。可选值如下: 0:OBS桶(默认值) 5:AI Gallery下载数据集 path 是 String 数据源所在路径。 字符限制:不允许出现的特殊字符有换行符(\n)、回车符(\r)、制表符(\t)。 content_info 否 表3 从AI Gallery下载数据集时数据集资产的信息。 annotation_config