检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
训练作业结束后,其生成的模型存储在OBS中。 部署上线 ModelArts将存储在OBS中的模型部署上线为在线服务。 Standard AI全流程开发 数据管理 数据集存储在OBS中。 数据集的标注信息存储在OBS中。 支持从OBS中导入数据。 开发环境 Notebook实例中的数据或代码文件可以存储在OBS中。
发布和管理AI Gallery项目 在AI Gallery中,您可以将个人开发的Notebook代码免费分享给他人使用。 前提条件 在ModelArts的Notebook或者CodeLab中已创建好ipynb文件,开发指导可参见开发工具。 发布Notebook 登录ModelArts管理控制台,选择“开发环境
查询数据集导入任务的详情 功能介绍 查询数据集导入任务的详情。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datase
labels与input_ids对应,用-100替换user_ids的token,只保留assistant_ids attention_mask是和input_ids等长的全1序列 返回input_ids\attention_mask\labels的字典 处理完单一sample 注:labels中用-100填充的
labels与input_ids对应,用-100替换user_ids的token,只保留assistant_ids attention_mask是和input_ids等长的全1序列 返回input_ids\attention_mask\labels的字典 处理完单一sample 注:labels中用-100填充的
SFT全参微调训练 前提条件 已上传训练代码、训练权重文件和数据集到OBS中,具体参考代码上传至OBS。 Step1 创建训练任务 创建训练作业,并自定义名称、描述等信息。选择自定义算法,启动方式自定义,以及选择上传的镜像。 代码目录选择:OBS桶路径下的 llm_train/AscendSpeed
labels与input_ids对应,用-100替换user_ids的token,只保留assistant_ids attention_mask是和input_ids等长的全1序列 返回input_ids\attention_mask\labels的字典 处理完单一sample 注:labels中用-100填充的
labels与input_ids对应,用-100替换user_ids的token,只保留assistant_ids attention_mask是和input_ids等长的全1序列 返回input_ids\attention_mask\labels的字典 处理完单一sample 注:labels中用-100填充的
SFT全参微调训练任务 Step1 上传训练权重文件和数据集 如果在准备代码和数据阶段已经上传权重文件和数据集到容器中,可以忽略此步骤。 如果未上传训练权重文件和数据集到容器中,具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。
查询数据集导入任务列表 功能介绍 分页查询数据集导入任务列表。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datase
labels与input_ids对应,用-100替换user_ids的token,只保留assistant_ids attention_mask是和input_ids等长的全1序列 返回input_ids\attention_mask\labels的字典 处理完单一sample 注:labels中用-100填充的
labels与input_ids对应,用-100替换user_ids的token,只保留assistant_ids attention_mask是和input_ids等长的全1序列 返回input_ids\attention_mask\labels的字典 处理完单一sample 注:labels中用-100填充的
SFT全参微调训练 前提条件 已上传训练代码、训练权重文件和数据集到OBS中,具体参考代码上传至OBS。 Step1 创建训练任务 创建训练作业,并自定义名称、描述等信息。选择自定义算法,启动方式自定义,以及选择上传的镜像。 代码目录选择:OBS桶路径下的llm_train/AscendSpeed代码目录。
准备代码 本教程中用到的训练推理代码和如下表所示,请提前准备好。 获取模型软件包和权重文件 本方案支持的模型对应的软件和依赖包获取地址如表1所示,模型列表、对应的开源权重获取地址如表2所示。 表1 模型对应的软件包和依赖包获取地址 代码包名称 代码说明 下载地址 AscendCloud-6
超参的说明,不能超过20个字符。 { "training_methods": [ { "name": "全参微调", "hyperparameters": [ {
GPU裸金属服务器无法Ping通如何解决 问题现象 在华为云使用GPU裸金属服务器时, 服务器绑定EIP(华为云弹性IP服务)后,出现无法ping通弹性公网IP现象。 原因分析 查看当前GPU裸金属服务器的安全组的入方向规则的配置,发现仅开通了TCP协议的22端口。 ping命令
查看训练作业资源占用情况 约束限制 训练作业的资源占用情况系统会自动保存30天,过期会被清除。 如何查看训练作业资源使用详情 在ModelArts管理控制台的左侧导航栏中选择“模型训练 > 训练作业”。 在训练作业列表中,单击作业名称进入训练作业详情页面。 在训练作业详情页面,单
labels与input_ids对应,用-100替换user_ids的token,只保留assistant_ids attention_mask是和input_ids等长的全1序列 返回input_ids\attention_mask\labels的字典 处理完单一sample 注:labels中用-100填充的
labels与input_ids对应,用-100替换user_ids的token,只保留assistant_ids attention_mask是和input_ids等长的全1序列 返回input_ids\attention_mask\labels的字典 处理完单一sample 注:labels中用-100填充的
labels与input_ids对应,用-100替换user_ids的token,只保留assistant_ids attention_mask是和input_ids等长的全1序列 返回input_ids\attention_mask\labels的字典 处理完单一sample 注:labels中用-100填充的