检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在“数据文件”页签可下载加工后的数据文件,可以与原始数据进行比对,查看加工前后的差异。 在“数据血缘”页签查看该数据集所经历的操作,如加工、发布操作。 上线后的加工数据集不支持编辑和删除操作。若执行该操作,需将数据集下线。 若上线后的加工数据集已执行发布操作发布数据集,则不可将该加工数据集下线。
在“数据文件”页签可下载加工后的数据文件,可以与原始数据进行比对,查看加工前后的差异。 在“数据血缘”页签查看该数据集所经历的操作,如加工、发布操作。 上线后的加工数据集不支持编辑和删除操作。若执行该操作,需将数据集下线。 若上线后的加工数据集已执行发布操作发布数据集,则不可将该加工数据集下线。
在“数据文件”页签可下载加工后的数据文件,可以与原始数据进行比对,查看加工前后的差异。 在“数据血缘”页签查看该数据集所经历的操作,如加工、发布操作。 上线后的加工数据集不支持编辑和删除操作。若执行该操作,需将数据集下线。 若上线后的加工数据集已执行发布操作发布数据集,则不可将该加工数据集下线。
数据过滤阶段可以设置多种过滤属性,对视频数据集进行筛选。例如,过滤掉数据集中低于360分辨率的视频。 如不需要进行数据过滤可直接单击“下一步”跳过该操作。 图3 数据过滤 当前视频类数据集仅支持发布默认格式,选择好数据集的发布格式后,单击“下一步”。 设置数据集的“资产可见性”,填写数据
project_id 是 String 项目ID,获取方法请参见获取项目ID。 deployment_id 是 String 模型的部署ID,获取方法请参见获取模型部署ID。 请求参数 使用Token认证方式的请求Header参数见表2。 表2 请求Header参数(Token认证) 参数
可以通过在提示词中引导模型输出思考过程,或者在模型输出后追问模型,帮助我们分析错误的根因。例如: “我注意到你犯了xxx的错误,请解释得出该结论的原因。” 通过模型的解释,我们可以推测错误的原因,并在提示词中进行相应的调整,从而规避类似错误。 父主题: 提示词工程类
Studio大模型开发平台,进入所需空间。 在左侧导航栏中选择“Agent 开发 > 提示词工程 > 提示词开发”。 在工程任务列表页面,找到所需要操作的工程任务,单击该工程任务右侧“撰写”。 图1 提示词工程 在提示词撰写区域,单击“设为候选”,将当前撰写的提示词设置为候选提示词。 候选状态的提示词将保存至左侧导航栏的“候选”中。
练任务。 克隆。单击操作列的“更多 > 克隆”,可以复制当前训练任务。 重试。单击操作列的“更多 > 重试”,可以编辑运行失败的节点,重试该节点的训练。 删除。单击操作列的“更多 > 删除”,可以删除当前不需要的训练任务。 父主题: 训练NLP大模型
练任务。 克隆。单击操作列的“更多 > 克隆”,可以复制当前训练任务。 重试。单击操作列的“更多 > 重试”,可以编辑运行失败的节点,重试该节点的训练。 删除。单击操作列的“更多 > 删除”,可以删除当前不需要的训练任务。 父主题: 训练科学计算大模型
新发布和删除操作。 发布后的数据集会作为当前空间的数据资产同步显示在“空间资产 > 数据”页面。单击数据集名称,可以在“数据血缘”页签查看该数据集所经历的操作,如加工、发布操作。 父主题: 发布数据集
新发布和删除操作。 发布后的数据集会作为当前空间的数据资产同步显示在“空间资产 > 数据”页面。单击数据集名称,可以在“数据血缘”页签查看该数据集所经历的操作,如加工、发布操作。 父主题: 发布数据集
新发布和删除操作。 发布后的数据集会作为当前空间的数据资产同步显示在“空间资产 > 数据”页面。单击数据集名称,可以在“数据血缘”页签查看该数据集所经历的操作,如加工、发布操作。 父主题: 发布数据集
示例如下: 图1 Loss曲线 通过观察,该Loss曲线随着迭代步数的增加呈下降趋势直至稳定,证明整个训练状态是正常的。若Loss曲线呈现轻微阶梯式下降,为正常现象。 模型持续优化: 本场景采用了下表中的推理参数进行解码,您可以在平台部署后参考如下参数调试: 表3 推理核心参数设置
此版本是2024年10月发布的十亿级模型版本,支持128K序列长度在线推理。基于Snt9B3卡支持8卡推理部署,此模型版本仅支持预置模型版本,不支持SFT后模型版本做128K序列长度推理部署。 Pangu-NLP-N2-Base-20241030 - 此版本是2024年10月发布的百亿级
Studio大模型开发平台,进入所需空间。 在左侧导航栏中选择“Agent 开发 > 提示词工程 > 提示词开发”。 在工程任务列表页面,找到所需要操作的工程任务,单击该工程任务右侧“撰写”。 图1 提示词工程 在提示词撰写区域输入提示词文本,可以插入若干个变量,变量需要使用占位符{{ }}标识。 图2 撰写提示词
附录 状态码 错误码 获取项目ID 获取模型部署ID
开发盘古NLP大模型 使用数据工程构建NLP大模型数据集 训练NLP大模型 压缩NLP大模型 部署NLP大模型 调用NLP大模型
开发盘古科学计算大模型 使用数据工程构建科学计算大模型数据集 训练科学计算大模型 部署科学计算大模型 调用科学计算大模型
project_id 是 String 项目ID,获取方法请参见获取项目ID。 deployment_id 是 String 模型的部署ID,获取方法请参见获取模型部署ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。
算子分类 算子名称 算子描述 数据提取 镜头拆分 根据视频中的镜头场景变化将长视频拆分为短视频片段,如果某个镜头片段的长度超过设定的时间阈值,该镜头片段将按时长进行进一步拆分。 数据过滤 视频裁剪 裁剪视频中字幕/Logo/水印/黑框等无用信息,生成新视频。 视频元数据过滤 基于视频