检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
可以发现错误回答的根因,并基于此修正提示词。 在反问时需要指明“上面的xxx”。例如:“为什么你认为上面的xxx是xxx类别?为什么上面的xxx不是xxx类别?”,否则模型会认为用户反问是个新问题,而非多轮并回复“您并没有给我xxx问题,请给我具体的xxx问题,以便我更好地解答。”
过滤文本长度不在“文本长度范围”内的图文对。一个中文汉字或一个英文字母,文本长度均计数为1。 图文文本语言过滤 通过语种识别模型得到图文对的文本语种类型,“待保留语种”之外的图文对数据将被过滤。 图文去重 基于结构化图片去重 判断相同文本对应不同的图片数据是否超过阈值,如果超过则去重。 数据转换
Explorer可根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explorer中具体API页面的“代码示例”页签查看对应编程语言类型的SDK代码。 图1 获取SDK代码示例 当您在中间填充栏填入对应内容时, 右侧代码示例会自动完成参数的组装。 图2 设置输入参数 填写输
标注管理”,单击页面右上角“创建标注任务”。 图2 标注管理 在“创建标注任务”页面选择需要标注的加工后的文本类数据集,并设置标注项。 设置标注项时,不同类型的数据文件对应的标注项也有所差异,可基于页面提示进行设置。 图3 创建标注任务 单击“下一步”设置标注人员及信息,单击“完成创建”。 分配
预报的不确定性,从而提高预报的准确性和可靠性。 集合成员数 用于选择生成预报的不同初始场的数量,取值为2~10。 扰动类型 用于选择生成集合预报初始场的扰动类型,包括perlin加噪和CNOP加噪两种方式。 Peilin噪音通过对输入数据(比如空间坐标)进行随机扰动,让模拟出的天气接近真实世界中的变化。
> 模型”页面,单击右上角的“导入模型”。 在“导入模型”页面,模型来源选择“盘古大模型”。输入模型对应的obs地址和模型名称、选择资源类型、输入资产描述并设置资产可见性后,单击“确定”,启动导入模型任务。 图4 导入模型 父主题: 管理盘古大模型空间资产
评估任务”。 单击操作列“报告”可以查看详细的质量评估报告。 图2 查看数据集评估报告 在“查看评估报告”页面,可以查看评估概览、通过率、评估类别分布等信息。 如果数据集未完成全部评估,可以单击右上角“继续评估”,评估剩余的数据。 图3 查看评估报告详情 父主题: 评估文本类数据集
评估任务”。 单击操作列“报告”可以查看详细的质量评估报告。 图2 查看数据集评估报告 在“查看评估报告”页面,可以查看评估概览、通过率、评估类别分布等信息。 如果数据集未完成全部评估,可以单击右上角“继续评估”,评估剩余的数据。 图3 查看评估报告详情 父主题: 评估图片类数据集
评估任务”。 单击操作列“报告”可以查看详细的质量评估报告。 图2 查看数据集评估报告 在“查看评估报告”页面,可以查看评估概览、通过率、评估类别分布等信息。 如果数据集未完成全部评估,可以单击右上角“继续评估”,评估剩余的数据。 图3 查看评估报告详情 父主题: 评估视频类数据集
评估任务”,单击右上角“创建评估任务”。 在“创建评估任务”页面,选择数据集,设置抽样规格,单击“下一步”。 图14 创建评估任务 根据数据集类型选择评估标准,此处选择“NLP数据质量标准V1.0”,单击“下一步”。 图15 选择评估标准 选择评估人员,单击“下一步”。填写“任务名称
在左侧导航栏中选择“模型开发 > 模型压缩”,单击界面右上角“创建压缩任务”。参考表1创建模型压缩任务。 表1 模型压缩任务参数说明 参数类别 参数名称 说明 压缩配置 压缩模型 选择需要进行压缩的模型,可使用来自资产的模型或任务的模型。 压缩策略 例如,可使用INT8压缩策略,
用。按需计费模式属于后付费模式,即费用根据服务实际消耗量计费,系统将每小时自动扣费。 盘古大模型的计费模式见表1。 表1 计费模式表 计费类别 计费项 计费模式 计费量纲 付费方式 计费周期 模型服务 模型订阅服务 包周期计费 套 预付费,按照订单的购买周期结算 3个月、1年 数据服务
估标准名称”和“描述”。 单击“下一步”,编辑评估项。 用户可以基于实际需求删减评估项,或创建自定义评估项。创建自定义评估项时,需要将评估类别、评估项、评估项说明填写清晰,填写时确保描述无歧义。 单击“完成创建”创建评估标准。评估标准创建完成后可以在“评估标准”页面查看创建的评估标准,并支持编辑、删除操作,如图3。
估标准名称”和“描述”。 单击“下一步”,编辑评估项。 用户可以基于实际需求删减评估项,或创建自定义评估项。创建自定义评估项时,需要将评估类别、评估项、评估项说明填写清晰,填写时确保描述无歧义。 单击“完成创建”创建评估标准。评估标准创建完成后可以在“评估标准”页面查看创建的评估标准,并支持编辑、删除操作。
估标准名称”和“描述”。 单击“下一步”,编辑评估项。 用户可以基于实际需求删减评估项,或创建自定义评估项。创建自定义评估项时,需要将评估类别、评估项、评估项说明填写清晰,填写时确保描述无歧义。 单击“完成创建”创建评估标准。评估标准创建完成后可以在“评估标准”页面查看创建的评估标准,并支持编辑、删除操作。
使用数据工程构建科学计算大模型数据集 科学计算大模型支持接入的数据集类型 盘古科学计算大模型仅支持接入气象类数据集,该数据集格式要求请参见气象类数据集格式要求。 构建科学计算大模型训练数据要求 构建科学计算大模型进行训练的数据要求见表1。 表1 科学计算大模型训练数据要求 模型类别 特征要求 水平分辨率要求 区域范围要求
显著加速大模型应用的开发流程,帮助企业快速应对复杂业务需求。 预置模型使用流程 ModelArts Studio大模型开发平台提供了不同类型的预置模型,包括NLP大模型和科学计算大模型。用户可将预置模型部署为预置服务,用于后续的调用操作。 其中,NLP预置模型使用流程见图1、表
回归分类数据:回归分类数据包含多种预测因子(特征),用于预测连续变量的值。数据集中的多个特征变量帮助预测目标变量,而目标变量为连续数值,非离散类别。与时序数据不同,回归分类数据不要求数据具有时间顺序。 具体格式要求详见表1。 表1 预测类数据集格式要求 文件内容 文件格式 文件样例 时序
了4万量级的sft数据,问答模块使用了6万量级的sft数据 ,包括单轮问答、多轮问答。中控模块使用了1万量级的sft数据。 针对不同的任务类型,所需数据量会所有不同。从经验上来说,对于简单的任务,数据量的要求会少一点,如3000到5000条;对于复杂的任务,需要的数据条数更大一些