检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
已部署服务:选择部署至ModelArts Studio平台的模型进行评测。 外部服务:通过API的方式接入外部模型进行评测。选择外部服务时,需要填写外部模型的接口名称、接口地址、请求体、响应体等信息。 请求体支持openai、tgi、自定义三种格式。openai格式即是由OpenAI公司开发并标准化的一种大模型请求格式;tgi格式即是Hugging
训练科学计算大模型训练数据要求所需数据量 构建科学计算大模型进行训练的数据要求见表1。 表1 科学计算大模型训练数据要求 模型类别 特征要求 水平分辨率要求 区域范围要求 时间要求 数据获取方式 气象/降水模型 需包含4个表面层特征(10m u风、10m v风、2米温度、海平面气压),13高空层次(10
农业 科学计算大模型包括全球中期天气要素模型和降水模型,可以对未来一段时间的天气和降水进行预测,全球中期天气要素模型和降水模型能够在全球范围内进行预测,不仅仅局限于某个地区。它的分辨率相当于赤道附近每个点约25公里x25公里的空间。通过降水模型预测未来的降雨情况,农民和农业管理
起报时间区间终点(YYYYMMDDHH时间戳)。 start_time_interval_hours 否 Long 起报时间间隔小时数,默认6。取值范围:[1, 24]。 forecast_lead_hours 否 Long 预报未来小时数,默认168。如需预报未来30天,可将此参数设置成720。
64编码)。 数据过滤 图片元数据过滤 基于图片存储大小、宽高比属性进行图片/图文数据清洗。 图文文本长度过滤 过滤文本长度不在“文本长度范围”内的图文对。一个中文汉字或一个英文字母,文本长度均计数为1。 图文文本语言过滤 通过语种识别模型得到图文对的文本语种类型,“待保留语种”之外的图文对数据将被过滤。
请参考《API文档》检查请求参数中输入的token数值是否不在范围内,并重新调试API。 PANGU.3318 tolal ContentLength Illegal. Content长度不合法 请参考《API文档》检查请求参数中输入的Content参数长度是否不在范围内,并重新调试API。 PANGU.3319
获取Token。参考《API参考》文档“如何调用REST API认证鉴权”章节获取Token。 在Postman中新建POST请求,并填入调用路径(API请求地址)。 参考图8填写2个请求Header参数。 参数名为Content-Type,参数值为application/json。 参数名为X-A
去除重复数据:确保数据集中每条数据的唯一性。 填补缺失值:填充数据中的缺失部分,常用方法包括均值填充、中位数填充或删除缺失数据。 数据标准化:将数据转换为统一的格式或范围,特别是在处理数值型数据时(如归一化或标准化)。 去噪处理:去除无关或异常值,减少对模型训练的干扰。 数据预处理的目的是保证数据集的质量,
译文本),from(目标原语言),to(翻译目标语言)。目标数据未提供或者有歧义(如存在多个)的变量请保证取值为空\'\'。from的取值范围为ar、de、ru、fr、ko、pt、ja、th、es、en、vi、zh、auto。ar为阿拉伯语,de为德语,ru为俄语,fr为法语,k
自定义:自定义大模型输出的温度和核采样值,生成符合预期的输出。 温度 调高温度会使得模型的输出更多样性和创新性,反之,降低温度会使输出内容更加遵循指令要求但减少多样性,取值范围为0到1之间。 调高温度,会使得模型的输出更多样性和创新性。 降低温度,会使输出内容更加遵循指令要求但减少多样性。 在基于事实的问答场景,
训练指标介绍请参见表2。 表2 训练指标说明 模型 训练指标 指标说明 预测大模型 拟合度 拟合度是一种衡量模型对数据拟合程度的指标。数值范围为0到1,数值越接近1,表示模型对数据的拟合程度越好。 均方根误差 均方根误差是预测值与真实值之间差异的平方和的均值的平方根。它用于衡量模
合规,按照相关规定经审批后使用并保存票据。同时,应实行专款专用、监管有力的制度,并加强对专项资金的监督和管理。严格控制专项资金的流向和使用范围,严禁有过度功能的行为,坚决杜绝虚假、虚报和恶意投资,建立完善的监督管理制度,加强随时的监督和核查,确保专项资金使用的规范化、严格化、透明
需要较小的学习率和较小的批量大小,防止内存溢出。 这里提供了一些微调参数的建议值和说明,供您参考: 表1 微调参数的建议和说明 训练参数 范围 建议值 说明 训练轮数(epoch) 1~50 2/4/8/10 训练轮数是指需要完成全量训练数据集训练的次数。训练轮数越大,模型学习数
当前,平台支持的推理参数包括:温度、核采样以及话题重复度控制,如下提供了这些推理参数的建议值和说明,供您参考: 表1 推理参数的建议和说明 推理参数 范围 建议值 说明 温度(temperature) 0~1 0.3 温度主要用于控制模型输出的随机性和创造性。温度越高,输出的随机性和创造性越
的服务。 通过微调技术,盘古大模型能够在保持原有优势的同时,融入新领域的特征和规律,实现对新任务的快速适应。这种能力极大地扩展了模型的应用范围,使其在更广泛的业务场景中发挥作用,为用户提供更加全面和深入的智能服务。
4K版本:4096 32K版本:32768 评测NLP大模型所需数据量 要求所有文本大小最大不超过100MB,目录下文件数量最多不超过100个。数据条数范围为:3-1000条。 构建NLP大模型数据集流程 在ModelArts Studio大模型开发平台中,使用数据工程构建盘古NLP大模型数据集流程见表3。
用于衡量预报系统的质量。它通过计算预报值与观测值之间的相关性来评估预报的准确性。ACC的计算涉及到预报值、观测值和气候平均值的差异,其值范围从-1到+1,值越接近+1表示预报与观测的一致性越好,值为0表示没有相关性,而负值则表示反向相关。 RQE 衡量预测值与真实值之间差距的指
allery”,对数据资产进行发布。 在“发布到AI Gallery”页面填写AI Gallery资产名称与描述,选择可订阅区域约束与可看范围,单击“确定”,发布数据资产至AI Gallery。 数据资产列表页将显示发布数据资产的状态: 如果状态为“发布中”,表示该资产正在同步至AI
difficult:必选字段,取值0或1,表示标注目标是否难以识别(0表示容易识别、1表示难易识别)。 confidence:可选字段,标注目标的置信度,取值范围0-1之间,越接近1,表示标注越可信。 bndbox:必选字段,标注框的类型,可选值请参见表3。 表3 标注框类型描述 type 形状 标注信息
发该错误码。 可检查后处理护栏代码。 101050 执行默认护栏(时间参数解析)失败时触发该错误码。 可检查支持处理的时间类型是否超出支持范围。 102053 提示词模板有误时触发该错误码。 检查提示词模板是否格式有误。 103004 大模型推理失败时触发该错误码。 请检查模型服务是否可以正常运行。