检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
文本对话 功能介绍 基于文本对话功能,用户可以与模型进行自然而流畅的对话和交流。 URI 获取URI方式请参见请求URI。 请求参数 使用Token认证方式的请求Header参数见表1。 表1 请求Header参数(Token认证) 参数 是否必选 参数类型 描述 X-Auth-Token
Boolean 是否开启返回体内容审核(默认不开启)。 有文本内容,则对文本进行内容审核; 有图片内容,则会对图片进行内容审核。 响应参数 状态码: 200 表7 响应Body参数 参数 参数类型 描述 id String 文本对话唯一标识符。 choices Array of choices
参见数据集操作。 数据集页面 “数据集”页面包含了左侧数据目录区域和右侧数据集详情区域。在左侧区域中,可以新建数据集、导入数据集的数据集实例、删除数据。在右侧区域,可以通过列表的形式查看数据详情、对数据执行特征工程、基于数据新建特征工程、跳转模型训练界面、删除数据。“数据集”页面
配比文本类数据集 数据配比是将多个数据集按照特定比例关系组合并发布为“发布数据集”的过程,确保数据的多样性、平衡性和代表性。 如果单个数据集已满足您的需求,可跳过此章节至流通文本类数据集。 创建文本类数据集配比任务 创建文本类数据集配比任务步骤如下: 登录ModelArts St
合成文本类数据集 当前,数据合成功能支持合成单轮问答、单轮问答(人设)类型的数据。 创建文本类数据集合成任务 合成文本类数据集任务前,请先完成数据导入操作,具体步骤请参见导入数据至盘古平台。 创建文本类数据集合成任务步骤如下: 登录ModelArts Studio大模型开发平台,在“我的空间”模块,单击进入所需空间。
在“创建流通任务”页面,选择数据集模态,如“文本 > 预训练文本”类型的数据集。 图1 选择数据集模态 选择数据集,单击“下一步”。 在“格式配置”选择发布格式。由于数据工程需要支持对接盘古大模型或三方大模型,为了使这些数据集能够被这些大模型正常训练,平台支持发布不同格式的数据集。 当前支持默认格式、盘古格式:
评估标准创建完成后可以在“人工评估标准”页面查看创建的评估标准,并支持编辑与删除操作。 创建文本类数据集评估任务 平台仅支持对“加工数据集”执行评估操作。 创建文本类数据集评估任务前,请参考加工文本类数据集,生成一个“加工数据集”。 创建文本类数据集评估任务步骤如下: 登录ModelArts Studio大模型
支持问答调测,点对点的监测智能应答过程。 支持领域知识挖掘,提供易用的标注工具挖掘领域词。 全面的对话管理 支持自然语言多能力融合,智能对话中控。 灵活的知识库管理,支持对知识的批量操作。 支持嵌入多轮对话技能,满足复杂的任务型对话场景。 高效训练部署 基于modelarts的底层算法能力,提供更快的模型训练、部署能力。
秘密及以上的数据集,并且该数据集的“本租户内是否免审批”选择值为“是”时。 批量立即订阅 将需要订阅的数据集加入购物车。 在数据集服务首页需要订阅的数据集右侧的右侧,单击“批量订阅”,在“确认”对话框单击“确认”。 在数据集服务首页单击需要订阅的数据集名称,在“数据集详情”界面右
清洗文本类数据集 清洗文本类数据集任务前,请先完成数据导入操作,具体步骤请参见导入数据至盘古平台。 创建文本类数据集清洗任务步骤如下: 登录ModelArts Studio大模型开发平台,在“我的空间”模块,单击进入所需空间。 在左侧导航栏中选择“数据工程 > 数据加工 > 数据
标注文本类数据集 创建文本类数据集标注任务 标注文本类数据集任务前,请先完成数据导入操作,具体步骤请参见导入数据至盘古平台。 创建文本类数据集标注任务步骤如下: 登录ModelArts Studio大模型开发平台,在“我的空间”模块,单击进入所需空间。 在左侧导航栏中选择“数据工程
文本类数据集格式要求 ModelArts Studio大模型开发平台支持创建文本类数据集,创建时可导入多种形式的数据,具体格式要求详见表1。 表1 文本类数据集格式要求 文件内容 文件格式 文件要求 文档 txt、mobi、epub、docx、pdf 编码格式为UTF-8,单个文
对话机器人SDK简介 对话机器人概述 对话机器人服务(Conversational Bot Service) 是一款基于人工智能技术,针对企业应用场景开发的云服务,主要包括智能问答机器人功能。智能问答机器人旨在帮助企业快速构建,发布和管理基于知识库的智能问答系统。 对话机器人服务端SDK是对服务提供的REST
加工文本类数据集 清洗文本类数据集 合成文本类数据集 标注文本类数据集 父主题: 加工数据集
数据集成概述 DataArts Studio数据集成是一种高效、易用的数据集成服务,围绕大数据迁移上云和智能数据湖解决方案,提供了简单易用的迁移能力和多种数据源到数据湖的集成能力,降低了客户数据源迁移和集成的复杂性,有效的提高您数据迁移和集成的效率。 数据集成即云数据迁移(Cloud
发布文本类数据集 评估文本类数据集 配比文本类数据集 流通文本类数据集 父主题: 发布数据集
后仅个人可以在已订阅数据集页面查看到该数据集,并可以下载。 租户管理员以租户粒度订阅选择“租户订阅”,成功订阅后,如果该租户内的成员对该数据集有可视权限,即可在已订阅数据集页面查看到该数据集,并可以下载。 必选。 请选择需要订阅数据集 对已加入购物车的数据集进行选择性的订阅。 在下拉框中进行选择。
在数据集服务首页,单击“新数据集”。在弹出界面,单击。 在“数据集发布”界面上,在左侧“选择数据集”下,单击展开数据目录,可以查看到全部的数据集信息,勾选需要发布的数据集前面的复选框,右侧“待发布数据集信息”中会列出所有选中的数据集及其目录。 也可以在目录树右上角的搜索框中搜索数据集的名称或是数据集的目录名称,快速查找到需要发布的数据集。
或直接删除敏感信息。 中文简繁转换 将中文简体和中文繁体进行转换。 符号标准化 查找文本中携带的非标准化符号进行标准化、统一化转换。 统一空格:将所有Unicode空格(如U+00A0、U+200A)转换为标准空格(U+0020)。 全角转半角:将文本中的全角字符转换为半角字符。
数据集成 数据集成普通任务 数据集成组合任务