检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
引用字段时,使用格式为“${字段}”,例如抽取基础数据中属性“name”的字段,在抽取函数中引用字段的格式为“trim(${name})”。 表1 信息抽取函数说明表 抽取函数 函数说明 抽取函数示例 抽取前数据示例 抽取后数据示例 trim(字段) 裁剪字段前后的空白字符 trim(${name})
射前后的相关字段。 基本概念 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图1所示。 图1 实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。
知识映射配置。 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 已完成信息抽取配置,详情请参见配置信息抽取。 操作步骤 在普通配置构建图谱页面,单击“知识映射”,页面下方弹出“知识映射”对话框,单击右侧按钮可以放大对话框。
pe”,即可查看到可抽取的主语、谓语、宾语组合。 图2 抽取模型 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 后续操作 配置信息抽取后,进入创建图谱的下一步操作配置知识映射。 父主题: 配置信息抽取
交互界面”,切换至“交互界面”页签,查看信息抽取前后的相关字段。 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 示例 以一个电影实体为例,抽取信息前后的实体信息如图2所示,代码示例如下所示: 图2 信息抽取 {
X-Project-ID:子项目ID,可选,在多项目场景中使用。 X-Domain-ID:账号ID。 对于获取用户Token接口,由于不需要认证,所以只添加“Content-Type”即可,添加消息头后的请求如下所示。 POST https://iam.cn-north-1.myhuaweicloud.com/v3/auth/tokens
的多种类型的元素。 上传元素配置文件到OBS 导入元素配置至知识图谱前,需要将元素配置文件(json格式)上传至OBS中,详情请参见OBS添加桶和OBS上传文件或文件夹。 导入元素配置至知识图谱 上传元素配置文件到OBS后,知识图谱控制台支持导入OBS中的元素配置文件。 登录KG
意图。 上传问答模板配置文件到OBS 导入问答模板配置至知识图谱前,需要将问答模板配置文件(json格式)上传至OBS中,详情请参见OBS添加桶和OBS上传文件或文件夹。 导入问答模板配置至知识图谱 上传问答模板配置文件到OBS后,知识图谱控制台支持导入OBS中的问答模板配置文件。
织待创建图谱的信息结构。 前提条件 已创建本体,具体创建方式见创建本体。 已创建图谱并选择图谱规格,请参见购买知识图谱。 已配置数据源,请参见配置数据源。 操作步骤 在普通配置构建图谱页面,单击“图谱本体”。 页面下方弹出图谱本体配置对话框,单击右侧按钮可以放大对话框。 选择左侧
样式。 属性 编辑当前概念的属性。所有概念都默认有一个属性为“name”,且默认属性类型为“single_string”。 添加属性 单击“添加属性”可添加属性文本框,在文本框中填写属性的“名称”,选择“单值/多值”、“类型”、“操作”。 “名称”:属性名称只能由大小写字母、数字、中文、下划线组成,长度为1-63位。
基于知识的问答系统建立大规模知识库,通过理解将用户的问题转化为对知识图谱的查询,提供用户所关心的问题答案。 图2 知识图谱与智能问答 大数据分析与决策 知识图谱通过语义链接帮助理解大数据,获得对大数据的洞察,提供决策支持,应用于各个行业,例如股票投研情报分析,通过抽取公司的股东、子公司、供应商、客户、合作伙
配置基本信息 配置问答模板(交互) 模板元素模板序列 添加问答模板包含的元素。 单击“添加元素”,在对话框中选择问答模板所包含的“元素类型”,例如“概念”,输入“概念名”。可添加多个元素,元素类型请见表1。 图3 添加元素 表1 添加元素 元素类型 字段说明 概念 配置问答模板中所包
南》。 与对象存储服务的关系 知识图谱服务使用对象存储服务(Object Storage Service,简称OBS)存储构建知识图谱的源数据,实现安全、高可靠和低成本的存储需求。OBS的更多信息请参见《对象存储服务控制台指南》。 父主题: 一般性问题
在发布数据集时,“版本格式”选择“Default”。 ModelArts发布的标注数据集是“.manifest”格式的文件,其中包含多行,每行是一个JSON格式的标注样例。 前提条件 准备训练数据并上传至OBS目录,详细步骤请参见准备训练数据,数据类型和要求请见训练数据类型介绍。
如果加密,请重新建一个不加密的OBS桶,即不要勾选“开启默认加密”。创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。 上传对象时不要勾选加密,OBS上传数据的详细操作请参见上传文件。 父主题: 创建图谱
南》。 与对象存储服务的关系 知识图谱服务使用对象存储服务(Object Storage Service,简称OBS)存储构建知识图谱的源数据,实现安全、高可靠和低成本的存储需求。OBS的更多信息请参见《对象存储服务控制台指南》。
对于已经创建的图谱版本,支持导出图谱版本至OBS桶。导出的图谱可以通过“全量更新 > 图谱导入”进行恢复。 导出的图谱版本包含以下信息: csv文件夹:存放csv源数据文件 ontology.json:图谱本体配置文件 pipeline_config.json:流水线配置文件 操作步骤 登录KG服务管理控制台,默认进入“我的图谱”页面。
pplication programming interface)管理方式。 管理控制台方式 KG服务提供了简洁易用的管理控制台,包含配置数据源、图谱本体、信息抽取、知识映射、知识融合、图谱质检等功能,您可以在管理控制台完成您的知识图谱创建与管理。 使用KG服务管理控制台,需先注
此仅适用于抽取基础数据格式为txt文本的自然语言短句。 自定义模型流程 自定义信息抽取模型的流程如表1所示。 表1 自定义信息抽取模型流程 流程 说明 操作指引 准备训练数据 提前准备用于训练模型的数据。 准备训练数据 创建模型 基于您的训练数据(即已标注数据),您可以在KG服务中创建信息抽取模型。
见表1。 图3 创建流程图 表1 创建流程表 流程 方法 说明 详细指导 配置数据源 - 数据是知识图谱的基础。 基于已存储在OBS中的基础数据,您可以从OBS导入用于构建知识图谱的基础数据。 配置数据源 配置图谱本体 - 您可以选择已在控制台创建的本体,或者选择从OBS导入的本体,用于组织待创建图谱的信息结构。