检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
其中,“字段”表示基础数据中的字段名,在抽取函数中引用字段时,使用格式为“${字段}”,例如抽取基础数据中属性“name”的字段,在抽取函数中引用字段的格式为“trim(${name})”。
如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。
已配置数据源,请参见配置数据源。 操作步骤 在普通配置构建图谱页面,单击“图谱本体”。 页面下方弹出图谱本体配置对话框,单击右侧按钮可以放大对话框。 选择左侧“我的库”页签,在“图谱本体组件”中拖拽合适的本体到虚线框中,单击“保存”,完成本体选择。
基本概念 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图1所示。 图1 实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。
图2 知识图谱与智能问答 大数据分析与决策 知识图谱通过语义链接帮助理解大数据,获得对大数据的洞察,提供决策支持,应用于各个行业,例如股票投研情报分析,通过抽取公司的股东、子公司、供应商、客户、合作伙伴、竞争对手等信息构建公司的知识图谱,进而做更深层次的分析和更好的投资决策。
如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 后续操作 配置信息抽取后,进入创建图谱的下一步操作配置知识映射。 父主题: 配置信息抽取
与对象存储服务的关系 知识图谱服务使用对象存储服务(Object Storage Service,简称OBS)存储构建知识图谱的源数据,实现安全、高可靠和低成本的存储需求。OBS的更多信息请参见《对象存储服务控制台指南》。 父主题: 一般性问题
上传对象时不要勾选加密,OBS上传数据的详细操作请参见上传文件。 父主题: 创建图谱
与对象存储服务的关系 知识图谱服务使用对象存储服务(Object Storage Service,简称OBS)存储构建知识图谱的源数据,实现安全、高可靠和低成本的存储需求。OBS的更多信息请参见《对象存储服务控制台指南》。
导出的图谱版本包含以下信息: csv文件夹:存放csv源数据文件 ontology.json:图谱本体配置文件 pipeline_config.json:流水线配置文件 操作步骤 登录KG服务管理控制台,默认进入“我的图谱”页面。
图3 创建流程图 表1 创建流程表 流程 方法 说明 详细指导 配置数据源 - 数据是知识图谱的基础。 基于已存储在OBS中的基础数据,您可以从OBS导入用于构建知识图谱的基础数据。
表1 自定义信息抽取模型流程 流程 说明 操作指引 准备训练数据 提前准备用于训练模型的数据。 准备训练数据 创建模型 基于您的训练数据(即已标注数据),您可以在KG服务中创建信息抽取模型。 创建模型 创建新版本 创建模型后,您需要创建模型版本,方便后续版本发布和模型调优。
选择数据格式 构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。 “OBS桶”:选择数据源文件存放的OBS桶。
选择数据格式 构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。 “OBS桶”:选择数据源文件存放的OBS桶。
配置图谱质检 图谱质检对流水线构建中的数据源、信息抽取、知识映射、知识融合提供质量检查,辅助用户定位构建中出现的问题。从知识的准确性、一致性、完整性、时效性、重复性五种维度出发,为用户提供通用且全面的评估,并输出质检报告,详见查看质检报告。
数据划分 训练数据:80%数据用于训练信息抽取模型。 验证数据:20%数据用于验证信息抽取模型性能(即F1、P、R性能指标)。 训练数据量 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。
后续操作 智能一键构建图谱:只需提供数据源,无需其他配置,快速构建图谱。 普通配置构建图谱:通过配置数据源、配置图谱本体、配置信息抽取、配置知识映射、配置知识融合、配置图谱质检等流水线步骤,构建适用于自身业务的知识图谱。
只有发布图谱版本后,才能查询图谱中的实体数据。 前提条件 已全量更新图谱或增量更新图谱。 发布图谱版本 登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片,进入图谱详情页面。
后续操作 智能一键构建图谱:只需提供数据源,无需其他配置,快速构建图谱。 普通配置构建图谱:通过配置数据源、配置图谱本体、配置信息抽取、配置知识映射、配置知识融合、配置图谱质检等流水线步骤,构建适用于自身业务的知识图谱。 父主题: 计费问题
图2 实体电影的知识映射关系 知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图3所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。