检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何创建知识图谱 构建图谱流程 KG服务为用户提供了两种方式构建图谱,不同的方式所需要的功能不同。基于不同的图谱构建方式,梳理了使用KG服务的主要流程。 图1 构建图谱流程 表1 构建图谱流程说明 主任务 说明 详细指导 购买知识图谱&选择图谱规格 在创建知识图谱之前,需要购买图谱并选择图谱规格。
可在下方查看从文本信息中抽取的知识类型,知识类型包括主语“Subject_type”、谓语“Predicate”、宾语“Object_type”,即可查看到可抽取的主语、谓语、宾语组合。 图2 抽取模型 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。
语义搜索与推荐 建立用户搜索输入的关键词与知识图谱中的实体之间的映射关系,为用户推荐满足用户需求的结构化信息内容,而不是互联网网页。 图1 知识图谱与语义搜索 智能问答系统 基于知识的问答系统建立大规模知识库,通过理解将用户的问题转化为对知识图谱的查询,提供用户所关心的问题答案。 图2 知识图谱与智能问答
知识图谱如何计费 知识图谱服务根据您选择的图谱规格、购买时长计费,计费项请见计费项,计费模式请见计费模式。 标准版图谱和高级版图谱的具体价格需要通过官网页服务咨询。 计费项 知识图谱服务根据您选择的图谱规格、购买时长计费。 体验版图谱 图谱规模为一万边。 当前KG服务仅支持在控制台创建一次体验版图谱。
配置完流水线的图谱,如何修改数据 已通过流水线配置完成构建的知识图谱,如果想要修改数据,可通过全量更新或增量更新图谱的方式,更新图谱。 全量更新图谱 针对已经创建的知识图谱,您可以全量更新图谱,即使用新的数据源更新知识图谱。 增量更新图谱 针对已经创建的知识图谱,您可以增量更新图
知识图谱服务根据图谱规格和使用图谱的时长,提供套餐包、按需计费两种计费模式。 套餐包:预付费。 按需计费:后付费。 套餐包是按月或按年预先支付费用,相比按需计费提供大额折扣,适合计划长期使用的客户。 套餐包从购买之日起生效,到期自动结束。到期后也不会自动延期,且无法退还费用。为了节省您的费用,建议您购买套餐包后立即使用。
知识图谱是面向各类企业的一站式知识计算平台,提供本体管理、图谱管理、图谱构建等功能,帮助用户从0到1快速构建知识图谱,管理知识图谱流水线任务。 在调用知识图谱服务API之前,请确保已经充分了解知识图谱服务相关概念,详细信息请参见产品介绍。 KG服务以开放API的方式提供给用户,您可
希望在信息抽取时使用自定义的信息抽取模型,您可以在KG模型管理页面创建抽取模型、创建并发布模型版本,用于创建知识图谱过程中的信息抽取。 在KG服务管理控制台上自定义信息抽取模型是一种基于schema约束的中文信息抽取模型,即从自然语言文本中抽取三元组的模型,因此仅适用于抽取基础数据格式为txt文本的自然语言短句。
数据是知识图谱的基础,在知识图谱服务创建知识图谱时,需要从OBS导入用于构建知识图谱的基础数据。知识图谱服务支持的数据包括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中多行单句文本格式的数据属于非结构化数据。 本章节提供一个与人物、电影有关的非结构化数据自
升级图谱规格 如果当前使用的图谱规格无法满足您的需求,支持进行规格升级。规格升级前,您需要先通过官网产品页服务咨询联系我们进行权限申请。 当前仅支持体验版或标准版的图谱进行规格升级,且图谱状态是可用或试用到期冻结状态。
在创建抽取模型时,需要您提前准备用于训练模型的数据并上传至OBS目录,数据格式为txt文本的自然语言短句。KG服务当前支持的数据类型请参见训练数据类型介绍。 准备数据流程如下: 准备待标注的数据 定义三元组类型(schema) 标注数据 上传至OBS 准备待标注的数据 准备待标注的训练数据,并保存至本地
结构化抽取适用于xlsx、csv、json格式的基础数据,选择结构化抽取方式信息抽取时,可分为交互界面配置和代码编辑。 在通过结构化抽取方式进行信息抽取时,即用交互界面配置或用代码编辑进行信息抽取时,需要配置引用字段的抽取函数。 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取
始数据中抽取结构化的信息。更多详情请见配置信息抽取。 字段抽取函数说明 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取函数中引用字段时,使用格式为“${字段}”,例如抽取基础数据中属性“name”的字段,在抽取函数中引用字段的格式为“trim(${name})”。
为何知识图谱无法运行,提示“错误的信息抽取函数” 问题描述 知识图谱无法运行,提示“错误的信息抽取函数”。 可能原因 流水线信息抽取配置有误。 解决方案 检查信息抽取函数和配置信息抽取时所填的参数。 知识图谱服务支持的信息抽取函数具体请参见信息抽取函数。配置信息抽取操作请参见配置信息抽取。
文昭甄皇后魏文帝曹丕的妻子,魏明帝曹叡的生母 ……. 上传数据至OBS 创建用于存储基础数据的OBS桶及文件夹,详情请见添加桶。 由于当前KG服务部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 将创建图谱的基础数据上传至
、事件或关系的范畴或类的实体。例如本体如图1所示,“电影”、“人物”以及两者之间的关系“主演”、“导演”均可称作概念。 本体 本体是某个领域中抽象概念的集合,能够描述某个范围内一切事物的共有特征以及事物间的关系。例如图1可称作一个本体。 实体 实体是知识图谱三元组的元素之一,指某
相似度函数,并判断数据之间的属性相似度。 融合知识 对属性相似度均达到阈值条件的数据进行融合。 综上所述,在创建图谱的过程中,需要配置知识融合的融合标识符、待融合的实体、相似度函数和相似度预置等参数,KG服务会根据所配置的参数进行知识融合。配置知识融合的详细步骤请见配置知识融合。
相似度函数,并判断数据之间的属性相似度。 融合知识 对属性相似度均达到阈值条件的数据进行融合。 综上所述,在创建图谱的过程中,需要配置知识融合的融合标识符、待融合的实体、相似度函数和相似度阈值等参数,KG服务会根据所配置的参数进行知识融合。配置知识融合的详细步骤请见配置知识融合。
数,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧,完成新知识图谱的创建。 知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。