检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
合的实体,就需要进行融合验证,即验证当前知识融合的配置产生的结果是否符合预期。 背景介绍 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。
出“知识映射”对话框,单击右侧按钮可以放大对话框。 图1 知识映射 “编辑方式”选择“代码配置模式”。 在“代码配置模式”页签的编辑框中,输入json格式代码,以映射关系如图2为例,代码示例如下所示: 图2 实体人物的映射关系 { "label_map_configs": {
什么是知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 知识融合过程请见图2,融合过程说明请见表1。
配置知识融合时,如何选择融合标识符和配置属性 知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1
构建”。 进入智能构建图谱页面。 图1 智能构建图谱 按表1填写信息。 图2 填写信息 表1 智能一键构建图谱 参数 说明 图谱名称 待创建图谱的名称。在选择图谱规格时已确定,无法更改。 选择数据格式 构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。
行咨询购买,详情请见购买套餐包。 如果您使用按需计费模式,在账户状态正常的情况下可正常使用服务。续费请登录华为云官网,单击页面右上角的账号名称下拉框,选择“费用中心”,在费用中心总览页面单击“资金管理 > 充值”,直接为自己的账户充值,确保当前账户未欠费。 父主题: 计费问题
删除信息抽取项:单击待删除的信息抽取项操作栏的“删除”,即可删除信息抽取项。 按表1填写“数据类别”,“抽取项名称”和“抽取函数”。 表1 信息抽取项属性说明 属性 说明 数据类别 基础数据中描述实体类型的字段。 抽取项名称 抽取信息后的属性字段。 抽取函数 抽取信息时所使用的引用字段的信息抽取函数,具体请见信息抽取函数。
、审计和回溯。 前提条件 已开通云审计服务。 支持审计的关键操作列表 表1 云审计服务支持的知识图谱服务操作列表 操作列表 资源类型 事件名称 创建图谱 knowledgeGraph createKg 删除图谱 knowledgeGraph deleteKg 更新图谱 knowledgeGraph
y 表1 路径参数 参数 是否必选 参数类型 描述 kg_id 是 String 知识图谱ID。在KG服务控制台“我的图谱”页面,单击图谱名称,进入图谱详情页左上角获取知识图谱ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID。 请求参数 表2
”页面。 在“新建图谱”页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框。 单击“增加”,在“数据类别”中填写新的数据类别,“抽取项名称”自动填充“identifier”,在“抽取函数”文本框中填写实体唯一标识字段,并填写信息抽取的其他信息。 详细操作请参见配置信息抽取。 父主题:
描述 entity_id 是 String 实体ID。 kg_id 是 String 知识图谱ID。在KG服务控制台“我的图谱”页面,单击图谱名称,进入图谱详情页左上角获取知识图谱ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID。 表2 Query参数
新中的配置操作均与创建知识图谱操作相同。 增量更新不支持更新本体,仅支持预览本体。 图1 增量更新 表1 增量更新图谱操作 操作顺序 操作名称 操作指引 1 增加基础数据 配置数据源 2 更新信息抽取 配置信息抽取 3 更新知识映射 配置知识映射 4 更新知识融合 配置知识融合 5
e 表1 路径参数 参数 是否必选 参数类型 描述 kg_id 是 String 知识图谱ID。在KG服务控制台“我的图谱”页面,单击图谱名称,进入图谱详情页左上角获取知识图谱ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID。 请求参数 表2
新中的配置操作均与创建知识图谱操作相同。 增量更新不支持更新本体,仅支持预览本体。 图1 增量更新 表1 增量更新图谱操作 操作顺序 操作名称 操作指引 1 增加基础数据 配置数据源 2 更新信息抽取 配置信息抽取 3 更新知识映射 配置知识映射 4 更新知识融合 配置知识融合 5
描述 entity_id 是 String 实体ID。 kg_id 是 String 知识图谱ID。在KG服务控制台“我的图谱”页面,单击图谱名称,进入图谱详情页左上角获取知识图谱ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID。 请求参数 无
指云资源所在的物理位置,同一区域内可用区间内网互通,不同区域间内网不互通。通过在不同地区创建云资源,可以将应用程序设计的更接近特定客户的要求,或满足不同地区的法律或其他要求。 可用区 一个可用区是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Regio
公共响应参数 表1 公共响应消息头 名称 描述 Content-Length 响应消息体的字节长度,单位为Byte。 Date 系统响应的时间。 Content-type 发送的实体的MIME类型。 父主题: 数据结构
式”选择“交互界面”。 关闭“默认抽取”开关。 在“信息抽取”对话框中填写信息抽取项,按表1填写。 表1 信息抽取项示例 数据类别 抽取项名称 抽取函数 Person identifier ${url} 中文名 regexp_replace(${中文名}, '\(\[link\]@
版本统计 基本信息 可查看当前已有图谱版本的上线个数、未上线个数、增量更新次数、全量更新次数和发布次数。 图谱版本 图谱版本列表,包括“版本名称”、“状态”、“实体个数”、“关系个数”、“更新时间”、“描述”、“操作”。 其中,操作包括“验证”、“发布”、“查看”、“删除”、“修改本体”。
公共请求参数 表1 公共请求消息头 名称 描述 是否必选 示例 Content-type 发送的实体的MIME类型。 是 application/json Content-Length 请求body长度,单位为Byte。 POST/PUT请求为可选, GET不包含 3495 X-Auth-Token