检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
代码配置模式 格式化编辑指通过编辑json格式代码,完成知识映射配置。 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 已完成信息抽取配置,详情请参见配置信息抽取。 操作步骤 在普通配
Service,简称OBS)导入用于构建知识图谱的基础数据。知识图谱服务支持的数据包括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中XLSX、CSV、JSON格式的数据属于结构化数据。 本章节提供一个与电影有关的结构化数据样例,帮助您快速熟悉知识图谱的创建过
Service,简称OBS)导入用于构建知识图谱的基础数据。知识图谱服务支持的数据包括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中XLSX、CSV、JSON格式的数据属于结构化数据。 本章节提供一个与电影有关的结构化数据样例,帮助您快速熟悉知识图谱的创建过
数据是知识图谱的基础,在知识图谱服务创建知识图谱时,需要从OBS导入用于构建知识图谱的基础数据。知识图谱服务支持的数据包括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中多行单句文本格式的数据属于非结构化数据。 本章节提供一个与人物、电影有关的非结构化数据自定
图谱导入”进行恢复。 导出的图谱版本包含以下信息: csv文件夹:存放csv源数据文件 ontology.json:图谱本体配置文件 pipeline_config.json:流水线配置文件 操作步骤 登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片,进入图谱详情页面。
信息抽取函数 结构化抽取适用于xlsx、csv、json格式的基础数据,选择结构化抽取方式信息抽取时,可分为交互界面配置和代码编辑。 在通过结构化抽取方式进行信息抽取时,即用交互界面配置或用代码编辑进行信息抽取时,需要配置引用字段的抽取函数。 KG服务支持的信息抽取函数如表1所示
在“我的图谱”页面,单击待查看的图谱卡片,进入图谱详情页面,可查看如下信息。 在线版本图谱 图谱应用 版本统计 图1 图谱详情 在线版本图谱 可查看当前在线图谱的基本信息,包括“运行状态”、“图谱ID”、“实体个数”、“关系个数”等。 图2 在线版本图谱 图谱应用 针对已创建的知识图谱提供如下服务。 “知识图谱预览查询”
非结构化抽取 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 如果选择使用自己自定义模型,您需要在创建知识图谱之前,自定义用于信息抽取的模型,具体操作请见自定义信息抽取模型。 操作步骤
OBS导入本体 通过OBS导入一个新的本体。 前提条件 将待导入的本体文件(json格式)上传至OBS中,详情请参见OBS添加桶和OBS上传文件或文件夹。 从OBS导入 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的本体”,进入“本体管理”页面。 在“本体管
的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 在通过普通抽取方式进行信息抽取时,即用交互界面配置或用格式化编辑进行信息抽取时,需要配置字段抽取函数。配置字段抽取函数后,KG服务会根据所配置的字段抽取函数进行信息抽取,即从原始数据中抽取结构化的信息。更多详情请见配置信息抽取。
实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。 代码配置模式:通过编辑json格式代码,完成知识映射配置。具体步骤请见代码配置模式。 进行知识映射时,表格配置模式、代码配置模式可以相互切换。 知识映射配置完成后,鼠
入的文本进行语义解析,识别出其中与图谱相关联的多种类型的元素。 上传元素配置文件到OBS 导入元素配置至知识图谱前,需要将元素配置文件(json格式)上传至OBS中,详情请参见OBS添加桶和OBS上传文件或文件夹。 导入元素配置至知识图谱 上传元素配置文件到OBS后,知识图谱控制台支持导入OBS中的元素配置文件。
知识图谱问答KBQA支持直接导入问答模板配置文件,用来识别用户问句的真实查询意图。 上传问答模板配置文件到OBS 导入问答模板配置至知识图谱前,需要将问答模板配置文件(json格式)上传至OBS中,详情请参见OBS添加桶和OBS上传文件或文件夹。 导入问答模板配置至知识图谱 上传问答模板配置文件到OBS后,知识
个数据字段建立同名抽取项,抽取函数为${数据字段名}。 图标说明开关处于关闭状态,需要编辑json格式代码。 在“信息抽取”对话框下方编辑json格式代码。 在“代码编辑”页签编辑json代码配置信息抽取时,可单击“交互界面”,切换至“交互界面”页签,查看信息抽取前后的相关字段。
条数据。CSV文件示例请单击下载。 多行JSON文件(JSON Lines) 该类型为结构化数据输入格式。文件中,每一行为一个完整的紧凑(单行)JSON字符串。文件编码格式需为UTF-8,文件名需以.json结尾,如“input.json”。文件内容如下所示。 {"entity_type":
基础数据格式为xlsx、csv、json格式 交互界面配置:通过输入实体类型、抽取函数及抽取前后的数据字段,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。 交互界面配置 代码编辑:将交互界面中的配置转换为json格式配置,通过编辑json配置信息,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。
基础数据格式为xlsx、csv、json格式 交互界面配置:通过输入实体类型、抽取函数及抽取前后的数据字段,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。 交互界面配置 代码编辑:将交互界面中的配置转换为json格式配置,通过编辑json配置信息,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。
非结构化数据创建图谱 创建图谱简介 创建信息抽取模型 使用自定义抽取模型创建图谱
DATASET数据需要用户指定的文件夹中包含两个指定格式与名称的文件:schema.json和train_data.json。前者用来指定需要抽取的关系三元组类型,后者用来存放所有的标注数据。 schema.json一行一句json字符串,表示一种关系三元组类型:“predicate”表示谓词,“
抽取”,“编辑方式”选择“交互界面”。 在“交互界面”页签填写信息抽取前后的相关字段时,可单击“代码编辑”,切换至“代码编辑”页签,查看json代码。 图1 信息抽取 选择“默认抽取”开关。 图标说明开关处于开启状态。开启后,在每个数据类别中,为每个数据字段建立同名抽取项,抽取函数为${数据字段名}。