检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
知识图谱的计费规格,一万条边、百万边、千万边具体指什么 知识图谱的数据存储在图数据库,图数据库基本数据类型包含点和边。 点代表实体。如交通网络中的车辆、通信网络中的站点、电商交易网络中的用户和商品、互联网中的网页等。 边代表关系。如社交网络中的好友关系、电商交易网络中用户评分和购买行为、论文
如果您待创建的图谱只需要一个数据源,那么您已完成数据源的配置。 如果您待创建的图谱需要输入多个数据源,请进入下一步。 单击“数据源”下方的“添加数据源”,添加新的数据源,按步骤1~3,配置新的数据源。 后续操作 配置数据源后,进入创建图谱的下一步操作配置图谱本体。
增加信息抽取项:单击“增加”,即可增加一项抽取信息类型。 删除信息抽取项:单击待删除的信息抽取项操作栏的“删除”,即可删除信息抽取项。 按表1填写“数据类别”,“抽取项名称”和“抽取函数”。 表1 信息抽取项属性说明 属性 说明 数据类别 基础数据中描述实体类型的字段。 抽取项名称 抽取信息后的属性字段。
填写实体“电影”的属性配置项信息。 可添加多组属性配置项,每组属性配置项可添加多个判断融合的属性配置。至少存在一组属性配置项,组内所有判断融合的属性相似度均大于相似度阈值时,即可融合这两条数据。 本样例只需添加一个属性配置分组,一组里填写两个属性配置项信息,如图4所示。 单击“添加分组”,即可添加一组新的属性配置项。
OBS导入本体 通过OBS导入一个新的本体。 前提条件 将待导入的本体文件(json格式)上传至OBS中,详情请参见OBS添加桶和OBS上传文件或文件夹。 从OBS导入 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的本体”,进入“本体管理”页面。 在“本体管
填写实体“电影”的属性配置项信息。 可添加多组属性配置项,每组属性配置项可添加多个判断融合的属性配置。至少存在一组属性配置项,组内所有判断融合的属性相似度均大于相似度阈值时,即可融合这两条数据。 本样例只需添加一个属性配置分组,一组里填写两个属性配置项信息,如图17所示。 单击“添加分组”,即可添加一组新的属性配置项。
样式。 属性 编辑当前概念的属性。所有概念都默认有一个属性为“name”,且默认属性类型为“single_string”。 添加属性 单击“添加属性”可添加属性文本框,在文本框中填写属性的“名称”,选择“单值/多值”、“类型”、“操作”。 “名称”:属性名称只能由大小写字母、数字、中文、下划线组成,长度为1-63位。
“数据集名称”:选择“RelationExtraction”。如果选不到,可以单击图标刷新后再选。 “添加标签集”:按表1添加实体标签和关系标签,实体标签需要添加表1中的“subject_type”和“object_type”,关系标签需要添加表1中的“predicate”,如图5和图6所示。 “启用团队标注”:
数据是知识图谱的基础。在创建知识图谱时,需要提前将创建图谱的数据上传至OBS。 数据格式要求 XLSX文件 该类型为结构化数据输入格式。使用XLSX文件,即表格文件作为数据源时,文件必须为.xlsx格式,文件中每一个工作簿为一类数据,工作簿名为数据类型名。每个工作簿中,第一行为数据头,从第二行开始
式为短文本txt格式,文件内容示例如下: 张三的生日是1990年1月1日,身高175cm,出生于北京。 李四,著名导演,毕业于电影学院,代表作有《电影1》、《电影2》。 ... ... 定义三元组类型(schema) 为了训练自定义的信息抽取模型,需要定义该抽取模型能够抽取的三元组类型,并在训练数据中进行标注。
配置基本信息 配置问答模板(交互) 模板元素模板序列 添加问答模板包含的元素。 单击“添加元素”,在对话框中选择问答模板所包含的“元素类型”,例如“概念”,输入“概念名”。可添加多个元素,元素类型请见表1。 图3 添加元素 表1 添加元素 元素类型 字段说明 概念 配置问答模板中所包
X-Project-ID:子项目ID,可选,在多项目场景中使用。 X-Domain-ID:账号ID。 对于获取用户Token接口,由于不需要认证,所以只添加“Content-Type”即可,添加消息头后的请求如下所示。 POST https://iam.cn-north-1.myhuaweicloud.com/v3/auth/tokens
样式。 属性 编辑当前概念的属性。所有概念都默认有一个属性为“name”,且默认属性类型为“single_string”。 添加属性 单击“添加属性”可添加属性文本框,在文本框中填写属性的“名称”,选择“单值/多值”、“类型”、“操作”。 “名称”:属性名称只能由大小写字母、数字、中文、下划线组成,长度为1-63位。
样式。 属性 编辑当前概念的属性。所有概念都默认有一个属性为“name”,且默认属性类型为“single_string”。 添加属性 单击“添加属性”可添加属性文本框,在文本框中填写属性的“名称”,选择“单值/多值”、“类型”、“操作”。 “名称”:属性名称只能由大小写字母、数字、中文、下划线组成,长度为1-63位。
在“用户组”界面中,单击“创建用户组”。 输入“用户组名称”。 单击“确定”。 返回用户组列表,用户组列表中显示新创建的用户组。 在用户组列表中,单击新建用户组“开发人员组”,右侧的“权限配置”。 在用户组权限页签中,单击列表左上方的“配置权限”。 选择权限的作用范围。此处如选择区域级项目,则还需要在下拉框中选择需要授权的区域。
KG服务提供接口请参见表1,您可以使用知识图谱数据面管理功能。 表1 知识图谱数据面接口 API 说明 执行知识图谱查询命令 根据图谱ID执行知识图谱查询命令。 查询实体详情 根据图谱ID和实体ID查询实体详情,包括实体的ID、类型、属性及属性值。 过滤查询实体列表 根据图谱ID,过
实体唯一标识字段 实体唯一标识字段指能识别每个数据的唯一字段,该字段在所有数据中具有唯一性,能唯一代表所对应的数据,类似于数据的“身份证”。 例如如下数据的唯一标识字段为“url” ,因为该字段能唯一代表该数据,因此在配置实体唯一标识字段时,“唯一标识字段”的文本框中填写“url”。 "{
针对在KG服务管理控制台创建的本体,您可以删除本体以适应业务变化。 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的本体”,进入“本体管理”页面。 在本体列表中,单击操作栏的“删除”。 单击“确定”,确认删除本体。 图1 删除本体 父主题: 管理本体
json。前者用来指定需要抽取的关系三元组类型,后者用来存放所有的标注数据。 schema.json一行一句json字符串,表示一种关系三元组类型:“predicate”表示谓词,“subject”表示主语类型,“object”表示宾语类型。例如: {"predicate": "出生地", "subject": "人物"
操作步骤如下: 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击模型名称,进入模型详情页。 在版本管理列表中的“操作”栏,单击“删除”。 图1 删除版本 父主题: 管理版本