检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
结构化数据)中抽取结构化的信息。 配置方式 信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。 表1 配置方式说明 配置方式 适用范围 具体方式 操作指引 结构化抽取 基础数据格式为xlsx、csv、json格式 交互界面配置:通过输入实体类型、抽取函数及抽取前后的数据字段,完成信息抽取配置。
息抽取时,需要配置字段抽取函数。配置字段抽取函数后,KG服务会根据所配置的字段抽取函数进行信息抽取,即从原始数据中抽取结构化的信息。更多详情请见配置信息抽取。 字段抽取函数说明 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取函数中引用字段时,使
图1 知识融合示例 知识融合过程请见图2,融合过程说明请见表1。 图2 知识融合 表1 知识融合说明 融合过程 过程说明 初步筛选 知识融合需要初步筛选与融合标识符相似的实体数据。 判断属性相似度 初步筛选与融合标识符相似的数据后,需要配置相似属性和相似度函数,并判断数据之间的属性相似度。
自定义信息抽取模型的流程如表1所示。 表1 自定义信息抽取模型流程 流程 说明 操作指引 准备训练数据 提前准备用于训练模型的数据。 准备训练数据 创建模型 基于您的训练数据(即已标注数据),您可以在KG服务中创建信息抽取模型。 创建模型 创建新版本 创建模型后,您需要创建模型版本,方便后续版本发布和模型调优。
pattern, int index) 提取出字段值中与正则表达式pattern匹配的子串。第三个参数index为可选参数,表示获取正则表达式匹配到的第index个捕获组。注意,index=0表示返回整个匹配的子串,index=1表示返回第一个捕获组。 regexp_extract_all(${info}
在“用户组”界面中,单击“创建用户组”。 输入“用户组名称”。 单击“确定”。 返回用户组列表,用户组列表中显示新创建的用户组。 在用户组列表中,单击新建用户组“开发人员组”,右侧的“权限配置”。 在用户组权限页签中,单击列表左上方的“配置权限”。 选择权限的作用范围。此处如选择区域级项目,则还需要在下拉框中选择需要授权的区域。
并且该策略仅对此项目生效,如果需要所有区域都生效,则需要在所有项目都设置策略。访问KG时,需要先切换至授权区域。 如表1 所示,包括了KG的所有系统角色。 表1 KG系统角色 角色名称 描述 NLP Administrator 知识图谱服务的管理员权限。 OBS权限 由于华为云
式为短文本txt格式,文件内容示例如下: 张三的生日是1990年1月1日,身高175cm,出生于北京。 李四,著名导演,毕业于电影学院,代表作有《电影1》、《电影2》。 ... ... 定义三元组类型(schema) 为了训练自定义的信息抽取模型,需要定义该抽取模型能够抽取的三元组类型,并在训练数据中进行标注。