云服务器内容精选

  • 概念说明 GES基于属性图模型导入图数据,因此,您需要了解属性图(Property graph)的基本概念。 一个属性图是由点、边、标签(Label)和属性(Property)组成的有向图。 点又称作节点(Node),边又称作关系(Relationship),点和关系是最重要的实体。 元数据是用于描述点或边的属性信息,元数据由多个标签组成,每个标签由一个或多个属性组成。 为点或边设置标签,那么拥有相同标签的点属于一个分组,是一个集合。 如下示例中,此图数据由3个点和3条边组成,Vivian、Eric和Lethal Weapon表示点,(Vivian,Eric)、(Vivian,Lethal Weapon)和(Eric、Lethal Weapon)表示边,user和movie表示点的类型(标签),rate和friends表示关系类型(标签)。 图1 图数据格式的示例
  • 边文件 边文件罗列了各个边的数据信息,一行为一条边的数据。GES中图规格是以边的数量进行定义的,如一百万边。格式如下所示,id 1、id 2是一条边的两个端点的id。 id 1, id 2, label, property 1, property 2, … 示例: Eric,Lethal Weapon,rate,4,2000-11-21 15:33:18 Vivian,Eric,friends 注意:在持久化版中想要把两个端点和标签都相同的边存入进去,则需要sortKey列,放在属性后面即最后一列。 导入时指定sortKeyColumn参数,如果sortKey有值,则会根据图的sortKey类型正确读入,如果没有值需要在属性的末尾添加逗号,导入时会读入空表示将sortKey设置为空,即NULL。 id 1, id 2, label, property 1, property 2, …,sortKey 示例: Eric,Lethal Weapon,rate,4,2000-11-21 15:33:18,5 Vivian,Eric,friends,
  • 点文件 点文件罗列了各个点的数据信息。一行为一个点的数据。格式如下所示,id是点数据的唯一标识。 id,label,property 1,property 2,property 3,… 点id的名称,建议您不要使用中划线(-)命名,会影响Gremlin查询的使用。 点id的类型不需要设置,默认为string。 请注意label前后不要任意加空格,逗号表示分隔符,空格会被识别成label的一部分,可能会出现识别不了或提示label不存在的情况。 示例: Vivian,user,薇薇安,F,25-34,artist,98133 Eric,user,埃里克,M,18-24,college/grad student,40205
  • 属性编辑 属性页签可展示选中点或边的属性信息,也可对单个点或边的属性进行编辑。 属性编辑的操作如下: 在绘图区选中一个点或边,单击右键,选择“查看属性”,会在右侧显示“属性”页签,展示选中点边的属性信息。 若选中的点有多个标签(label),可单击label后的下拉框来查看其它label的属性信息。 图1 属性信息 单击属性名后的按钮 ,可对该点或边的属性进行编辑。 编辑完成后,单击即可。 单击属性区最下方的“编辑全部”按钮,可编辑所有属性,编辑完成后单击“保存全部”可一次性保存所有修改的属性。 注意:此处的属性编辑只针对单个点或边,而Schema编辑章节在元数据区进行的属性添加或删除是针对一个标签的属性编辑,修改后会改动所有该标签的属性信息。 父主题: 访问图和分析图
  • 群体演化 针对包含某些节点的群体,结合时间轴观察其结构的动态演化过程 。具体操作步骤如下: 在左侧“动态图”操作区的“群体演化”模块内填写参数。 开始和结束的时间以及属性值在上述章节时间轴设置中已经设置完成,如果要修改参数,单击当前输入框或左下方按钮,在弹出的“时间轴设置”框内填写,此处不可填写。 sources:表示群体内包含的节点ID,最多可以输入十万个节点,节点之间需要用逗号隔开。 图1 群体演化模块 输入完成后,单击“群体演化”模块右侧的按钮,运行结果将在画布上展示。 图2 动态图展示 界面元素 说明 动态图的开始运行按钮。 动态图的播放方向,默认开启为正向播放,关闭后为反向播放。 动态图演示的时间区域限制。 默认开启:表示启动双滑块,开始和结束的时间滑块同时移动,滑块表示的时间窗长度不变。 关闭后:表示启动单滑块。 当启动单滑块且播放方向为正向时,开始时间的滑块固定,结束时间滑块在时间轴上后移。 当启动单滑块且播放方向为反向时,结束时间的滑块固定,开始时间滑块在时间轴上前移。 表示画布展示数据包含静态数据,开启后表示仅展示动态数据。 静态数据是指不会随着时间变化而动态显示或隐藏的数据。 控制滑块运行区段开始和结束时间的显示方式。 默认开启是以时间戳的方式填写和展现。 关闭是以日期的方式填写和展现。 重置区段选择时间。 设置滑块运行区段的开始时间和结束时间。 时间轴设置,具体参数填写请参考时间轴设置章节。 步进值:滑块每次单位时间内运行的距离。 间隔时间:滑块每运行一次的间隔时间。 运行时间轴。 父主题: 动态图
  • 恢复图 如果当前编辑的图数据存在问题,需要获取之前备份的数据进行分析时,您可以将备份数据载入,以恢复图数据。 图规格为“一万边”的图和产品类型为持久化版的图没有自动备份功能,恢复图数据时只能通过手动备份恢复。其他规格的图可以通过“自动备份”和“手动备份”两种方式恢复图数据。 具体操作步骤如下: 登录图引擎服务管理控制台,在左侧导航栏选择“备份管理”。 在“备份管理”页面,选择需要恢复数据的备份,在“操作”列单击“恢复”。 在“恢复”页面,选择待恢复图,勾选“恢复操作将覆盖关联图。恢复操作启动后,待恢复图将重新启动。”,单击“是”。 图1 恢复数据 页面提示执行恢复命令成功后,您可以在“图管理”页面,等待图状态为“运行中”后,访问关联图,获取恢复后的数据。 父主题: 备份图和恢复图
  • 操作步骤 进入图引擎编辑器页面,详细操作请参见访问图引擎编辑器。 在算法分析区,你可以选择算法,并设置参数。 图引擎服务支持的算法如算法一览表所示,详细算法介绍请参见算法参考。 图1 设置算法参数 对于用source(节点ID) 和target参数进行查询的算法,例如personalrank算法,k跳算法,最短路径算法等,支持按照属性查询点。当前该功能只支持图规格为内存版的图使用。 图2 查询点 单击运行算法分析,分析结束后您可以查询结果。 在图引擎编辑器页面上调用算法,由于受限于可视化呈现效果,仅截取了500个节点的结果进行显示。对于全局迭代性算法例如pagerank算法等,如果您想要获得全量的算法结果可以采用API方式调用,具体请参考算法API。 以模板中的电影数据为例,运行后得到的PageRank值如下图所示。 图3 查询分析结果 将参数进行调整后,再次运行算法得到的pagerank值不同,但TOP排序不会有明显差异。 挑出了最有影响力的两部电影,分别是ID Comedy和ID Action。 图4 调整参数 执行“关联预测”,分析上述两部电影的关联程度,关联度为0.029,说明很少有人同时看过这两部电影。 图5 关联分析 图6 关联分析结果
  • 修改安全模式 创建图之后,您若想要修改安全模式,可以在图详情中进行操作。 2.4.4及以上版本,且必须是运行状态的图支持该功能。 具体操作步骤如下: 登录图引擎服务管理控制台,在左侧导航栏中选择“图管理”。 在图管理页面,选中想要修改安全模式的图,页面下方将会显示该图的信息。 图1 图详情页签 在图信息详情中,可以修改安全模式的状态,进行打开或者关闭。 更新安全模式中,按钮置灰不可使用,您可以到任务中心查看任务进度。 图2 查看任务状态 父主题: 管理图
  • 新增图和删除图 创建完持久化版图集群后,进入图引擎编辑器页面,详细操作请参见访问图引擎编辑器。 在页面左上角,单击“新增图”按钮,在弹出的新增图窗口中填写图名称、选择点ID类型和SortKey类型。 图2 新增图 ID类型:目前支持固定长度String、可变长度String和哈希三种点ID类型。 String(固定长度):实际点ID直接用于内部存储与计算,需指定一长度,实际点ID不可超过此长度。长度过大可能影响查询性能,建议根据数据集状态进行设置。选择固定长度String格式,还需填写点ID长度。 String(可变长度):用户写入的点ID无长度限制,但是ID过长会影响读写性能,建议长度控制在1K字节以内,最大不要超过4K字节。 哈希格式下,内部计算时将实际点ID转换成哈希码进行存储与计算,对实际点ID长度无限制,但是存在极低的概率(约10^(-43))出现点ID碰撞。 若用户无法确定点ID的最大长度,建议选择哈希类型。 SortKey类型:选择SortKey的值类型,通过配置不同SortKey的值来区分重复边(源点,终点,Label三者都相同的边)。 整数:整数类型。 String(字节长度小于等于40):导入大于40的SortKey将报错。 String(可变长度):长度无限制,但是过长会影响读写性能,建议长度控制在1K字节以内,最大不要超过2K字节。 填写完成后,单击“确定”完成新增图操作。 若您需要删除某个图实例,可以单击“删除图”按钮,来完成删除图操作。
  • 参数说明 表1 标签传播算法(Label Propagation)参数说明 参数 是否必选 说明 类型 取值范围 默认值 convergence 否 收敛精度 Double 0~1,不包括0和1 0.00001 max_iterations 否 最大迭代次数 Integer 1~2000 1000 initial 否 点上用作初始化标签的属性名称 String 空或字符串。 空:每个节点各自分配一个特有的初始化标签;适用于事先没有任何节点标注信息的情况。 字符串:将节点的对应的属性字段取值作为初始化标签(类型为string,对于未知标签的点,初始化标签字段赋空);适用于已标注部分节点标签,预测未知节点标签的情况。 说明: 当initial取值非空时,对于具有初始化标签的点,其数量应大于0,小于点总数。 -
  • 统计信息展示 通过框选画布中点和边,在统计信息区会显示出当前所框选的点边对应的标签和节点权重的数量。关于点和边的概念请参考图数据格式。 统计信息展示的具体操作如下: 进入图引擎编辑器页面,详细操作请参见访问图引擎编辑器。 单击绘图区右侧的,显示“条件过滤“、“属性”、“统计信息”页签,单击“统计信息”页签。 标签:统计当前画布中所有的标签名称和对应的点边数量。 节点权重Top10:当前图中边数量最多的十个节点。 以下图统计信息为例,图中共有7个标签。标签为FUND_PRODV的点有5个,标签为FIN_PRODV的点有3个。 图中权重最大的是节点id为1101的点,共有5条边。排名第十的是节点id为1103的点,共有1条边。 图1 统计信息展示 框选(Shift+ 鼠标左键拖动)图中的点和边,被框选的标签和各个节点权重的占比数量会显示在统计信息页签中。 以下图统计信息为例,可知图中被框选的标签为FUND_PRODV的点有5个,标签为CHANNELV的点有2个。 节点id为1101的点框选了5条边,节点id为6101的点框选了5条边,节点id为3101的点框选了2条边。 图2 框选后的标签和节点权重 父主题: 访问图和分析图
  • 时序路径 从一个点出发搜索到目标节点的时序路径(时序路径满足动态图上信息传播的有序性,路径上后一条边的经过时间要晚于或等于前一条边的经过时间),在画布上呈现点、边随时间递增(或非减)的变化趋势。 该功能可以通过strategy参数调整,搜索的是距离最短的时序路径,还是尽早到达目标节点的时序路径。具体操作步骤如下: 在左侧“动态图”操作区的“时序路径”模块内填写参数: 开始和结束的时间以及属性值:在上述章节时间轴设置中已经设置完成,如果要修改参数,单击当前输入框或左下方按钮,在弹出的“时间轴设置”框内填写,此处不可填写。 source:指定单个节点作为起始节点ID。 targets:终点节点ID集合(可设置多个终点节点ID)。 k:拓展深度,表示要拓展的最大级数,取值范围为1-100,默认值为3。 strategy:运行的算法策略,取值为shortest或foremost。 shortest:返回距离最短的时序路径。 foremost:返回尽可能早的到达目标节点的时序路径。 directed:拓展方向(是否考虑边的方向)取值为true或false,默认true。 true:考虑边的方向。 false:不考虑边的方向。 图1 时序路径 输入完成后,单击“时序路径”模块右侧的按钮,运行结果将在画布上展示。例如图2和图3所示,动态图数据会随着时间呈现变化趋势。 图2 运行结果展示1 图3 运行结果展示2 父主题: 动态图
  • 参数说明 表1 关联路径算法(n-Paths)参数说明 参数 是否必选 说明 类型 取值范围 默认值 source 是 输入路径的起点ID String - - target 是 输入路径的终点ID String - - directed 否 是否考虑边的方向 Boolean true或false false n 否 路径个数 Integer 1~100 10 k 否 层数 Integer 1~10 5
  • 实例概况 进入图实例的运维监控页面后,您可以看到图实例概况,展示了图实例的状态,实时资源消耗,资源消耗,业务负载等信息。下面为您进行详细说明各个模块的作用: 图集群状态 在图集群状态模块,您可以浏览当前图实例基本信息和容量、请求数等统计信息。 集群信息:包括图规格、CPU架构等信息。 集群容量:包括点和边的使用量、容量和使用率。 集群节点:包括各个类型节点数量/总数量。 集群请求数统计(内存版):包括等待中的读请求个数、运行中的读请求个数、等待中的写请求个数、运行中的写请求个数。 图2 图集群状态 实例资源 在实例资源模块,您可以查看当前实例资源使用情况,包括“CPU使用率”,“磁盘I/O”,“磁盘使用率”,“内存使用率”,“网络I/O值”。单击对应资源指标可显示过去72小时该指标的变化趋势,以及该资源当前时刻的Top5节点使用情况。 图3 实例资源 业务负载 在业务负载模块,您可以查看当前数据库业务负载指标QPS在过去72小时该指标的变化趋势。 图4 业务负载
  • 条件过滤 为了方便用户对图数据的分析,可以通过设置条件过滤,对图数据进行进一步的过滤分析。 具体操作如下: 进入图引擎编辑器页面,详细操作请参见访问图引擎编辑器。 单击绘图区右侧的,或者在绘图区,选中一个点,单击右键,选择“查看属性”,显示“属性”页签。 单击“条件过滤”页签,进入“条件过滤”区,设置条件: 匹配:默认选中点,可选择过滤点或者边。 标签:默认选中所有标签,可在下拉框中选择点或者边的“标签”,“标签”在用户上传的元数据文件中定义。 添加过滤条件:单击“添加过滤条件”后的,选中一个“属性”,并选择约束条件(包含“小于、大于、等于、不等于、在范围、存在、不存在、大于或等于、小于或等于”)。“属性”在用户上传的元数据文件中定义。此处可添加多条过滤条件,也可单击右侧“删除”,删除已设置的过滤条件。 图1 设置条件过滤 运行结束后,过滤结果将呈现在绘图区以及结果查询区。 父主题: 访问图和分析图