检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
较新的状态,以获得更好的推荐结果。 以上功能,我们也可以使用数据治理中心 DataArts Studio,通过拖拽的方式完成配置。具体操作步骤如下: 登录数据治理中心 DataArts Studio管理控制台,在控制台的左侧导航栏,选择“数据开发 > 作业开发”。 在“工作区”页面的右侧,单击“新建作业”。
据中是否包含特殊字符,数据类型是否正确,是否缺少必备信息等。 前提条件 已将离线数据上传至OBS桶中。 创建数据质量作业 创建数据质量操作步骤如下: 在“离线作业”下,单击“数据质量”页签,单击上方“创建”,进入“创建数据质量”页面。 在“创建数据质量”页面,单击“添加数据质量算子”选择“数据质量检测算子”。
的数据源,提高读写性能。 前提条件 已开通计算引擎DLI服务,创建集群并完成资源绑定。 创建跨源链接 DLI集群绑定完成后,创建跨源链接。步骤如下: 登录RES管理控制台,在“资源中心”页面,选择计算引擎DLI进入列表。 单击DLI集群名称,进入“跨源连接”页面。 在“跨源连接”
userId String 用户ID。 是 objectType String 发生行为对象的类型, item是用户和商品本身发生的行为。 是 actionObject String 对应行为发生的对象的值,如果是和商品发生关系:则是商品的id(itemId)的值。 是 actionType
行为数据 行为数据包括数据源中的“用户操作行为表”和用于近线计算的“行为数据”。行为数据,每行记录用户的单次行为信息,包含用户标识符、行为对象标识符、行为类型和行为时间等信息。 注意事项 每张表的表结构和填充的数据必须符合推荐系统的要求,列名和字段类型需要和规范保持一致。 创建数
图1 过滤规则 创建过滤规则 在“创建过滤规则”页面,用户可以对目标数据选择不同策略进行离线计算,得到合适的候选集。 创建过滤规则操作步骤如下: 在“离线作业”下,单击“过滤规则”页签,单击该页面做上方“创建”,进入“创建过滤规则”页面。 在“创建过滤规则”页面,填写特征工程“名称”、“场景”和“描述”。
与功能对应,特征工程的两个任务分别是: 初始用户画像-物品画像-标准宽表生成 排序样本预处理 图1 特征工程 创建特征工程 创建特征工程操作步骤如下: 在“离线作业”下,单击“特征工程”页签,单击上方“创建”,进入“创建特征工程”页面。 在“创建特征工程”页面,填写特征工程“名称”、“场景”和“描述”。
用户可以通过复制组合作业再次创建新的作业进行离线计算。生成的数据和原来的作业生成的数据相互独立,复制的离线作业会生成新的线上指定的UUID。 操作步骤如下: 登录RES管理控制台,在左侧菜单栏中选择“离线作业”下的目标推荐作业,进入作业列表。 在作业列表页面,您可以单击目标作业“操作”列的“复制”,进入“创建离线作业”页面。
数据探索是一个离线分析任务,任务有对应的启动时间,由于增量数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。 操作步骤 在“执行步骤”页签,单击数据探索下的“执行”。进入“数据探索”页面,确认页面信息后单击“是”。待状态为“已完成”时,完成数据格式的转化。 执行完
用户-物品行为表,每行记录用户的单次行为信息,包含用户标识符、行为对象标识符、行为类型和行为时间等信息。 表4 字段描述 字段名 类型 描述 是否必选 userId String 用户ID。 是 objectType String 发生行为对象的名称。 item:是用户和物品本身发生的行为。 是
重,可做修改。同时支持自定义行为类型。 如果当前场景只有用户关注人这一种行为,则此参数表示用户关注的对象是人。 如果当前场景只有用户关注物品这一种行为,则此参数表示用户关注的对象是物品。 说明: 自定义行为类型,行为名称需要符合以下要求,由数字、字母、下划线组成,长度为4-32。
编辑服务 用户可以通过“编辑”在线服务修改该参数信息进行计算。生成的数据会覆盖原来的在线服务计算生成的数据。“部署中”的在线服务不支持编辑。操作步骤如下: 登录RES管理控制台,在左侧菜单栏中选择“在线服务”,进入服务列表。 在“在线服务”页面,您可以单击目标服务操作列的“编辑”,进入“编辑在线服务”页面。
只有在数据源数据结构特征抽取人工复核确认之前才允许修改数据源。 注意事项 修改编辑之后的离线数据源需要重新进行数据结构抽取和检测、探索等操作。 操作步骤 登录RES管理控制台,在左侧菜单栏中选择“数据源”,进入数据源列表页面。 在数据源列表单击目标数据源名称,进入数据源详情页面。 单击离线
objects 属性对。 表30 AttrPair 参数 是否必选 参数类型 描述 party_a 否 String 被推荐对象的属性名。 party_b 否 String 被推荐对象的属性名。 表31 Deduplication 参数 是否必选 参数类型 描述 attributes 否 Array
确保数据的合法性。 数据结构介绍 数据结构步骤的主要目的是读取用户上传的离线数据,解析用户特征和物品特征中每一个属性的数据格式、统计所有行为,然后保存解析生成的数据格式。 前提条件 已按照创建离线数据源操作指导完成数据源的创建。 操作步骤 登录RES管理控制台,在左侧菜单栏中选择
如何开始使用RES? 使用RES,从资源准备到在线服务完成推荐的全流程,如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源
objects 属性对。 表30 AttrPair 参数 是否必选 参数类型 描述 party_a 否 String 被推荐对象的属性名。 party_b 否 String 被推荐对象的属性名。 表31 Deduplication 参数 是否必选 参数类型 描述 attributes 否 Array
AttrPair objects 属性对。 表32 AttrPair 参数 参数类型 描述 party_a String 被推荐对象的属性名。 party_b String 被推荐对象的属性名。 表33 Deduplication 参数 参数类型 描述 attributes Array of strings
objects 属性对。 表31 AttrPair 参数 是否必选 参数类型 描述 party_a 否 String 被推荐对象的属性名。 party_b 否 String 被推荐对象的属性名。 表32 Deduplication 参数 是否必选 参数类型 描述 attributes 否 Array
objects 属性对。 表32 AttrPair 参数 是否必选 参数类型 描述 party_a 否 String 被推荐对象的属性名。 party_b 否 String 被推荐对象的属性名。 表33 Deduplication 参数 是否必选 参数类型 描述 attributes 否 Array