检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
生成给物品推荐物品的候选集。可选: 用户匹配物品 物品自匹配 匹配特征对 用户和物品相关联特征。请根据实际情况配置参数,如果属性匹配特征对相似度较高内存不够时需提升配置。 用户特征名:字符串,长度1-20。 物品特征名:字符串,长度1-20。 权重值:权重影响不同物品属性匹配的程度,取值0
获取访问密钥(AK/SK) 由于使用RES时,上传数据、进行计算等需要依赖其他服务,若没有添加访问密钥则无法使用其他服务。 获取访问密钥 登录华为云,在页面右上方单击“控制台”,进入华为云管理控制台。 图1 控制台入口 在控制台右上角的帐户名下方,单击“我的凭证”,进入“我的凭证”页面。
登录RES管理控制台,在左侧菜单栏中选择“数据源”,进入“数据源”列表页面。 在数据源列表单击目标数据源名称,进入数据源详情页面。 在页面的“近线数据源”页签,进行参数配置。您可以根据业务需求选择导入数据类型。详请参见表1。 表1 近线数据源参数说明 参数名称 说明 实时计算规格 可选择“4CU”、“8CU”、“16CU”和“32CU”四种规格。
String 描述 job_config 是 jobConfig object 作业配置 exec_config 否 ResExecConfig object 作业执行配置项(仅离线任务可提供此配置) job_name 是 String 作业名称,1-64位字母、数字、下划线、中划线组合
List 请参见表13,用户行为过滤配置。 blacklist 否 String 黑名单过滤配置。 whitelist 否 String 白名单过滤配置。 etl_uuid 否 String 特征工程-用户物品特征抽取生成的uuid,用于属性过滤配置。 表13 behavior_rules参数说明
String 描述 job_config 是 jobConfig object 作业配置 exec_config 否 ResExecConfig object 作业执行配置项(仅离线任务可提供此配置) job_name 是 String 作业名称,1-64位字母、数字、下划线、中划线组合
BloomFilterConf object 布隆过滤器配置。 group_attr 否 String 分组打散属性。 pre_deal 否 Boolean 在排序前去重。 rank_setting 否 String 排序配置信息。 rules 否 Rule object 候选集融合。
子”。 填写基本信息并选择计算引擎。您可以根据实际情况填写“名称”、“场景”和“描述”信息。其中“场景”信息可选择您在全局配置页面创建的场景。 填写参数配置,参数说明请参见表1。 图1 创建数据质量检测作业 表1 数据质量检测算子参数说明 参数名称 说明 结果保存路径 数据质量检
bloom_filter_conf BloomFilterConf object 布隆过滤器配置。 group_attr String 分组打散属性。 pre_deal Boolean 在排序前去重。 rank_setting String 排序配置信息。 rules Rule object 候选集融合。 filter_sets
测试集)的存储都路径,文件夹。 全局特征配置文件路径(global_features_information_path) 是 String 该文件为JSON格式,包含特征名、特征大类、特征值类型。全局特征文件详细内容可以通过查询全局特征配置获取。 高级设置(writer_parameters)
实时流近线任务支持的推荐标准数据为用户操作行为表。 data_source_config 是 JSON 请参见表12,数据源参数配置。 algorithm_config 是 JSON 请参见表13,算法参数配置。 表10 data_source参数说明 参数名称 是否必选 参数类型 说明 platform 是
一次指标,大于0。 result_path 是 String 结果保存路径。 offline_platform 是 JSON 请参见表8,配置信息。 表3 indicators参数说明 参数名称 是否必选 参数类型 说明 indicator_name 是 String 指标名称,可选名称如下:
流程名称,由汉字、数字、字母、下划线、中划线、空格组成,最大长度60字符。 rules 是 List 每个Flow配置不同流量和候选集的规则,请参见表4。 config 是 Object 流程配置信息,请参见表5。 rank_uuid 否 String 排序策略生成的uuid。 feature_uuid
需要存放在OBS桶中的数据包括: 离线数据源:包含用户类数据,物品类数据,行为数据以及推荐候选列表。 黑名单和白名单:黑名单和白名单的过滤配置,便于用户快速得到有效数据。黑白名单数据都以物品ID的形式在OBS上存储。 操作步骤 登录OBS管理控制台,创建OBS桶。例如,创建名称为“obs-res”的OBS桶。
用于存放近线任务结果数据,宽表形式。 │ obs-model-data 排序模型保存路径。 └ obs-config-data 计算引擎配置地址,用来记录计算引擎的日志。 父主题: 数据格式规范
排序策略 排序策略简介 排序策略用于训练排序模型,该模型将被用于对召回策略召回的候选集进行排序,以将推荐物品顺序调整到最优。排序模型可对LR、FM、FFM、DeepFM和PIN等模型进行训练,具体包括如下内容: 逻辑斯蒂回归-LR 因子分解机-FM 域感知因子分解机-FFM 深度网络因子分解机-DeepFM
"platform_parameter": { "cluster_name": "res_two" }, "config_load_path": "<配置源路径>", "computing_resource": "" }, "storage": { "platform": "CloudTable"
关数据。 上传实时数据 数据质量管理 数据质量管理操作可以将数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。 数据质量管理 选择并配置推荐业务 智能场景 针对对应的场景,由RES根据场景类型预置好对应的智能算法,为匹配的场景提供智能推荐服务。 智能场景简介 自定义场景 面
在IAM中创建可用于添加到企业项目的用户组,具体操作请参见创建用户组。 (可选)在IAM中创建自定义策略,具体操作请参见创建自定义策略。您可以根据业务需求选择不同的策略,例如,配置推荐系统服务“允许查看作业列表”和“允许查看作业详情”两种自定义策略。 在RES管理控制台,选择“工作空间>创建工作空间”,进入“创建工作空间”页面,单击“新建企业项目”。
在自定义场景详情页面发布:单击自定义场景列表中的目标场景名称,进入自定义场景详情页,单击页面右上角的“发布”。 在“发布场景”页面确认自定义场景作业运行的配置规格单击“是”。 修改自定义场景信息需要执行发布操作才可以同步数据。 发布场景会覆盖之前数据,请谨慎操作。 终止自定义场景 登录RES管理控制台,在左侧导航栏中选择“推荐业务”