检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
所有输出数据(错误数据以及错误信息)的存储路径,文件夹。 全局特征配置文件路径(global_features_information_path) 是 String 该文件为JSON格式,包含特征名、特征大类、特征值类型。全局特征文件详细内容可以通过查询全局特征配置获取。 响应消息 响应参数请参见表8。 表8
品数据更新物品画像算子可以作为此处的作业ID。 新的全局特征配置文件路径(new_global_features_info) 是 String 该文件为JSON格式,包含特征名、特征大类、特征值类型。 新的全局特征配置文件(new_global_features_info)包含的
"platform_parameter": { "cluster_name": "res_two" }, "config_load_path": "<配置源路径>", "computing_resource": "" }, "storage": { "platform": "CloudTable"
数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于近线实时数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。 父主题:
图1所示。“RestClient”节点参数配置说明请参见“数据治理中心 DataArts Studio>用户指南>数据开发>节点> Rest Client”。 图1 作业监控及任务异常重新启动节点配置 对第一个节点进行查询作业详情的配置。查询作业详情参数请参见查询作业详情API。
List 请参见表13,用户行为过滤配置。 blacklist 否 String 黑名单过滤配置。 whitelist 否 String 白名单过滤配置。 etl_uuid 否 String 特征工程-用户物品特征抽取生成的uuid,用于属性过滤配置。 表13 behavior_rules参数说明
新增作业配置 登录RES管理控制台,在左侧菜单栏中选择“推荐业务 > 自定义场景”,进入“自定义场景”列表页面。 在自定义场景列表中,单击目标场景名称进入“自定义场景详情”页。 在目标策略页签下单击,在弹出页面选择目标策略,参考算法介绍及参数说明章节进行配置。 配置完成后单击“
修改在线服务参数 打开高级选项,进行打散功能的配置,选取相应的属性即可完成配置。 “高级类型”:选择“打散”。 “打散”:选择“itemType”。itemType代表物品的类别,可以完成物品类别的打散,避免同一类的物品依次出现。 图2 配置打散参数 配置完成后,单击“确认”。 如果用户还未
实时流近线任务支持的推荐标准数据为用户操作行为表。 data_source_config 是 JSON 请参见表10,数据源参数配置。 algorithm_config 是 JSON 请参见表11,算法参数配置。 表7 data_source 参数说明 参数名称 是否必选 参数类型 说明 platform 是
服务名,计算引擎DLI用于推荐系统的离线计算和近线计算。 集群名称,选择“资源中心”绑定的DLI集群名称。 任务配置地址,在创建作业时, 会自动生成一个JSON格式的配置源文件,该文件存储在指定的OBS路径中,计算引擎可以通过读取配置源文件来进行离线计算。 资源名,指定DLI运行作业的资源规格。 存储平台 服务名
数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于增量数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。 操作步骤
>智能场景”,进入智能场景列表页面。 选择智能场景列表中的目标场景,单击“操作”列的“发布”。 在“发布场景”页面确认智能场景作业运行的配置规格单击“是”。 修改智能场景信息需要执行发布操作才可以同步数据。 发布场景会覆盖之前数据,请谨慎操作。 终止智能场景 登录RES管理控制台,在左侧导航栏中选择“推荐业务
workspace_id String 工作空间编号。 data_config DataConfig object 数据配置。 specs_config SpecsConfig object 计算规格配置。 created_at String 创建时间。 update_at Long 更新时间。 表5
实时流近线任务支持的推荐标准数据为用户操作行为表。 data_source_config 是 JSON 请参见表12,数据源参数配置。 algorithm_config 是 JSON 请参见表13,算法参数配置。 表10 data_source参数说明 参数名称 是否必选 参数类型 说明 platform 是
amId”的配置值要与步骤2中“通道ID”的值一致。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 // 配置通道ID String
一次指标,大于0。 result_path 是 String 结果保存路径。 offline_platform 是 JSON 请参见表8,配置信息。 表3 indicators参数说明 参数名称 是否必选 参数类型 说明 indicator_name 是 String 指标名称,可选名称如下:
amId”的配置值要与步骤2中“通道ID”的值一致。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 // 配置通道ID String
bloom_filter_conf BloomFilterConf object 布隆过滤器配置。 group_attr String 分组打散属性。 pre_deal Boolean 在排序前去重。 rank_setting String 排序配置信息。 rules Rule object 候选集融合。 filter_sets
String 描述 job_config 是 jobConfig object 作业配置 exec_config 否 ResExecConfig object 作业执行配置项(仅离线任务可提供此配置) job_name 是 String 作业名称,1-64位字母、数字、下划线、中划线组合
String 描述 job_config 是 jobConfig object 作业配置 exec_config 否 ResExecConfig object 作业执行配置项(仅离线任务可提供此配置) job_name 是 String 作业名称,1-64位字母、数字、下划线、中划线组合