检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置完成后单击“确认”,该策略会出现在对应策略的详情列表中。鼠标移动至该策略上方,可以对该策略作业进行“编辑”、“查看”、“执行”和“删除”操作。 修改作业配置 登录RES管理控制台,在左侧菜单栏中选择“推荐业务 > 自定义场景”,进入“自定义场景”列表页面。 在自定义场景列表中,单击目标场景名称进入“自定义场景详情”页。
数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于近线实时数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。 父主题:
图1所示。“RestClient”节点参数配置说明请参见“数据治理中心 DataArts Studio>用户指南>数据开发>节点> Rest Client”。 图1 作业监控及任务异常重新启动节点配置 对第一个节点进行查询作业详情的配置。查询作业详情参数请参见查询作业详情API。
服务名,计算引擎DLI用于推荐系统的离线计算和近线计算。 集群名称,选择“资源中心”绑定的DLI集群名称。 任务配置地址,在创建作业时, 会自动生成一个JSON格式的配置源文件,该文件存储在指定的OBS路径中,计算引擎可以通过读取配置源文件来进行离线计算。 资源名,指定DLI运行作业的资源规格。 存储平台 服务名
数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于增量数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。 操作步骤
>智能场景”,进入智能场景列表页面。 选择智能场景列表中的目标场景,单击“操作”列的“发布”。 在“发布场景”页面确认智能场景作业运行的配置规格单击“是”。 修改智能场景信息需要执行发布操作才可以同步数据。 发布场景会覆盖之前数据,请谨慎操作。 终止智能场景 登录RES管理控制台,在左侧导航栏中选择“推荐业务
单击“效果评估”页签,单击目标类型作业进行参数配置,请参见表1。 表1 效果评估参数说明 参数名称 说明 名称 自定义名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 描述 对于该效果评估作业的描述信息。 开启调度 默认开启调
创建工作空间 前提条件 使用RES工作空间您需要具备如下权限: 请确保您已开通RES并完成密钥认证。 已经开通相关资源并进行全局配置。 创建工作空间 登录RES管理控制台。 您可以通过两种方式创建工作空间,进入“创建工作空间”页面,填写工作空间参数信息。详请参见表1。 在左侧导航
效果评估名称:只能由字母、数字、中划线和下划线组成,并且长度小于64个字符。 图8 创建效果评估 配置创建效果评估相关参数,请参见表1。 配置完成后单击“确认”,该作业会出现在效果评估页签下的列表中。鼠标移动至该策略上方,可以对该策略作业进行“编辑”、“查看”、“执行”和“删除”操作。 您可以在自定义详
需要使用的数据已上传至OBS。 创建数据源 登录RES管理控制台,在左侧菜单栏中选择“数据源”,进入“数据源”列表页面。 单击“创建”,在创建数据源页面,参考表1配置相关参数。 表1 创建数据源参数说明 参数名称 说明 名称 数据源的名称,名称只能是字母、数字、下划线或者中划线组成的合法字符串。 用户属性表
在数据源详情页面,您可以单击目标近线数据右侧的“详情”,查看该实时数据的名称和通道ID,此ID为全局唯一。 当不需要该数据时,您单击可以单击目标近线数据右侧的“终止”,对“执行”状态的数据终止导入。 当终止导入后,该数据无法正常使用,请您谨慎操作。 删除近线数据源 当您不需要使
请参见表13,用户行为过滤配置。 说明: 过滤策略请至少选择behavior_rules、property_rules、blacklist、whitelist中的一个作为过滤条件。 blacklist 否 String 黑名单过滤配置。 whitelist 否 String 白名单过滤配置。 data_source
准备工作 注册华为帐号并开通华为云 获取访问密钥并添加RES全局配置 创建OBS桶 开通相关资源 父主题: 用户指南(旧版)
在作业列表页面,您可以单击目标作业“操作”列的“复制”,进入“创建离线作业”页面。 离线作业配置方法,请参见组合作业,配置结束单击“完成”。 编辑离线作业 用户可以通过编辑离线作业修改该作业的参数信息进行离线计算。生成的数据会覆盖原来的离线作业生成的数据,编辑并运行之后的离线作业会生成新的线上指定的UUID。
所有输出数据(错误数据以及错误信息)的存储路径,文件夹。 全局特征配置文件路径(global_features_information_path) 是 String 该文件为JSON格式,包含特征名、特征大类、特征值类型。全局特征文件详细内容可以通过查询全局特征配置获取。 响应消息 响应参数请参见表8。 表8
品数据更新物品画像算子可以作为此处的作业ID。 新的全局特征配置文件路径(new_global_features_info) 是 String 该文件为JSON格式,包含特征名、特征大类、特征值类型。 新的全局特征配置文件(new_global_features_info)包含的
String 描述 job_config 是 jobConfig object 作业配置 exec_config 否 ResExecConfig object 作业执行配置项(仅离线任务可提供此配置) job_name 是 String 作业名称,1-64位字母、数字、下划线、中划线组合
BloomFilterConf object 布隆过滤器配置。 group_attr 否 String 分组打散属性。 pre_deal 否 Boolean 在排序前去重。 rank_setting 否 String 排序配置信息。 rules 否 Rule object 候选集融合。
BloomFilterConf object 布隆过滤器配置。 group_attr 否 String 分组打散属性。 pre_deal 否 Boolean 在排序前去重。 rank_setting 否 String 排序配置信息。 rules 否 Rule object 候选集融合。
实时流近线任务支持的推荐标准数据为用户操作行为表。 data_source_config 是 JSON 请参见表10,数据源参数配置。 algorithm_config 是 JSON 请参见表11,算法参数配置。 表7 data_source 参数说明 参数名称 是否必选 参数类型 说明 platform 是