检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
提交数据质量作业 提交数据质量作业API 查询全局特征配置 父主题: 作业相关API
提交特征工程作业 提交特征工程作业 查询全局特征配置 父主题: 作业相关API
数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于增量数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。 操作步骤
>智能场景”,进入智能场景列表页面。 选择智能场景列表中的目标场景,单击“操作”列的“发布”。 在“发布场景”页面确认智能场景作业运行的配置规格单击“是”。 修改智能场景信息需要执行发布操作才可以同步数据。 发布场景会覆盖之前数据,请谨慎操作。 终止智能场景 登录RES管理控制台,在左侧导航栏中选择“推荐业务
所有输出数据(错误数据以及错误信息)的存储路径,文件夹。 全局特征配置文件路径(global_features_information_path) 是 String 该文件为JSON格式,包含特征名、特征大类、特征值类型。全局特征文件详细内容可以通过查询全局特征配置获取。 响应消息 响应参数请参见表8。 表8
准备工作 注册华为帐号并开通华为云 获取访问密钥并添加RES全局配置 创建OBS桶 开通相关资源 父主题: 用户指南(旧版)
认进入“智能场景”列表。 在智能场景列表中,单击“运行中”状态的目标场景名称,进入详情页。 单击“效果评估”页签,单击目标类型作业进行参数配置,请参见表1。 表1 效果评估参数说明 参数名称 说明 名称 自定义名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。
API(V1不推荐) 平台资源API 作业相关API 全局配置API 在线服务API
用户指南(旧版) 准备工作 RES操作流程 管理资源 全局配置 离线作业 近线作业 在线服务 服务总览信息 数据格式规范
登录RES管理控制台,在左侧菜单栏中选择“数据源”,进入“数据源”列表页面。 在数据源列表单击目标数据源名称,进入数据源详情页面。 在页面的“近线数据源”页签,进行参数配置。您可以根据业务需求选择导入数据类型。详请参见表1。 表1 近线数据源参数说明 参数名称 说明 实时计算规格 可选择“4CU”、“8CU”、“16CU”和“32CU”四种规格。
需要使用的数据已上传至OBS。 创建数据源 登录RES管理控制台,在左侧菜单栏中选择“数据源”,进入“数据源”列表页面。 单击“创建”,在创建数据源页面,参考表1配置相关参数。 表1 创建数据源参数说明 参数名称 说明 名称 数据源的名称,名称只能是字母、数字、下划线或者中划线组成的合法字符串。 用户属性表
cluster_name,参数类型String,必选参数,集群名称。 config_load_path,参数类型String,非必选参数,配置加载路径。 响应消息 响应参数请参见表3。 表3 响应参数说明 参数名称 是否必选 参数类型 说明 is_success 是 Boolean
List 请参见表13,用户行为过滤配置。 blacklist 否 String 黑名单过滤配置。 whitelist 否 String 白名单过滤配置。 etl_uuid 否 String 特征工程-用户物品特征抽取生成的uuid,用于属性过滤配置。 表13 behavior_rules参数说明
实时流近线任务支持的推荐标准数据为用户操作行为表。 data_source_config 是 JSON 请参见表10,数据源参数配置。 algorithm_config 是 JSON 请参见表11,算法参数配置。 表7 data_source 参数说明 参数名称 是否必选 参数类型 说明 platform 是
子”。 填写基本信息并选择计算引擎。您可以根据实际情况填写“名称”、“场景”和“描述”信息。其中“场景”信息可选择您在全局配置页面创建的场景。 填写参数配置,参数说明请参见表1。 图1 创建数据质量检测作业 表1 数据质量检测算子参数说明 参数名称 说明 结果保存路径 数据质量检
一次指标,大于0。 result_path 是 String 结果保存路径。 offline_platform 是 JSON 请参见表8,配置信息。 表3 indicators参数说明 参数名称 是否必选 参数类型 说明 indicator_name 是 String 指标名称,可选名称如下:
流程名称,由汉字、数字、字母、下划线、中划线、空格组成,最大长度60字符。 rules 是 List 每个Flow配置不同流量和候选集的规则,请参见表4。 config 是 Object 流程配置信息,请参见表5。 rank_uuid 否 String 排序策略生成的uuid。 feature_uuid
需要存放在OBS桶中的数据包括: 离线数据源:包含用户类数据,物品类数据,行为数据以及推荐候选列表。 黑名单和白名单:黑名单和白名单的过滤配置,便于用户快速得到有效数据。黑白名单数据都以物品ID的形式在OBS上存储。 操作步骤 登录OBS管理控制台,创建OBS桶。例如,创建名称为“obs-res”的OBS桶。
用于存放近线任务结果数据,宽表形式。 │ obs-model-data 排序模型保存路径。 └ obs-config-data 计算引擎配置地址,用来记录计算引擎的日志。 父主题: 数据格式规范
关数据。 上传实时数据 数据质量管理 数据质量管理操作可以将数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。 数据质量管理 选择并配置推荐业务 智能场景 针对对应的场景,由RES根据场景类型预置好对应的智能算法,为匹配的场景提供智能推荐服务。 智能场景简介 自定义场景 面