检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于增量数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。 操作步骤
>智能场景”,进入智能场景列表页面。 选择智能场景列表中的目标场景,单击“操作”列的“发布”。 在“发布场景”页面确认智能场景作业运行的配置规格单击“是”。 修改智能场景信息需要执行发布操作才可以同步数据。 发布场景会覆盖之前数据,请谨慎操作。 终止智能场景 登录RES管理控制台,在左侧导航栏中选择“推荐业务
所有输出数据(错误数据以及错误信息)的存储路径,文件夹。 全局特征配置文件路径(global_features_information_path) 是 String 该文件为JSON格式,包含特征名、特征大类、特征值类型。全局特征文件详细内容可以通过查询全局特征配置获取。 响应消息 响应参数请参见表8。 表8
API(V1不推荐) 平台资源API 作业相关API 全局配置API 在线服务API
用户指南(旧版) 准备工作 RES操作流程 管理资源 全局配置 离线作业 近线作业 在线服务 服务总览信息 数据格式规范
提交数据质量作业 提交数据质量作业API 查询全局特征配置 父主题: 作业相关API
提交特征工程作业 提交特征工程作业 查询全局特征配置 父主题: 作业相关API
认进入“智能场景”列表。 在智能场景列表中,单击“运行中”状态的目标场景名称,进入详情页。 单击“效果评估”页签,单击目标类型作业进行参数配置,请参见表1。 表1 效果评估参数说明 参数名称 说明 名称 自定义名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。
准备工作 注册华为帐号并开通华为云 获取访问密钥并添加RES全局配置 创建OBS桶 开通相关资源 父主题: 用户指南(旧版)
需要使用的数据已上传至OBS。 创建数据源 登录RES管理控制台,在左侧菜单栏中选择“数据源”,进入“数据源”列表页面。 单击“创建”,在创建数据源页面,参考表1配置相关参数。 表1 创建数据源参数说明 参数名称 说明 名称 数据源的名称,名称只能是字母、数字、下划线或者中划线组成的合法字符串。 用户属性表
cluster_name,参数类型String,必选参数,集群名称。 config_load_path,参数类型String,非必选参数,配置加载路径。 响应消息 响应参数请参见表3。 表3 响应参数说明 参数名称 是否必选 参数类型 说明 is_success 是 Boolean
登录RES管理控制台,在左侧菜单栏中选择“数据源”,进入“数据源”列表页面。 在数据源列表单击目标数据源名称,进入数据源详情页面。 在页面的“近线数据源”页签,进行参数配置。您可以根据业务需求选择导入数据类型。详请参见表1。 表1 近线数据源参数说明 参数名称 说明 实时计算规格 可选择“4CU”、“8CU”、“16CU”和“32CU”四种规格。
List 请参见表13,用户行为过滤配置。 blacklist 否 String 黑名单过滤配置。 whitelist 否 String 白名单过滤配置。 etl_uuid 否 String 特征工程-用户物品特征抽取生成的uuid,用于属性过滤配置。 表13 behavior_rules参数说明
实时流近线任务支持的推荐标准数据为用户操作行为表。 data_source_config 是 JSON 请参见表10,数据源参数配置。 algorithm_config 是 JSON 请参见表11,算法参数配置。 表7 data_source 参数说明 参数名称 是否必选 参数类型 说明 platform 是
子”。 填写基本信息并选择计算引擎。您可以根据实际情况填写“名称”、“场景”和“描述”信息。其中“场景”信息可选择您在全局配置页面创建的场景。 填写参数配置,参数说明请参见表1。 图1 创建数据质量检测作业 表1 数据质量检测算子参数说明 参数名称 说明 结果保存路径 数据质量检
一次指标,大于0。 result_path 是 String 结果保存路径。 offline_platform 是 JSON 请参见表8,配置信息。 表3 indicators参数说明 参数名称 是否必选 参数类型 说明 indicator_name 是 String 指标名称,可选名称如下:
流程名称,由汉字、数字、字母、下划线、中划线、空格组成,最大长度60字符。 rules 是 List 每个Flow配置不同流量和候选集的规则,请参见表4。 config 是 Object 流程配置信息,请参见表5。 rank_uuid 否 String 排序策略生成的uuid。 feature_uuid
需要存放在OBS桶中的数据包括: 离线数据源:包含用户类数据,物品类数据,行为数据以及推荐候选列表。 黑名单和白名单:黑名单和白名单的过滤配置,便于用户快速得到有效数据。黑白名单数据都以物品ID的形式在OBS上存储。 操作步骤 登录OBS管理控制台,创建OBS桶。例如,创建名称为“obs-res”的OBS桶。
用于存放近线任务结果数据,宽表形式。 │ obs-model-data 排序模型保存路径。 └ obs-config-data 计算引擎配置地址,用来记录计算引擎的日志。 父主题: 数据格式规范
"platform_parameter": { "cluster_name": "res_two" }, "config_load_path": "<配置源路径>", "computing_resource": "" }, "storage": { "platform": "CloudTable"