检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
RES使用对象存储服务(Object Storage Service,简称OBS)进行数据源的存储。因此,在使用RES之前您需要开通OBS服务并创建桶,然后在OBS桶中上传用户数据用于推荐作业的计算。 需要存放在OBS桶中的数据包括: 离线数据源:包含用户类数据,物品类数据,行为数据以及推荐候选列表。 人
发布或终止智能场景 针对创建成功的智能场景,需要进行发布才可以运行作业获取推荐结果。通过执行终止操作,停止运行当前场景。 前提条件 已存在创建成功的智能场景。 发布智能场景 登录RES管理控制台,在左侧导航栏中选择“推荐业务 >智能场景”,进入智能场景列表页面。 选择智能场景列表
能使用RES的完整功能。 图1 权限委托 单击“同意授权”系统会自动创建委托。由于RES与其他云服务之间存在业务交互关系,需要与这些云服务协同工作,因此需要您创建云服务委托,完成授权后将操作权限委托给RES,让RES以您的身份使用这些云服务,代替您进行一些任务调度、资源运维等工作
Storage Service,简称OBS)进行数据源以及黑白名单和用户数据的存储。因此,在使用RES之前您需要开通OBS服务并创建桶,然后在OBS桶中上传用户数据用于推荐作业的计算。 需要存放在OBS桶中的数据包括: 离线数据源:包含用户类数据,物品类数据,行为数据以及推荐候选列表。 黑
RES.1001 Basic Error 请求参数({0})的值无效 请检查是否有非法的参数值输入。 400 RES.1002 Basic Error 请求参数({0})的大小无效 请正确输入请求参数的值的长度。 400 RES.1006 Basic Error 请求的内容无效 请检查请求内容是否跟文档要求相符。
“画像数据”:在数据源导入数据成功后,按每小时每百万条画像进行计费,在删除数据源后,将停止计费。 “训练作业”:在创建离线作业和导入实时数据均需要选取训练规格,根据训练规格大小进行计费。 如果需要数据源停止计费,请先终止近线数据源的导入,删除对应数据源和对应OBS中的数据存储。 父主题: 计费相关
创建用户并授权使用RES 如果您需要对您所拥有的RES进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),通过IAM,您可以: 根据企业的业务组织,在您的华为云帐号中,给企业中不同职能部门的员工创建IAM用户
创建离线数据源 在使用RES之前,首先您需要创建一个数据源,后续的操作,如修改数据源、创建自定义推荐,都是基于您创建的数据源进行的。 前提条件 已创建用于存储数据的OBS桶及文件夹,并且数据存储的OBS桶与RES在同一区域。 需要使用的数据已上传至OBS。 创建数据源 登录RES
job_description 否 String 作业描述,最大长度256字符。 online_services 是 List 需要进行效果评估的在线服务; indicators 是 List 请参见表3,需要统计的指标列表及其对应的参数。 start_time 是 Long 被统计数据的起始时间戳。 end_time
该文件标识了每一个域下的特征数量,排序数据处理接口会生成这个文件,文件路径为用户在排序数据预处理中输入的结果保存路径参数表示的路径的“fields_feature_size”目录下,文件名称为“part-00000”,需要用户提供文件完整路径。 max_iterations 是 Int 模型训练的最大迭代轮数。取值范围[1
推荐系统OBS文件夹规范 使用推荐系统时,需要在OBS创建桶并导入离线数据,同时作业所产生的数据也会保存在OBS中。为了方便您快速定位文件路径,建议您按照如下结构准备数据创建文件夹,并上传至OBS桶。 OBS文件夹示例 自定义OBS桶名 │ obs-offline-data
全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features
获取访问密钥(AK/SK) 由于使用RES时,上传数据、进行计算等需要依赖其他服务,若没有添加访问密钥则无法使用其他服务。 获取访问密钥 登录华为云,在页面右上方单击“控制台”,进入华为云管理控制台。 图1 控制台入口 在控制台右上角的帐户名下方,单击“我的凭证”,进入“我的凭证”页面。
选数据, 选出需要的属性。只能选择进行用户分组还是物品分组,分组内可配置多个特征。 “用户特征”:在用户特征下拉框中选择需要的特征参数进行召回计算。例" user_meta_list ": ["gender","age"] “物品特征”:在物品户特征下拉框中选择需要的特征参数进行召回计算。例"
否 String 训练作业描述,最大长度为256字符。 spec_id 是 Int 训练作业选择的资源规格ID。在使用ModelArts之前需要查询ModelArts服务AK/SK并确保关联AK/SK到ModelArts服务,然后通过查询ModelArts计算节点规格获取spec_id返回的值。
GENERAL_FORMAT data_source_url 是 String 数据源路径,最大长度1000字符。 data_format 是 String 输入数据格式,可选值:csv、parquet、json、orc。 data_param 否 JSON 请参见表6,数据格式是csv的时候必选,其他可选。
具体策略的参数说明可单击上方策略名称进行查看,策略设置完成后,单击“下一步:排序策略”。 排序策略-离线特征工程 在进行排序之前需要先进行离线特征工程将数据转化为排序所需要的格式。 “创建自定义场景”页面,进入“排序策略”页签,如图4所示。策略的详细参数说明请参见排序策略-离线特征工程。 图4
最小长度:1 最大长度:64 specs_config 是 SpecsConfig object 计算规格。 schedule 否 String 调度信息。 job_configs 是 jobConfig object 作业配置。 表5 SpecsConfig 参数 是否必选 参数类型
文件路径(人工配置候选集作业需要提供此参数)。 ucb_param 否 UcbParam object UCB作业参数(UCB召回作业需要提供此参数)。 behavior_gravity 否 BehaviorGravity object 重力衰减因子(综合行为热度召回作业需要提供此参数)。 category
离线数据和近线实时数据如何配合使用? 在推荐系统初始化阶段,需要用户提供批量的离线数据源并按照推荐系统要求的数据格式上传至OBS,完成数据的检测和导入。 近线实时数据源推荐使用RES SDK上传,此操作所有的数据更新都是实时生效的。 父主题: 数据源