检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
组合作业作为一个包含多个子任务的作业,通常用于多个召回、过滤、排序等任务。 组合作业 数据质量 数据质量是用户在进行离线计算之前使用原始初始格式数据或者通用格式数据检测输入数据是否合法。 数据质量 特征工程 特征工程常用于抽取用户、物品的特征和特定算法的特征生成,一般作为某些算法的前置输入条件。
择“账号中心”。如图1所示。 如果您当前已登录华为云管理控制台,在账户名下方选择“基本信息”进入“账号中心”,或者直接单击“我的凭证”,下一步可直接跳转至步骤3。 图1 账号中心 进入“账号中心”页面,在“基本信息”页签,选择“管理我的凭证”,如图2所示。 图2 管理我的凭证 进
“调度周期”:调度周期可选“天”或“周”。 “调度类型”:包括自定义和间隔调度。 “开始调度时间”:选择具体的调度时间。当调度周期选择为“周”时,可在此下拉框中勾选星期一到星期天的任一天进行调度。 “时间间隔”:如果选择的调度类型为间隔调度,需要配置调度的时间间隔。 配置完成后单击“立即创建”。 创建成功后会自动跳
user_id 是 String 用户ID。 items 否 List 由itemid组成的List。需要在部署服务的时候与物品-物品协同过滤算法一起使用,并提供物品-物品相似度查询功能。 others_users 否 List 由userid组成的List。提供多用户候选集查询功能。 context
10s进行一次。包括数据读取和处理的流计算。 表11 algorithm_config 参数说明 参数名称 是否必选 参数类型 说明 online_job_uuid 是 String 关联的在线服务的uuid。 flow_name 是 String 关联在线服务的其中一个在线流程
互关系,需要与这些云服务协同工作,因此需要您创建云服务委托,完成授权后将操作权限委托给RES,让RES以您的身份使用这些云服务,代替您进行一些任务调度、资源运维等工作。下次再进入RES管理控制台首页时,系统不会再弹出访问授权的对话框。 父主题: 准备工作
atures_info)包含的特征是在原作业ID(job_id)对应的全局特征配置文件的特征基础上新增的一些特征或者删除一些特征;两份文件重复的特征名对应的特征类型必须保持一致。 响应消息 响应参数请参见表7。 表7 响应参数说明 参数名称 参数类型 说明 job_name String
打开目标数据右侧的导入按钮,确认“实时计算规格”信息和计费后并进行确认后,单击“是”进行实时导入。待数据状态成为“运行中”时,表示实时数据导入完成。每“执行”一次导入操作,之前的数据内容将被覆盖,请您谨慎操作。 图1 实时导入 查看近线数据源详情或终止数据源 当您确认导入近线数据源之后,可以查看近线数据源详情或者对数据终止导入。
创建集群章节。 DIS创建通道操作详请参见数据接入服务用户指南> 入门> 步骤1:开通DIS通道章节。 CloudTable集群需要开启IAM统一身份认证。 创建资源完成后,创建的资源会展示在“资源中心”列表中,如图1所示。 图1 CloudTable资源信息 父主题: 管理资源
“调度周期”:调度周期可选“天”或“周”。 “调度类型”:包括自定义和间隔调度。 “开始调度时间”:选择具体的调度时间。当调度周期选择为“周”时,可在此下拉框中勾选星期一到星期天的任一天进行调度。 “时间间隔”:如果选择的调度类型为间隔调度,需要配置调度的时间间隔。 配置完成后单击“创建”。创建成功后会自动跳转到“
至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源 上传离线数据源至OBS 创建离线数据源 在使用RES之前,首先您需要创建一个数据源,后续的操作都是基于您创建的数据源进行的。 创建离线数据源 上传实时数据(可选) RES通过SDK上传实时数据,进行数据计算和处理,更新用户的相关数据。
至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源 上传离线数据源至OBS 创建离线数据源 在使用RES之前,首先您需要创建一个数据源,后续的操作都是基于您创建的数据源进行的。 创建离线数据源 上传实时数据(可选) RES通过SDK上传实时数据,进行数据计算和处理,更新用户的相关数据。
ble”,进入CloudTable产品页。单击“立即使用”,进入CloudTable管理控制台。 CloudTable集群需要开启IAM统一身份认证。 (可选)开通数据接入资源DIS 在使用推荐系统之前,数据接入服务(Data Ingestion Service,简称DIS)采集
deploy service(A maximum of (5) real-time service instances are allowed. 一个服务允许选择的节点个数不能超过5个。 减少使用的节点个数或者申请增加节点个数。 如有更多问题请提工单咨询技术人员为您解答。 单击目标服务名称,进入服务详情页面查看服务具体信息。
名称不超过64个字符,只能由中文、英文字母、数字、下划线、中划线组成,且不能使用任何大小写形式的“default”。 描述 工作空间描述。例如,我的第一个工作空间。 描述不超过256个字符。 企业项目 如果您未开通企业项目,则不会有此参数。 如果您开通了企业项目,可以从下拉选项选择企业项目,
图1 修改在线服务参数 修改“过滤(黑名单)”下面的参数。 “实时行为过滤” :“开启”。 “时间区间(天)”:配置为1,即可实现过滤用户近一天(预测请求的时间点前推24h)内浏览或者曝光过的物品。 “行为类型”:配置“view”和“click”。 图2 配置过滤条件 配置完成后,单击“确认”。
并生成json数据,即内部通用格式。 数据时间范围 被统计数据的起始时间和终止时间。 统计间隔(天) 统计间隔,以天为单位,每隔多少天计算一次指标,大于0。 在线服务 选择已发布的在线服务进行推荐效果指标计算。 结果保存路径 效果评估结果在OBS的文件输出路径。 指标 推荐服务效
单击近线数据源的“详情” 图1 获取通道ID 上传实时数据,示例代码如下,其中,“streamId”的配置值要与步骤2中“通道ID”的值一致。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
登录RES管理控制台,在左侧菜单栏中选择“在线服务”,进入服务列表。 在“在线服务”页面,单击目标服务操作列的“开通”完成操作。 停止服务 由于运行中的在线服务将一直收费,您可以通过停止操作,停止收费。停止服务即释放当前该在线服务占用的容器资源,停止状态的服务不可用,会调用失败。 您可以对处于“运行中”状态的服务进行“停止”操作。
宽表条目数,行为数据去重以后的数目。 user_complete_degree Double 用户齐全度,一条行为中的用户是否在产生这条行为的时候拥有画像。 item_complete_degree Double 物品齐全度,一条行为中的物品是否在这条行为产生的时候拥有画像。 bhv_count Map<String