检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于近线实时数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。 父主题: 数据源
认值为1。 否 publishTime Long 发布时间,采用UTC标准时间,单位以秒计。对物品有实时性要求的则必填。 否 expireTime Long 失效时间,采用UTC标准时间,单位以秒计。当前服务器的时间大于该时间时,此物品将不会被推荐。如不设置,代表永不失效。 否 author
“调度周期”:调度周期可选“天”或“周”。 “调度类型”:包括自定义和间隔调度。 “开始调度时间”:选择具体的调度时间。当调度周期选择为“周”时,可在此下拉框中勾选星期一到星期天的任一天进行调度。 “时间间隔”:如果选择的调度类型为间隔调度,需要配置调度的时间间隔。 创建完成后单击“确认”。保存后的召回策略会展示在下面的列表中。
“调度周期”:调度周期可选“天”或“周”。 “调度类型”:包括自定义和间隔调度。 “开始调度时间”:选择具体的调度时间。当调度周期选择为“周”时,可在此下拉框中勾选星期一到星期天的任一天进行调度。 “时间间隔”:如果选择的调度类型为间隔调度,需要配置调度的时间间隔。 配置完成后单击“创建”。创建成功后会自动跳转到“
总览界面包括“最新动态”、“视频教程”和“常用链接”,如图1所示。其中,在最新动态可查看所创建“离线作业”、“近线作业”和“在线服务”的名称、状态和创建时间。 图1 总览 单击作业或服务名称,进入该详情页面,可以查看资源信息、策略信息和日志信息。您也可以通过页面快速创建作业或服务。单击“创建在线服务”,快速进入创建在线服务页面。
编辑页面。 图1 修改在线服务参数 修改“过滤(黑名单)”下面的参数。 “实时行为过滤” :“开启”。 “时间区间(天)”:配置为1,即可实现过滤用户近一天(预测请求的时间点前推24h)内浏览或者曝光过的物品。 “行为类型”:配置“view”和“click”。 图2 配置过滤条件
分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于增量数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。 操作步骤 在“执行步骤”页签,单击数据探索下的“执行”。进入“
String 镜像版本。 type 是 String 镜像类型。 build_time 是 Long 镜像构建时间。 update_time 是 Long 镜像更新时间。 示例 成功响应示例 { "is_success": true, "images": [
的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。 数据时间范围 被统计数据的起始时间和终止时间。 统计间隔(天) 统计间隔,以天为单位,每隔多少天计算一次指标,大于0。 在线服务 选择已发布的在线服务进行推荐效果指标计算。
用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。 通用格式时间:用户行为数据时间范围,可只有起始时间、结束时间或为空。 策略参数设置完成后,单击“确定”。 您可以前往过滤规则列表,查看作业的基本情况。在作业列表中,刚创建的作
String 按时间或比例划分训练集测试集。 可选值为TIME或RATE。 训练数据起始时间 (training_data_start_time) 否 Long 训练数据起始时间。 divide_by_time_or_rate为TIME时必填。取值不大于行为数据中的最大时间且不大于tr
通用格式数据:从用户属性表、物品属性表和用户操作行为表中提取用户、物品特征和用户行为,并生成JSON数据,即内部通用格式。 通用格式时间:用户行为数据时间范围,可只有起始时间、结束时间或为空。 完成该项配置后,单击“下一步”。 召回策略 您可以根据业务需要,选择合适的召回策略。召回策略用于配置离线
failed_times 是 String 服务失败调用次数。 publish_time 是 Long 服务发布时间。 update_time 是 Long 服务更新时间。 示例 成功响应示例 { "is_success": true, "services":
String 错误码(请求成功时,不返回此字段)。 表4 workspaces 参数 参数类型 描述 created_at Long 创建时间。 description String 描述。 enterprise_project_id String 企业项目id。 enterprise_project_name
是 Long 当前页面。 page-size 是 Long 页面条数。 start-time 否 String 开始时间。 end-time 否 String 结束时间。 job-name 否 String 作业名称 job-status 否 String 作业状态 sortby 否
TE_SET,则此字段必填。 time_name 否 String 物品数据中代表时间特征的字段名。若rank_type值为TIME,则此字段必填。 rec_day 否 Int 数据的时间段,该时间段从当前开始往前推N天。 若rank_type值为TIME,则此字段必填。 glo
置顶的推荐候选集。 降权 降权是指定时间区间内用户对物品有过指定的行为类型记录时,将对相应物品进行降权处理。 例如对于用户过去3天内有过曝光行为的物品降权,但是可以对曝光过但是有购买行为的物品进行排除,不对其降权。 时间区间:指定用户行为时间,取值1-7,默认为3。 行为类型:指
created_at String 创建时间。 description String 描述。 id String 企业项目id。 name String 企业项目名称。 status Integer 状态。 updated_at String 更新时间。 请求示例 查询企业项目 /v2
String 错误码(请求成功时,不返回此字段)。 表4 workspaces 参数 参数类型 描述 created_at Long 创建时间。 description String 描述。 enterprise_project_id String 企业项目id。 enterprise_project_name
NearLineRecallParam 参数 是否必选 参数类型 描述 time_limit 否 Boolean 时间过滤。 timeFeature 否 String 时间特征。 retainDays 否 Integer 保留期(天)。 recall_fileds 否 Array of