检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
说明 loc 是 String 提取到的地名结果。 per 是 String 提取到的人名结果。 org 是 String 提取到的组织结果。 示例 请求示例 { "text": "在贵州黔东南苗族侗族自治州台江县革一镇乡下,有一座两层的小木屋,和这里的大部分木质吊脚楼一样,小木
提交特征工程作业 功能介绍 该接口用于特征工程处理,包含数据预处理,特征提取和排序训练样本生成等。 URI POST /v1/{project_id}/etl-job 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String
的淄博“80后”小伙18年来的坚守。", "绝大多数用户的需求往往是关注主流内容和商品。而忽略相对冷门的大量“长尾”信息,导致很多优秀的内容或商品没有机会被用户发现和关注。" ] } 成功响应示例 { "flow_id": "b9226bbb0e3
“个数比例”:个数比例是将全部数据按个数比例随机划分成训练集和测试集传入值。取值RAMDOM。 训练数据占比 生成的结果中,训练集占整个训练集和测试集的比例,默认0.7。 测试数据占比 生成的结果中,训练集占整个训练集和测试集的比例,默认0.3。 开启调度 开启调度,按照指定的调度策略定期执行作业。
“TIME” 训练数据时间:训练数据起始时间和终止时间,该起始时间和终止时间不得超过行为数据的时间范围。 测试数据时间:测试数据起始时间和终止时间,该起始时间和终止时间不得超过行为数据的时间范围。 “RATE” 训练数据占比:生成的结果中,训练集占整个训练集和测试集的比例,默认0.7。 测试
您可以从“应用于”右侧的下拉选项中设置该数据的使用维度是“兴趣属性”或者“关键词提取”。其中: 兴趣属性,此特征将会用于统计用户的兴趣标签,并生成特征名为“interested_原特征名”的特征。 关键词提取,只有当关键词为content和title时会进行关键词提取,并生成特征名为“keyword_原特征名”的特征。
序三种在线服务,具体说明如下: 推荐引擎 推荐引擎用于对RES召回策略跑出来的候选集结果进行融合过滤和排序。 文本标签 文本标签服务为用户提供自然语言处理工具,可用于关键词提取和命名实体识别。 排序 排序服务允许用户提供自己的候选集,使用RES的排序策略进行排序。 前提条件 已经
告。如果数据完全符合要求,会生成推荐系统所需要的宽表和画像数据。 宽表:推荐系统内部格式,以行为数据为主,将行为数据中涉及到的用户数据和物品数据整合成一条数据。 画像:画像分为用户画像和物品画像,分别用于存储用户输入的用户特征和物品特征。如果同一用户或物品有多条记录,将会按照用户ID或者物品ID去重。
群名称和表名用于存储更新后的用户画像。 不涉及。 物品画像存储 指定存储物品画像的存储平台信息。服务名默认CloudTable,指定集群名称和表名用于存储更新后的用户画像。 不涉及。 过滤存储 指定存储过滤集合的存储平台信息。服务名默认CloudTable,指定集群名称和表名用于存储更新后的用户画像。
单击DLI集群名称,进入“跨源连接”页面。 在“跨源连接”页面,单击“创建跨源连接”,输入跨源连接名称、已创建并绑定的DLI资源名称和CloudTable资源名称,如图1所示。 跨源连接名称只能包含数字、英文字母、下划线和中划线。不能为空。输入长度不能超过64个字符。 图1 创建跨源连接 单击“确定”,完成连接创建。
Studio管理控制台,在控制台的左侧导航栏,选择“数据开发 > 作业开发”。 在“工作区”页面的右侧,单击“新建作业”。 作业名称修改为您可以识别的名称。只能包含英文字母、数字、中文、“-”、“_”、“.”,且长度为1~128个字符。 作业类型、创建方式、选择目录、作业责任人、作业优先级、日志路径均选择默认参数。
参数类型 说明 is_success 是 Boolean 是否成功。 images 是 List 返回镜像列表信息,请参见表3 images参数说明。 表3 images参数说明 参数名称 是否必选 参数类型 说明 image_id 是 String 镜像ID。 model_name 是
在“创建过滤规则”页面,填写特征工程“名称”、“场景”和“描述”。 特征工程名称:请以“Filter-”开始,只能由字母、数字、中划线和下划线组成,并且长度小于64个字符。 “场景”信息可选择您在全局配置页面创建的场景。 根据表1设置计算引擎和存储平台相关参数,并根据业务需要在“增加历史行为过滤”,如图2所示。
数如下: 表头,有或无,根据用户数据格式选取。 分隔符,选择逗号(,)、竖线(|)、制表符(\t)和自定义。 引用字符,单引号(')、双引号(")和自定义。 转义字符,反斜杠(\)和自定义。 在对应表的“操作”列中,单击“清除数据”可以删除对应表的数据源。 通用格式 通用数据由特
“jobs.job_status”表示了当前任务的状态。 重新执行作业的API用来将任务以相同的配置重新执行一次。 通过查询作业详情API和重新执行作业的API可完成对任务状态的监控,并且可以根据任务状态决定是否需要重新执行任务。 以上功能,我们也可以使用数据治理中心 DataArts
户推荐系统的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。 默认选择初始格式 时间选择 时间选择包括数据时间和行为时间跨度。 数据时间:用于匹配在起始时间和终止时间内的行为数据。 行为时间跨度:指定历史行为时间段,
数据源类型有初始格式和通用格式可以选择。 “初始格式” 用户操作行为表:初始数据中的用户操作行为表。 “通用格式” 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。
在使用RES之前,首先您需要创建一个数据源,后续的操作都是基于您创建的数据源进行的。 创建离线数据源 上传实时数据(可选) RES通过SDK上传实时数据,进行数据计算和处理,更新用户的相关数据。 上传实时数据 数据质量管理 数据质量管理操作可以将数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。 数据质量管理
表1 参数说明 参数 说明 名称 工作空间名称。例如,工作空间workspace1。 名称不能为空。 名称不超过64个字符,只能由中文、英文字母、数字、下划线、中划线组成,且不能使用任何大小写形式的“default”。 描述 工作空间描述。例如,我的第一个工作空间。 描述不超过256个字符。
物品的类型。 是 itemId String 对应行为发生的对象的值。如果是和物品发生关系,则是物品的id(itemId)的值。 是 actionType String 行为类型,包括正向行为和负向行为。下面为预置的行为类型和对应的权重,权重有默认分数,默认分数代表该行为类型的权重,可做修改。同时支持自定义行为类型。