检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据准备 以下数据和表结构是根据场景进行模拟的数据,并非真实数据。 以下数据需要提前存导入到MySQL\Hive\Oracle等用户所属数据源中,TICS本身不会持有这些数据,这些数据会通过用户购买的计算节点进行加密计算,保障数据安全。 政府信息提供方的数据tax和support,在用户计算节点agent_gov上发布。
任务管理是可信智能计算服务提供的一项查看计算节点参与任务的功能。通过任务管理,用户可以查看到曾在该计算节点上执行过的所有作业,并查看自己这个计算节点在作业中的位置以及数据流向。 通过任务管理,用户可以查看自己的计算节点在空间中的作业参与度,并通过“计算过程”来确认数据是否合理、安全地被使用。 用户登录TICS控制台。
概述 基于数据胶囊技术,将用户配置属性嵌入到数据加密策略中,只有匹配属性的用户才能打开文件,达到数据出域后仍然主权可控的目的。 进行数据交换的角色分为用数方和供数方,用数方通过发送申请传递数据使用需求;供数方确认使用需求后,创建合约发送到供数方进行签署,一旦合约生效,数据交换作业就可以执行。
在“联邦预测”页面,选择实时预测的Tab页,单击创建。 图1 创建作业 在弹出的对话框中编辑“作业名称”,选择“算法类型”。 选择“算法类型”之后,勾选“选择训练作业”列表中的某一训练作业,然后勾选“选择模型”列表中对应模型,再勾选”选择数据集”列表中参与方预测要用的某一数据集,最后单击“保存并提交审批”按钮
方式调用TICS API,端到端执行分析型作业为例,介绍使用TICS API的基本流程。 获取用户token 获取用户的token,因为在后续的请求中需要将token放到请求消息头中作为认证。 获取可信节点详情 获取调用后续接口参数信息,例如可信节点id。 创建连接器 创建数据连接器,以MySQL类型为例。
空间成员完成计算节点部署,配置参数时选择存储方式和数据目录,参考4.1 部署计算节点。 空间成员完成数据集准备工作,参考准备本地横向联邦数据资源。 空间成员在数据目录中完成数据发布,参考4.6.4 发布数据。 对接MA的计算节点如果是使用子账号进行创建的,需要参考配置CCE集群子账号权限给子账号增加“管理员权限”配置。
作业、任务状态。作业任务状态,NEW新建,SUBMITING提交中,ACCEPTED已接收,DEPLOYING部署中,RUNNING运行中,SUCCEEDED成功,FAILED失败,TERMINATED中止,TERMINATING中止中,PENDING等待中 状态码: 401 表6 响应Body参数 参数
config_file_path 否 String 配置文件地址 auto_generate_data 否 Boolean 是否自动生成数据,即纵向联邦学习样本对齐之后的流程是否使用样本对其结果自动过滤。 ext 否 LocalDatasetExtEntity object 扩展信息,包含multiho
执行脚本 用户本地的自定义执行脚本,样例请参考准备本地横向联邦数据资源中步骤4。 训练模型 用户自定义模型,样例请参考准备本地横向联邦数据资源中步骤3。 初始权重参数 模型的初始权重,样例请参考准备本地横向联邦数据资源中步骤3。 迭代次数 即epoch,数据将会被执行的次数。评估型作业的迭代次数固定为1。
换函数将特征数据转换成更加适合算法模型的特征数据过程。TICS特征预处理功能能够实现对数据的探索、分析、规整以及转换,以达到数据在训练模型中可使用、可实用,在TICS平台内完成数据处理到建模的闭环。 假设您有如下数据集(只展示部分数据),由于数据不够完整,如job、gender等
图4 样本粗筛 (可选步骤) 样本对齐,支持使用新对齐的结果,如图5所示;也支持复用隐私求交作业中通过这两个数据集计算得到的结果,如图6所示。 图5 使用新对齐结果 图6 复用隐私求交作业中的结果 (可选步骤)进行特征选择,此步骤要求数据已经对齐,即两方数据集每一行的数据都是一一对应的。
前提条件 空间组建完成,参考组建空间。 空间成员完成计算节点部署,配置参数时选择挂载方式和数据目录,参考部署计算节点。 空间成员在计算节点中完成数据发布,参考发布数据。 约束限制 避免作业名重复。 支持本地连接器配置的数据交换类型文件。 只可以申请使用非己方的数据。 创建数据交换作业
用户本地的自定义执行脚本,样例请参考准备本地横向联邦数据资源中步骤4。 训练模型 用户自定义模型,样例请参考准备本地横向联邦数据资源中步骤3。 初始权重参数 评估时必填,训练时可选,样例请参考准备本地横向联邦数据资源中步骤3。 迭代次数 即epoch,数据迭代计算的次数。 训练轮数
在节点A上执行如下命令启动定时同步任务。 crontab -e 在弹出的编辑框中输入。 */1 * * * * /opt/tics/sync_tics.sh 保存后退出。 在节点B上重复步骤3~步骤4操作,注意步骤3中脚本内容应替换为对端节点A的ip。 使用tail /var/log/cron
个配额参数的值为创建新容器的CPU核数和内存大小,默认CPU核数为1,内存大小512M。 然后勾选“选择训练作业”列表中的某一训练作业,然后勾选“选择模型”列表中对应模型,最后单击“确定”按钮完成作业创建。 参数配置完成后,单击确认,完成批量预测任务的创建。 父主题: 批量预测
在“实时隐匿查询”作业页面中,单击“创建”。 图1 创建作业 在作业创建页面中输入作业名称,选择不可区分度,根据个人需求选择作业是否可被授权执行开关,并填写描述信息。 不可区分度是指数据方无法从该数量级中区分出具体的查询值,例如百级不可区分度说明数据方不知道查询方具体查询了百级数量级中哪一条数据。
在节点A上执行如下命令启动定时同步任务。 crontab -e 在弹出的编辑框中输入。 */1 * * * * /opt/tics/sync_tics.sh 保存后退出。 在节点B上重复步骤3~步骤4操作,注意步骤3中脚本内容应替换为对端节点A的ip。 使用tail /var/log/cron
IEF(非云上IEF节点不支持接入Hive)在同一VPC。“用户名”为MRS集群中拥有Hive权限的集群用户,“用户认证凭据”需要上传对应用户的认证凭据,请在MapReduce服务的下载用户认证文件中获取。 “连接器类型”选择RDS服务时,所选择的RDS服务实例需与计算节点在同一
机构内数据统一共享的基础上实现了覆盖业务前、中、后各环节的智能风控。然而,单方数据风控面临存在数据不全面、风控不及时的问题。随着隐私计算等技术为数据要素的有效流通提供了必要手段,多方数据联合风控成为新趋势。其中,黑名单共享查询是风控中的一个重要环节,企业间的黑名单共享能有效发挥风险联防联控效用。
例如查询id为“19581e27de7ced00ff1ce50b2047e7a567c76b1cbaebabe5ef03f7c3017bb5b7”这样的一条数据,查询结果中即会返回企业A所选择的企业B的数据字段。 同时企业A的业务系统后台也可以通过API调用的方式调用企业A计算节点的接口发起实时隐匿查询,更好地服务生产业务。