-
场景描述 - 可信智能计算服务 TICS
某企业A在进行新客户营销时的成本过高,想要通过引入外部数据的方式提高营销的效果,降低营销成本。 因此企业A希望与某大数据厂商B展开一项合作,基于双方共有的数据进行联邦建模,使用训练出的联邦模型对新数据进行联邦预测,筛选出高价值的潜在客户,再针对这些客户进行定向营销,达成提高营销效果、降低营销成本的业务诉求。
-
场景描述 - 可信智能计算服务 TICS
某企业A在进行新客户营销时的成本过高,想要通过引入外部数据的方式提高营销的效果,降低营销成本。 因此企业A希望与某大数据厂商B展开一项合作,基于双方共有的数据进行联邦建模,使用训练出的联邦模型对新数据进行联邦预测,筛选出高价值的潜在客户,再针对这些客户进行定向营销,达成提高营销效果、降低营销成本的业务诉求。
-
场景描述 - 可信智能计算服务 TICS
某企业A在进行新客户营销时的成本过高,想要通过引入外部数据的方式提高营销的效果,降低营销成本。 因此企业A希望与某大数据厂商B展开一项合作,基于双方共有的数据进行联邦建模,使用训练出的联邦模型对新数据进行联邦预测,筛选出高价值的潜在客户,再针对这些客户进行定向营销,达成提高营销效果、降低营销成本的业务诉求。
-
空语句 - 可信智能计算服务 TICS
空语句 在PL/SQL程序中,可以用NULL语句来表示“不用做任何事情”,相当于一个占位符,可以使某些语句变得有意义,提高程序的可读性。 示例: DECLARE … BEGIN … IF v_num IS NULL THEN NULL; --
-
管理文件 - 可信智能计算服务 TICS
据目录进行管理。 使用文件管理功能后,创建联邦学习作业时用户可以便捷地选择自己以前上传的执行脚本、训练模型、数据文件、权重参数文件,极大地提高了系统的易用性及可维护性。 创建文件 用户登录TICS控制台。 进入TICS控制台后,单击页面左侧“计算节点管理”,进入计算节点管理页面。
-
简介 - 可信智能计算服务 TICS
简介 目前业界的关系型数据库都参照ANSI/ISO国际SQL标准基础,本文也不例外,参考标准SQL,是标准SQL的子集。 本规范以提高可读性和代码质量为原则,强调实用性、可操作性,对RTD产品的数据库的开发、设计、SQL进行约束。 本规范采用以下的术语描述: 规则:编程时强制必须遵守的原则。
-
应用场景 - 可信智能计算服务 TICS
与个人隐私。 优势: 原始数据不出企业安全域、不出库,实现“数据不动、算法动”,数据使用自主可控。 联合多方正样本的效果,丰富模型的特征,提高模型的泛化能力。 计算全程保障企业数据安全与个人隐私。 图2 金融联合营销 使能数据交易 传统数据交易方式,交易的是数据所有权,交易完成后
-
概述 - 可信智能计算服务 TICS
方无需登录后台手动导入模型文件,通过该功能即可将模型文件上传到数据目录,并支持批量删除。在创建联邦学习作业时可以选到上传的脚本模型等文件,提高了易用性及可维护性。 使用场景:管理联邦学习作业所需的脚本、模型、权重文件。 父主题: 可信联邦学习作业
-
设计规范 - 可信智能计算服务 TICS
分区表上尽量使用本地索引,在检索的时候where条件中尽量带上分区键,通过分区键缩小检索的范围。 合理的设计分区表的表空间,通过表空间和LUN可以在物理层面上隔离数据,提高并行度,降低资源竞争。 父主题: 变量&规则开发指导
-
创建作业 - 可信智能计算服务 TICS
runtime.filter:是否启用两表id初筛机制。配置为“true”后,在执行SQL join前会默认通过ID字段前8位明文来初筛过滤数据,提高join效率。对数据安全要求较高的场景下,建议配置为“false”。 secret.share.decimal.precision.len
-
执行作业 - 可信智能计算服务 TICS
定义每棵决策树的深度,根节点为第一层。取值范围为1~10的整数。 切分点数量 定义每个特征切分点的数量,数量越多,准确率越高,计算时间越长。取值范围为5~10的整数。 分类阈值 区分正负例的得分阈值。 逻辑回归/FiBiNET 学习率 控制权重更新的幅度,影响训练收敛速度和模型精度,取值范围为0~1。 迭代次数 完成全部样本训练的次数,取值为正整数。
-
创建纵向联邦学习作业 - 可信智能计算服务 TICS
训练数据集上的表现。 评估作业需要选择和训练数据集数据结构相同的两方数据集,以保证评估的正常进行。 模型评估指标包括准确率/AUC/KS/F1/召回率/精确率,取值范围均在0~1之间。AUC和F1作为综合评估指标,值越大说明训练出的模型越好。 图13 发起评估 父主题: 可信联邦学习作业
-
排版规范 - 可信智能计算服务 TICS
COLUMN4 = VALUE ORDER BY COLUMN2; 注:ORDER BY、GROUP BY等具有两个关键的子句,只需要第一个关键字(ORDER、GROUP)和其它关键字左对齐即可。 建议3:避免将SQL语句写到同一行,建议在关键字和谓词处换行。 建议4:缩进统一为4个空格,不建议使用TAB键。
-
隐私规则防护 - 可信智能计算服务 TICS
LEAGUE_CREATOR.tax a join ZZZZZZ.power_data b on a.id = b.id TICS会识别并提示。 图4 执行失败告警 上述隐私规则,均为TICS系统提供的默认规则。 父主题: 可验证代码示例
-
RTDService日志介绍 - 可信智能计算服务 TICS
“<原有日志名>-<yyyy-mm-dd_hh-mm-ss>.[编号].log.zip”。默认一天保留最近的10个压缩文件,可通过log4j.properties文件中配置参数“appender.all.strategy.max”的值设置保留文件个数。 表1 RTD日志列表 日志类型
-
阶段二:隐私规则防护 - 可信智能计算服务 TICS
LEAGUE_CREATOR.tax a join ZZZZZZ.power_data b on a.id = b.id TICS会识别并提示。 图4 执行失败告警 上述隐私规则,均为TICS系统提供的默认规则。 父主题: 基于TICS实现端到端的企业积分查询作业
-
数据准备 - 可信智能计算服务 TICS
集随机划分为三个大小类似的部分:(1)xx医院的训练集;(2)其他机构的训练集;(3)独立的测试集,用于准确评估横向联邦学习得到的模型准确率。此外由于原始的数据集较小,采用了Imbalanced-Learn中的SMOTE算法,进行了数据集的扩充。下表为扩充过后的数据集统计信息。 乳腺癌数据集统计信息。
-
筛选特征 - 可信智能计算服务 TICS
iv值没有区分性会造成训练资源的浪费,过高的iv值又过于突出可能会过度影响训练出来的模型。 例如这里大数据厂商提供的f4特征iv值是0,说明这个特征对于标签的识别没有区分度,可以不选用;而f0、f2特征的iv值中等,适合作为模型的训练特征。 根据计算得出的iv值,企业A调整了训练
-
发起联邦预测 - 可信智能计算服务 TICS
当只有一方提供特征时,预测的结果如下,第一列是用户的id,第二列是用户是否是高价值用户的标签,第三列、第四列是对应的概率: id,label,proba_0,proba_1 4e07408562bedb8b60ce05c1decfe3ad16b72230967de01f640b7e4729b49fce, 1,0.268941
-
查询联邦预测作业列表 - 可信智能计算服务 TICS
7cc4d35b789e6ff525682fa\",\"epoch\":1,\"datasets\":\"d8f0d4e0f40342f5bd631970b6d2dece.autotest_tfdata_zx_host.space_creator,f684d62317cc4d35b789e6ff525682fa