检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
等在保护各方原始数据隐私的前提下,通过多方联合建模,金融机构补充了风控模型特征维度,提升模型准确率。 优势: 提升模型准确率 多方机构实现算法层面联合建模,提升了需求方模型的预测效果。 数据隐私保护强 多方采用隐私集合求交PSI对齐样本数据,本地数据或模型加密后在安全环境中运算,
这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。 企业A可以选择特征及标签后“启动分箱和IV计算”,通过联邦的统计算法计算出所选特征的iv值,一般而言iv值较高的特征更有区分性,应该作为首选的训练特征;过低的iv值没有区分性会造成训练资源的浪费,过高的iv
作业描述可按需填写。 勾选参与双方的数据集,同时单击右侧已选数据集的对齐列框选择需要求交集的字段信息。 对齐列只能选择非敏感的唯一标识。 选择求交算法。 选择椭圆曲线。 选择大数据量节点。 配置重试参数。开关开启后,执行失败的作业会根据配置定时进行重试,仅对开启后的执行作业生效。开关关闭
或者包含下列任何字符:\ / : * ? " < > |,长度要求在1~128之间。 algorithm_type String 纵向联邦算法类型枚举,XG_BOOST,LIGHT_BGM,LOGISTIC_REGRESSION 逻辑回归,NEURAL_NETWORK 神经网络,FIBINET
包含下列任何字符:\ / : * ? " < > |,长度要求在1~128之间。 algorithm_type 是 String 纵向联邦算法类型枚举,XG_BOOST,LIGHT_BGM,LOGISTIC_REGRESSION 逻辑回归,NEURAL_NETWORK 神经网络,FIBINET
联邦学习运行平台枚举值。LOCAL,MODEL_ARTS learning_rate String 纵向联邦算法学习率 algorithm_type String 纵向联邦算法类型枚举。 XG_BOOST, LightGBM LOGISTIC_REGRESSION 逻辑回归 NEURAL_NETWORK
实例集合 total Long 总记录数 表5 FlJobListVo 参数 参数类型 描述 algorithm_type String 纵向联邦算法类型枚举。XG_BOOSTXGBoost,LIGHT_BGMLightGBM,LOGISTIC_REGRESSION逻辑回归,NEURAL
隐私保护等级:高级别时,默认启用高安全性的隐私计算的算法保障计算过程的安全,例如秘密分享加密、PSI等,但可能会影响性能以及部分作业正常执行。低级别时,使用国际标准的对称和非对称加密结合方式,在安全沙箱内进行解密计算。性能和灵活度较高。 结果差分隐私:开启时,使用差分隐私算法对多方安全计算作业的执行结果
联邦学习运行平台枚举值。LOCAL,MODEL_ARTS learning_rate String 纵向联邦算法学习率 algorithm_type String 纵向联邦算法类型枚举。 XG_BOOST, LightGBM LOGISTIC_REGRESSION 逻辑回归 NEURAL_NETWORK
授权IAM用户使用TICS 准备数据 启用区块链审计服务(可选) 获取认证信息 空间管理 组建空间 管理空间 代理管理 部署代理 管理代理 管理数据 管理任务 管理算法 审计日志 作业管理 多方安全计算作业 可信联邦学习作业 联邦预测作业 常见问题 了解更多常见问题、案例和解决方案 热门案例 什么是区域和可用区?
3)独立的测试集,用于准确评估横向联邦学习得到的模型准确率。此外由于原始的数据集较小,采用了Imbalanced-Learn中的SMOTE算法,进行了数据集的扩充。下表为扩充过后的数据集统计信息。 乳腺癌数据集统计信息。 统计量 取值 特征数目 30 xx医院的训练样本数目 7366
agent_id 是 String 作业发起可信计算节点id,最大32位,由字母和数字组成 algorithm_type 否 String 纵向联邦算法类型枚举值。XG_BOOST,LIGHT_BGM, LOGISTIC_REGRESSION(逻辑回归),NEURAL_NETWORK,FIBINET
"dayu002", "stages" : [ { "id" : 5, "stage_name" : "执行算法阶段_5", "processors" : [ { "id" : "FiBiNetMessagePas
is_discrete Boolean 是否离散 length Integer 长度 privacy_policy String 隐私策略。HASH哈希处理,MASK掩码,NONE不处理 privacy_policy_ext String 隐私策略描述 sacle Integer 精度 sql_col_privacy_type
符:\ / : * ? " < > |,长度要求在1~128之间 ,最大值2的31次方-1 algorithm 否 String 样本对齐算法。 OPRF, SQL_JOIN; datasets 否 Map<String,String> 样本对齐数据集 align_ids 否 Map<String
以及分布图。 图4 描述性统计 执行预处理。单击列表字段后的添加预处理方法,系统将利用所选的预处理方法(转换函数)将特征数据转换成更加适合算法模型的特征数据。当前TICS支持的特征预处理方法如表1所示。对于一个字段,可以添加多种预处理方法,并且建议按照如下处理顺序进行编排: 连续
model_selection import train_test_split from sklearn.preprocessing import LabelBinarizer # 读取目录数据集,读取目录下所有CSV文件 if os.path.isdir(CSV_FILE_PATH):
“隐私保护等级”设置为高级别后,参与多方计算的字段会进行秘密分享加密。 “隐私保护等级”设置为高级别后,参与2方计算的join字段会使用psi算法输出碰撞的密文数据。 由于本地数据集不支持统计信息上报,因此本地数据集不支持差分隐私功能。 创建多方安全计算作业 用户登录进入计算节点页面。