检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
计算。 图1 企业信用评估应用场景示意图 数据准备 以下数据和表结构是根据场景进行模拟的数据,并非真实数据。 以下数据需要提前存导入到MySQL\Hive\Oracle等用户所属数据源中,TICS本身不会持有这些数据,这些数据会通过用户购买的计算节点进行加密计算,保障数据安全。
行日志。 连接器(Connector) 连接器是可信智能计算节点内置的连接特定数据源所需的对象模板,目前支持连接MRS Hive、MySQL、RDS、DWS、ORACLE等多种连接器,并支持扩展增加新的连接器。 数据集(Data set) 数据集为计算节点获取并配置的合作方数据的元数据信息,以及附加其上的隐私策略。
否 String 连接器类型,主要分为多方安全计算连接器和可信联邦学习连接器。 多方安全计算连接器 MRS, RDS_MYSQL, DWS, JDBC, MYSQL, ORACLE, 可信联邦学习连接器 LOCAL 请求参数 表2 请求Header参数 参数 是否必选 参数类型
是否必选 参数类型 描述 dataset_type 是 String 数据集类型,按照传入枚举类型,返回所属作业类型的数据集。例如:传入MYSQL,返回分析作业可用的数据集;传入LOCAL_CSV,返回学习作业可用数据集 agent_id 否 String 可信计算节点id,最大32位,由字母和数字组成
必填。参数类型为INT类型。起始位置为1(起始位置0作1处理)。当start为负数时,表示开始位置是从字符串的尾部向前倒数。推荐start从1开始,负数及0在不同数据库中表现不同。 length:选填。参数类型为INT类型。表示子串的长度。值必须大于0。 返回STRING类型。 BASE64_ENCODE
“数据配置文件”的“可选数据列表”: LOCAL运行环境,展示的是通过本地连接器发布的本地数据。 “训练型作业”同一个计算节点只能选一个数据集,但是一个作业必须要选两个及两个以上的数据集才能做训练。 表1 作业参数说明 参数名 参数描述 作业名称 用户自定义作业的名称,只能包含英文字母、数字、中文、“-”、“_”、“
步骤7:空间成员创建作业 创建多方安全计算作业 空间成员登录进入计算节点页面。 在左侧导航树上依次选择“作业管理 > 多方安全计算”,在页面上方选择作业创建的空间后,单击“创建”。 图1 创建多方安全计算作业 在弹出的对话框中,输入作业“名称”和“描述”信息后单击“确定”。 图2
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,例如双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float
业文件。如果不填写,用户在访问截至时间前无限次访问。 图2 设置使用的字段及访问的需求 单击保存或者保存并提交审批。 在“可信数据交换 > 数据申请 > 我创建的”的页签下可以查看、编辑、删除已创建的申请及对应的状态。 图3 已创建的申请 父主题: 可信数据交换场景
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
使用文件管理功能后,创建联邦学习作业时用户可以便捷地选择自己以前上传的执行脚本、训练模型、数据文件、权重参数文件,极大地提高了系统的易用性及可维护性。 创建文件 用户登录TICS控制台。 进入TICS控制台后,单击页面左侧“计算节点管理”,进入计算节点管理页面。 在“计算节点管理
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
管理空间 查看空间详情 空间发起人登录TICS控制台。 进入TICS控制台后,单击页面左侧“空间管理”,进入空间管理页面。 在“空间管理”页打开“我参与的空间”页签,单击“空间名称”进入详情页。 查看空间统计信息 在详情页下方单击“空间概览”页签查看空间统计信息,该统计信息不是实时的,当前只显示统计到前一天的数据。
筛选特征 样本对齐执行完成后单击下一步进入“特征选择”页面,这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。 企业A可以选择特征及标签后“启动分箱和IV计算”,通过联邦的统计算法计算出所选特征的iv值,一般而言iv值较高的特征更有区分性,应该作为首选的训练
创建横向评估型作业 前提条件 空间组建完成,参考组建空间。 空间成员完成计算节点部署,配置参数时选择挂载方式和计算节点,参考部署计算节点。 空间成员完成数据集准备工作,参考准备本地横向联邦数据资源。 空间成员在计算节点中完成数据发布,参考发布数据。 约束限制 仅IEF计算节点支持创建横向评估型作业。
横向联邦训练作业对接MA 前提条件 MA Lite资源池已创建完毕。 空间组建完成,参考组建空间。 空间成员完成计算节点部署,配置参数时选择存储方式和数据目录,参考4.1 部署计算节点。 空间成员完成数据集准备工作,参考准备本地横向联邦数据资源。 空间成员在数据目录中完成数据发布,参考4