检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
、篡改文件和配置、恶意消耗容器资源等场景时,会影响到数据提供方的计算环境安全以及其他学习作业的正常执行。 针对该问题,在边缘节点部署场景中,TICS通过构建Python安全沙箱来单独运行横向联邦作业,做到作业运行的安全隔离。 验证安全沙箱防护能力 接下来模拟篡改文件的恶意行为,来验证安全沙箱防护能力。
仅当实时隐匿查询作业开启“作业是否可被授权执行”开关并审批通过后,发起方可以进行作业授权,参考创建作业和审批实时隐匿查询作业。 作业授权 在实时隐匿查询作业列表页面,查找待授权的作业,单击“更多>授权”。 图1 授权作业 在弹出的窗口中,选择需要授权的执行节点。授权成功后,被授权节点可以直接执行作业并获取作业结果。 图2
在存储、流通、计算过程中端到端的安全和可审计,推动了跨行业的可信数据融合和协同。 使用TICS的用户角色 根据人员的职能进行划分,使用TICS的用户主要可以分为以下两类。 组织方 面向熟悉业务并具有管理、决策、审核权限的管理人员。组织方具有TICS的所有权限,包括创建空间、邀请空
用于处理评估/预测数据的数据预处理作业。注意,作业中所选的数据集应为评估/预测数据集,且字段定义、尤其是分布类型的定义与之前的训练数据集相同。 单击创建的数据预处理作业后的开发按钮,进入作业开发页面。然后单击左上角的“关联历史作业”,在弹窗中选择训练数据的预处理作业后,单击“保存”。
下载计算节点配置信息 下载计算节点配置相关的信息,下载的信息可在部署计算节点的时候导入。“计算节点配置”代表“部署计算节点”属于哪个空间,用户输入的数据就会在哪个空间中参与计算。 配置信息包含证书,用于计算节点之间通信双向认证。证书保证了空间下的用户,部署的计算节点能够数据交互,参与计算。同时,也隔离了不同空间之间的数据访问。
本章节以“小微企业信用评分”场景为例。 背景信息 社保、水电气和资助金等数据统一存储在某政务云,由不同的局进行管理,机构想单独申请进行企业相关评分的计算会非常困难。 因此可以由市政数局出面,统一制定隐私规则,审批数据提供方的数据使用申请, 并通过华为TICS可信智能计算平台进行安全计算。
在申请使用界面配置使用字段及用数方的访问需求。 图2 设置使用的字段及访问的需求 支持选择访问截止时间、访问方式、访问次数。 不设置访问次数时,则不限制访问次数。 单击保存或者保存并提交审批。 在“可信数据交换 > 数据申请 > 我创建的”的页签下可以查看、编辑、删除已创建的申请。 父主题: 可信数据交换
作业发起方通过计算节点提供的控制台页面,发起多方安全计算作业。 多方安全计算作业在TICS中进行解析和任务计划构建,并下发任务给各个数据参与方所在的计算节点。 参与方计算节点从租户侧网络内的数据中获取数据,并使用安全算法进行加密输出。 数据在TICS提供的服务器中进行机密计算。 最
给计算节点。 必须确保互通的ip和端口: KrbServer的ip,以及tcp端口21730 和udp端口(21732,21731) zookeeper的ip和端口(2181) Hive-server的ip和端口(10000) MRS Manager的TCP端口(9022) 参考如下:
评估型横向联邦作业流程 基于横向联邦作业的训练结果,可以进一步评估横向联邦模型,将训练好的模型用于预测。 选择对应训练型作业的“历史作业”按钮,获取最新作业的模型结果文件路径。 图1 查看模型结果文件的保存位置 前往工作节点上步骤1展示的路径,下载模型文件。由于Logistic
管理任务 任务管理是可信智能计算服务提供的一项查看计算节点参与任务的功能。通过任务管理,用户可以查看到曾在该计算节点上执行过的所有作业,并查看自己这个计算节点在作业中的位置以及数据流向。 通过任务管理,用户可以查看自己的计算节点在空间中的作业参与度,并通过“计算过程”来确认数据是否合理、安全地被使用。
TICS基于安全隐私策略的数据安全防护会自动拒绝不合法的SQL语句执行,但当安全规则限制过强的时候,可能会影响正常业务的执行。 对此TICS 提供作业审批功能。配置生效后,所有的计算任务执行时,均会生成审批报告,提交到数据提供方侧,由提供方确认关联数据集的用途和风险。关联参与方都同意后,才能执行SQL作业。
隐私规则防护 使用TICS的隐私规则防护能力确保数据安全。 前提条件 完成数据集发布。 操作步骤 进入多方安全计算的作业执行界面,单击创建。 图1 创建作业 在作业界面中,按照示例一和示例二提供的案例和SQL语句进行作业测试。 图2 作业界面 示例一: 假设有人输入以下代码试图直接查询敏感数据。
联合多方正样本的效果,丰富模型的特征,提高模型的泛化能力。 计算全程保障企业数据安全与个人隐私。 图2 金融联合营销 使能数据交易 传统数据交易方式,交易的是数据所有权,交易完成后,数据被无限制的复制。采用可信交易方式,交易的不是数据,而是数据的使用权,卖家卖的是对某个数据的用法用量,不用担心数据被复制。
定义XGBoost算法中决策树的数量,一个样本的预测值是多棵树预测值的加权和。取值范围为1~50的整数。 树深度 定义每棵决策树的深度,根节点为第一层。取值范围为1~10的整数。 切分点数量 定义每个特征切分点的数量,数量越多,准确率越高,计算时间越长。取值范围为5~10的整数。 分类阈值 区分正负例的得分阈值。
数据预处理是训练机器学习模型的一个重要前置步骤,其主要是通过转换函数将特征数据转换成更加适合算法模型的特征数据过程。TICS特征预处理功能能够实现对数据的探索、分析、规整以及转换,以达到数据在训练模型中可使用、可实用,在TICS平台内完成数据处理到建模的闭环。 假设您有如下数据集(
数据需求方公司B在自己的计算节点页面上可以查看数据目录,找到数据拥有方公司A创建并发布的数据。 图1 创建数据申请 对数据集单击“申请使用”,在弹窗中填写需要使用的字段和访问需求,保存后可以提交审批,由公司A审核。 访问需求包括: 访问截止时间:设置访问的时间限制,超过访问时间后,对方的访问权限
在“联邦预测”页面批量预测Tab页单击“历史预测”,可以“查看结果”和“作业报告”。 “查看结果”为预测结果存储相对路径。分类作业的预测结果为0/1标签以及正负样本概率,0表示负样本,1表示正样本;回归作业的预测结果为最后的样本得分。 “作业报告”为作业的详细信息,如作业输入条件、作业输出结果、执行环境、合作方信息、计算过程等。
保证目录下至少包含一个csv文件,且所有csv文件的特征数保持一致。此外,选择数据集的原始文件,需要指定csv文件的“分隔符”、“是否包含表头”。“是否包含表头”是指文件的第一行是否是每一个字段的名称。 数据结构:配置每个字段的类别标签,包括以下几种: “字段类型”:支持BOOL
根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将TICS资源委托给更专业、高效的其他华为账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用TICS服务的其它功能。