搜索_华为云

Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

分区表桶数 = MAX(单分区数据量大小(G)/2G*2，再后向上取整，1)。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
管理动态水印策略 - 数据治理中心 DataArts Studio

选择敏感数据所在的数据库。 *数据表选择敏感数据所在的数据表。单击“确定”，完成动态水印策略创建。相关操作水印提取：获得从数据开发下载的动态水印CSV数据文件后，参考水印提取进行水印溯源。配置策略：在动态水印页面，单击对应任务操作栏中的“配置”，即可配置动态水印策略。编辑策略状态：新增的水印

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护
配置环境变量 - 数据治理中心 DataArts Studio

管理 > 配置”。单击“环境变量”，在“环境变量配置”页面，选择“导入”。在导入环境变量对话框中，选择已上传至OBS或者本地的环境变量文件，以及重命名策略。图1 导入环境变量导出环境变量参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
数据安全概述 - 数据治理中心 DataArts Studio

敏感数据识别通过用户创建或内置的数据识别规则和规则组自动发现敏感数据并进行数据分级分类标注。隐私保护管理隐私保护管理可以通过数据静态脱敏、动态脱敏、数据水印、文件水印和动态水印等方式来防止敏感数据遭到有意或无意的误用、泄漏或盗窃，从而帮助企业采取合理措施来保护其敏感数据的机密性和完整性、可用性。数据安全运营

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全
编排API简介 - 数据治理中心 DataArts Studio

编排API简介数据服务API编排是指将已经开发好的服务API接口，在无需编写复杂代码的情况下，根据特定的业务逻辑和流程进行可视化的重组和重构，从而实现在不影响原生接口的前提下进行简便的二次开发。API编排为您提供拖拽式、可视化的API工作流程编排能力，您可以按照业务逻辑，以串行

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
（可选）购买规格增量包 - 数据治理中心 DataArts Studio

限。技术资产数量增量包：不同版本的DataArts Studio实例，提供了不同的技术资产数量规格限制。该规格是以数据目录中表和OBS文件的数量计算的，您可以在新商业模式的DataArts Studio实例卡片上通过“更多 > 配额使用量”查看使用量。当您的技术资产数量接近或

 帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例
通过数据开发实现数据增量迁移 - 数据治理中心 DataArts Studio

获取CDM作业的JSON 修改JSON 创建DLF作业获取CDM作业的JSON 进入CDM主界面，创建一个DWS到OBS的表/文件迁移作业。在CDM“作业管理”界面的“表/文件迁移”页签下，找到已创建的作业，单击作业操作列的“更多 > 查看作业JSON”，如图1所示。您也可以使用其它已创建好的CDM作业JSON。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
通过数据开发使用参数传递灵活调度CDM作业 - 数据治理中心 DataArts Studio

在“连接管理”页签中，单击“新建连接”，分别创建Oracle数据连接和MRS Hive数据连接，详情请参见新建Oracle数据连接和新建MRS Hive数据连接。在“表/文件迁移”页签中，单击“新建作业”，创建数据迁移作业。配置Oracle源端参数、MRS hive目的端参数，并配置传递参数，参数形式为 ${

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
Go - 数据治理中心 DataArts Studio
Go - 数据治理中心 DataArts Studio

生成一个新的Signer，输入AppKey和AppSecret。 // 认证用的ak和sk编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； // 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量SDK_AK和SDK_SK。

帮助中心 > 数据治理中心 DataArts Studio > SDK参考 > 数据服务SDK参考 > 使用APP认证调用API
PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

在源数据库的“pg_hba.conf”配置文件的所有配置前增加一行配置“host replication <src_user_name> <drs_instance_ip>/32 <认证方式>”；认证方式可参考PostgreSQL官方文档pg_hba.conf文件配置，常见的认证方式有scram-sha-256等。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
修改作业 - 数据治理中心 DataArts Studio

作业列表，请参见jobs数据结构说明。表4 Job 参数是否必选参数类型描述 job_type 是 String 作业类型： NORMAL_JOB：表/文件迁移。 BATCH_JOB：整库迁移。 SCENARIO_JOB：场景迁移。 from-connector-name 是 String 源端连接类型，对应的连接参数如下：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
指定集群创建作业 - 数据治理中心 DataArts Studio

作业列表，请参见jobs数据结构说明。表4 Job 参数是否必选参数类型描述 job_type 是 String 作业类型： NORMAL_JOB：表/文件迁移。 BATCH_JOB：整库迁移。 SCENARIO_JOB：场景迁移。 from-connector-name 是 String 源端连接类型，对应的连接参数如下：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
元数据实时同步接口(邀测) - 数据治理中心 DataArts Studio

元数据实时同步接口(邀测) 功能介绍元数据实时同步接口，支持批量。该接口功能处于邀测阶段，后续将随功能公测将逐步开放。调用方法请参见如何调用API。 URI POST /v1/{project_id}/metadata/async-bulk 表1 路径参数参数是否必选参数类型

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据目录API > 数据地图接口
CDM Job - 数据治理中心 DataArts Studio

节点执行失败后，是否重新执行节点。是：重新执行节点，请配置以下参数。最大重试次数重试间隔时间（秒）否：默认值，不重新执行节点。说明：建议仅对文件类作业或启用了导入阶段表的数据库作业配置自动重试，避免自动重试重复写入数据导致数据不一致。如果调度CDM迁移作业时使用了参数传递，不能在

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
DataArts Studio数据开发作业告警最佳实践 - 数据治理中心 DataArts Studio

单击作业目录中的，选择“显示复选框”。图1 显示作业复选框勾选需要配置失败重试的作业，单击 > 作业配置，进入作业配置窗口。对于CDM Job作业，建议仅选择文件类的CDM Job作业或启用了导入阶段表的数据类CDM Job作业。未启用导入阶段表的数据类CDM Job作业可能因作业失败重试引起数据重复写入，导致迁移前后的数据不一致。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
MRS Hetu数据连接参数说明 - 数据治理中心 DataArts Studio

WebUI界面，给计算实例添加如下自定义参数：参数名为“protocol.v1.alternate-header-name”，值为“Presto”，参数文件为“coordinator.config.properties”和“worker.config.properties”。注意，通过输入框

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
随机集群创建作业并执行 - 数据治理中心 DataArts Studio

作业并执行作业。表4 Job 参数是否必选参数类型描述 job_type 是 String 作业类型： NORMAL_JOB：表/文件迁移。 BATCH_JOB：整库迁移。 SCENARIO_JOB：场景迁移。 from-connector-name 是 String 源端连接类型，对应的连接参数如下：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
配置实时集成作业 - 数据治理中心 DataArts Studio

配置实时集成作业完成数据连接、网络、资源组等准备工作的配置后，您可创建并配置实时集成作业，将多种输入及输出数据源搭配组成同步链路，进行数据的实时同步。前提条件已开通华为账号，并授权使用实时数据集成服务，详情请参考注册华为账号并开通华为云和授权使用实时数据集成。已购买资源组，详情请参见购买数据集成资源组。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

分区表桶数 = MAX(单分区数据量大小(G)/2G*2，再后向上取整，1)。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
步骤2：数据开发处理 - 数据治理中心 DataArts Studio

步骤2：数据开发处理本步骤通过BI报表原始数据，分析10大用户关注最多的产品和10大用户评价最差的商品，然后通过作业定期调度执行并将结果每日导出到表中，以支撑信息分析。分析10大用户关注最多的产品在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程

总条数： 466

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

管理动态水印策略 - 数据治理中心 DataArts Studio

配置环境变量 - 数据治理中心 DataArts Studio

数据安全概述 - 数据治理中心 DataArts Studio

编排API简介 - 数据治理中心 DataArts Studio

（可选）购买规格增量包 - 数据治理中心 DataArts Studio

通过数据开发实现数据增量迁移 - 数据治理中心 DataArts Studio

通过数据开发使用参数传递灵活调度CDM作业 - 数据治理中心 DataArts Studio

Go - 数据治理中心 DataArts Studio

PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

修改作业 - 数据治理中心 DataArts Studio

指定集群创建作业 - 数据治理中心 DataArts Studio

元数据实时同步接口(邀测) - 数据治理中心 DataArts Studio

CDM Job - 数据治理中心 DataArts Studio

DataArts Studio数据开发作业告警最佳实践 - 数据治理中心 DataArts Studio

MRS Hetu数据连接参数说明 - 数据治理中心 DataArts Studio

随机集群创建作业并执行 - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

步骤2：数据开发处理 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线