搜索_华为云

数据服务简介 - 数据治理中心 DataArts Studio

的重组和重构，从而实现在不影响原生接口的前提下进行简便的二次开发。（可选）配置流控策略为了保护后端服务的稳定的考虑，您可以对API进行流量控制。（可选）主动授权API 应用定义了一个API调用者的身份。对于使用APP或IAM认证方式的API，必须在API授权后，才能获得认证信息以用于API调用。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务
简易变量集参考 - 数据治理中心 DataArts Studio

ss：表示秒，取值为计划时间的秒。取N小时前、N分钟前的时间数据请参考表2，该参数不支持通过$[yyyy-N]、$[mm-N]等直接获取多少年前、多少月前的时间数据。表2 计划时间参数获取说明计划时间场景获取方法后N年 $[add_months(yyyymmdd,12*N)]

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
数据集成（CDM作业） - 数据治理中心 DataArts Studio

如何查看套餐包的剩余时长？ CDM可以跨账户使用吗？ CDM集群是否支持升级操作？ CDM迁移性能如何？ CDM不同集群规格对应并发的作业数是多少？是否支持增量迁移？是否支持字段转换？ Hadoop类型的数据源进行数据迁移时，建议使用的组件版本有哪些？数据源为Hive时支持哪些数据格式？

帮助中心 > 数据治理中心 DataArts Studio > 常见问题
配置实时集成作业 - 数据治理中心 DataArts Studio

同步模式数据源通用同步模式：增量同步：从指定时间位点开始同步增量数据。全量+增量：先同步全量数据，随后实时同步增量数据。 Kafka数据源专用同步模式：最早：从Kafka Topic最早偏移量开始消费数据。最新：从Kafka Topic最新偏移量开始消费数据。起止时间：根据时间获取Kafka

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
区域和可用区如何选择？ - 数据治理中心 DataArts Studio

Region，通用Region指面向公共租户提供通用云服务的Region；专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。可用区（AZ，Availability Zone）是同一区域内，电力和网络互相隔离的物理区域，一个可用区不受其他可用区故障

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
查询集群列表 - 数据治理中心 DataArts Studio

组件分组id。 publicIp String 公网ip。 manageIp String 管理ip。 trafficIp String 流量ip。 shard_id String 分片id。 manage_fix_ip String 管理修复ip。 private_ip String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
查询集群详情 - 数据治理中心 DataArts Studio

组件分组id。 publicIp String 公网ip。 manageIp String 管理ip。 trafficIp String 流量ip。 shard_id String 分片id。 manage_fix_ip String 管理修复ip。 private_ip String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
配置MySQL源端参数 - 数据治理中心 DataArts Studio

分字段”的最大值。 - 子作业个数 “拆分作业”选择“是”时，显示该参数，根据“作业拆分字段”的最小值和最大值限定的数据范围，将作业拆分为多少个子作业执行。 - 按表分区抽取从MySQL导出数据时，支持从分区表的各个分区并行抽取数据。启用该功能时，可以通过下面的“表分区”参数指定具体的MySQL表分区。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置YASHAN源端参数 - 数据治理中心 DataArts Studio

分字段”的最大值。 - 子作业个数 “拆分作业”选择“是”时，显示该参数，根据“作业拆分字段”的最小值和最大值限定的数据范围，将作业拆分为多少个子作业执行。 - 父主题：配置CDM作业源端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
查询集群详情信息 - 数据治理中心 DataArts Studio

"flavor" : { "id" : "95d4e992-6e3c-11ea-8e90-fa163e35", "name" : "测试专用小规格(X86)", "disk" : 120, "cpu" : 8, "mem" : 16 }, "gateway_version"

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > 集群管理接口
查询集群详情信息列表 - 数据治理中心 DataArts Studio

{ "id" : "95d4e992-6e3c-11ea-8e90-fa163e35", "name" : "测试专用小规格(X86)", "disk" : 120, "cpu" : 8, "mem" : 16 }

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > 集群管理接口
指标定义 - 数据治理中心 DataArts Studio

描述设置该指标的目的。例如：用于衡量地区的商场经营效益，支撑商业决策。 *业务定义描述该指标的业务定义。例如：在某一地区，每坪的经营面积可以产出多少营业额。备注根据实际需要填写备注信息。配置指标数据信息。图3 指标数据信息表2 指标数据信息参数参数说明说明 *计算公式定

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据指标 > 指标设计
配置PostgreSQL/SQL Server源端参数 - 数据治理中心 DataArts Studio

分字段”的最大值。 - 子作业个数 “拆分作业”选择“是”时，显示该参数，根据“作业拆分字段”的最小值和最大值限定的数据范围，将作业拆分为多少个子作业执行。 - 父主题：配置CDM作业源端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置Oracle源端参数 - 数据治理中心 DataArts Studio

分字段”的最大值。 - 子作业个数 “拆分作业”选择“是”时，显示该参数，根据“作业拆分字段”的最小值和最大值限定的数据范围，将作业拆分为多少个子作业执行。 - Oracle作为源端时，如果未配置“抽取分区字段”或者“按表分区抽取”这2个参数，CDM自动使用ROWID进行数据分区。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
支持的数据类型 - 数据治理中心 DataArts Studio

长度：长度为8字节的浮点类型。范围：-1.79E+308 ~ +1.79E+308。 DECIMAL[M， D] 保证精度的小数类型。M代表一共有多少个有效数字，D代表小数点后最多有多少数字。M的范围是[1，27]，D的范围是[1，9]，另外，M必须要大于等于D的取值。默认取值为decimal[10，0]。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
查看作业实例 - 数据治理中心 DataArts Studio

建的时间越近。类型显示作业类型，当前包含质量作业和对账作业。运行状态展示实例运行状态，包含成功、失败和运行中、告警。右侧弹窗分选项卡可查看规则实例的详细运行日志信息。成功：表示实例正常结束，且执行结果符合预期。失败：表示实例未正常结束。告警：表示实例正常结束，但执行结果不符合预期。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

时表作为导入的目标表，待导入成功后再改名或合并到最终数据表。 0 开启限速设置限速可以保护源端读取压力，速率代表CDM传输速率，而非网卡流量。说明：支持对非二进制文件迁移的作业进行单并发限速。如果作业配置多并发则实际限制速率需要乘以并发数。文件到文件的二进制传输不支持限速功能。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

CDM迁移近一个月的数据备HBase集群中约10TB数据，最近一个月新增的数据量约60TB，总共约70TB。H公司安装的云专线为20GE端口，支持CDM超大规格的集群（cdm.xlarge），综合考虑迁移时间、成本、性能等，这里使用2个CDM超大规格集群并行迁移。CDM集群规格如表1所示。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

SQLServer到MRS Hudi参数调优源端优化 SQLServer抽取优化暂无优化配置项。目的端优化 Hudi写入优化 Hudi表写入性能慢，优先审视表设计是否合理，建议使用Hudi Bucket索引的MOR表，并根据实际数据量配置Bucket桶数，以达到Migration写入性能最佳。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

Oracle到MRS Hudi参数调优源端优化 Oracle抽取优化暂无优化配置项。目的端优化 Hudi写入优化 Hudi表写入性能慢，优先审视表设计是否合理，建议使用Hudi Bucket索引的MOR表，并根据实际数据量配置Bucket桶数，以达到Migration写入性能最佳。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优

总条数： 78

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据服务简介 - 数据治理中心 DataArts Studio

简易变量集参考 - 数据治理中心 DataArts Studio

数据集成（CDM作业） - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

区域和可用区如何选择？ - 数据治理中心 DataArts Studio

查询集群列表 - 数据治理中心 DataArts Studio

查询集群详情 - 数据治理中心 DataArts Studio

配置MySQL源端参数 - 数据治理中心 DataArts Studio

配置YASHAN源端参数 - 数据治理中心 DataArts Studio

查询集群详情信息 - 数据治理中心 DataArts Studio

查询集群详情信息列表 - 数据治理中心 DataArts Studio

指标定义 - 数据治理中心 DataArts Studio

配置PostgreSQL/SQL Server源端参数 - 数据治理中心 DataArts Studio

配置Oracle源端参数 - 数据治理中心 DataArts Studio

支持的数据类型 - 数据治理中心 DataArts Studio

查看作业实例 - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线