搜索_华为云

配置Hive源端参数 - 数据治理中心 DataArts Studio

过滤及在字段映射页面添加新字段。说明：源端为Hive数据源且使用JDBC方式读取数据时，CDM不支持多并发，即后续操作中抽取并发数只能设置为1。 HDFS 使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
解绑/绑定CDM集群的EIP - 数据治理中心 DataArts Studio

解绑/绑定CDM集群的EIP 操作场景 CDM集群创建完成后，支持解绑或绑定EIP。EIP即弹性公网IP，由虚拟私有云（Virtual Private Cloud，简称VPC）负责其计费。如果CDM需要访问本地数据源、Internet的数据源，或者跨VPC的云服务，则必须要为C

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
如何降低CDM使用成本？ - 数据治理中心 DataArts Studio

如何降低CDM使用成本？如果是迁移公网的数据上云，可以使用NAT网关服务，实现CDM服务与子网中的其他弹性云服务器共享弹性IP，可以更经济、更方便的通过Internet迁移本地数据中心或第三方云上的数据。具体操作如下：假设已经创建好了CDM集群（无需为CDM集群绑定专用弹性

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
DataArts Studio数据开发作业告警最佳实践 - 数据治理中心 DataArts Studio

为“运行异常”或“失败”时，发送通知。另外可以设置作业运行异常或者失败后、在作业未修复前，告警通知的“最大通知次数”和“最小通知间隔（分钟）”。最大通知次数可设置为1~50。默认为1时，最小通知间隔不显示。最小通知间隔可设置为5~60。通知方式：根据实际需要选择，推荐选择“按主题”通知。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
配置元数据采集任务 - 数据治理中心 DataArts Studio

单击数据库（或数据库和schema、命名空间）后的“设置”，设置采集任务扫描的数据库（或数据库和schema、命名空间）范围。当不进行设置时，默认选择该数据连接下的所有数据库（或数据库和schema、命名空间）。单击数据表后的“设置”，设置采集任务扫描的数据表范围。当不进行设置时，默认选择数据库（或数据

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
配置RestApi源端参数 - 数据治理中心 DataArts Studio

spel表达式。固定值。从接口中获取：data.pageCount。说明：如果接口不是分页接口，并且只想调用一次，则将数据总数的值设置的小于或者等于每次拉取的数据。是固定值时推荐1000 父主题：配置作业源端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
SQLServer同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

MAX(单分区数据量大小(G)/2G*2，再后向上取整，1) 其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。 changelog.enabled boolean false - Hudi changelog功能

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
实例监控 - 数据治理中心 DataArts Studio

> 实例监控”。在作业所在的“操作”列，单击“重跑”设置重跑当前作业实例；或单击作业名称左边的复选框，再选择页面上方的“重跑”按钮可以批量设置多个作业的实例重跑。图1 设置单个作业重跑图2 批量设置作业重跑批量设置多个作业实例重跑时，仅需要配置重跑开始位置、使用的作业参数、是否忽略OBS监听等参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度
跨空间进行作业调度 - 数据治理中心 DataArts Studio

Dummy节点不执行任何操作，本例选择Dummy节点用于设置Dummy节点到Subjob节点之间连线的IF条件。 Subjob节点用于将需要后续执行的作业job2作为子作业引用执行。实际使用中您可以引用已有作业，也可以使用其他作业节点替代Subjob节点。作业的调度方式设置为“事件驱动调度”，DIS通道

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
IF条件判断教程 - 数据治理中心 DataArts Studio

节点和两个Dummy节点，选中连线图标并拖动，编排图1所示的作业。其中CDM节点的失败策略需要设置为“继续执行下一节点”。图2 配置CDM节点的失败策略右键单击连线，选择“设置条件”，在弹出的“编辑EL表达式”文本框中输入IF条件。每一个条件分支都需要填写IF条件，IF条

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
授权使用实时数据集成 - 数据治理中心 DataArts Studio

配置DLI云服务委托权限。搜索并进入DLI云服务控制台。在DLI控制台左侧导航栏中单击“全局配置 > 服务授权”。在委托设置页面，“管理相关委托设置”中勾选“跨源场景”权限，并单击“更新委托权限”。查看并了解更新委托的提示信息，单击“确定”。完成DLI委托权限的更新。图2

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 授权用户使用DataArts Studio
LTS数据连接参数说明 - 数据治理中心 DataArts Studio

LTS连接固定选择为LTS。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。标签否标识数据连接的属性。设置标签后，便于统一管理。说明：标签的名称，只能包含中文、英文字母、数字和下划线，不能以下划线开头，且长度不能超过100个字符。适用组件

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
DLI Spark - 数据治理中心 DataArts Studio

DLI程序包：作业执行前，会将资源包文件上传到DLI资源管理。分组设置否当“资源类型”选择了“DLI程序包”时，需要设置。可选择“已有分组”，“创建新分组”或“不分组”。组名称否当“资源类型”选择了“DLI程序包”时，需要设置。选择“已有分组”：可选择已有的分组。选择“创建新分组”：可输入自定义的组名称。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
MRS Hive SQL - 数据治理中心 DataArts Studio

选择需要执行的脚本。如果脚本未创建，请参考新建脚本和开发SQL脚本先创建和开发脚本。数据连接是默认选择SQL脚本中设置的数据连接，支持修改。数据库是默认选择SQL脚本中设置的数据库，支持修改。 MRS资源队列否选择已创建好的MRS资源队列。说明：需要先在数据安全服务队列权

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置DLI目的端参数 - 数据治理中心 DataArts Studio

car_detail 导入前清空数据选择导入前是否清空目的表的数据。如果设置为是，任务启动前会清除目标表中数据。否空字符串作为null 如果设置为true，空字符串将作为null。否清空数据方式导入前清空数据，如果设置为true时，呈现此参数。 TRUNCATE：删除标准数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
API编排典型配置 - 数据治理中心 DataArts Studio

/恢复API。设置API工作流可见：在API工作流列表页面，单击对应工作流操作栏中的“更多 > 设置可见”，即可弹出API工作流设置可见窗口。设置API工作流可见可以修改API工作流在服务目录中的可见范围。设置可见流程与API设置可见流程基本一致，可参考设置API可见。复制

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

FusionInsight LibrA过程中，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。因此，在单表或整库导入到DWS/FusionInsight

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
（可选）购买规格增量包 - 数据治理中心 DataArts Studio

“操作 > 配额使用量”，查看每个工作空间的配额使用量。设置配额使用量阈值告警购买规格增量包前，您可以设置配额使用量阈值告警。当触发告警时，表明您应当购买规格增量包，否则随着业务量增长，您的业务可能会受到影响。设置配额使用量阈值告警的操作方法如下所示：在DataArts Studio实例卡片上，单击选择“更多

 帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例
DLI Flink Job - 数据治理中心 DataArts Studio

的资源配置。管理节点CU数量是设置管理单元的CU数，支持设置1~4个CU数，默认值为1个CU。并发数是并发数是指同时运行Flink SQL作业的任务数。说明：并发数不能大于计算单元（CUs-1）的4倍。异常自动启动否设置是否启动异常自动重启功能，当作业异常时将自动重启并恢复作业。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

SQL脚本中开发完成的Hive SQL脚本“hive_sql”。数据连接：默认选择SQL脚本“hive_sql”中设置的数据连接，支持修改。数据库：默认选择SQL脚本“hive_sql”中设置的数据库，支持修改。作业编排完成后，单击，测试运行作业。如果运行成功，单击画布空白处，在右侧的“调度配置”页面，配置作业的调度策略。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程

总条数： 601

上一页
1
...
10
11
12
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Hive源端参数 - 数据治理中心 DataArts Studio

解绑/绑定CDM集群的EIP - 数据治理中心 DataArts Studio

如何降低CDM使用成本？ - 数据治理中心 DataArts Studio

DataArts Studio数据开发作业告警最佳实践 - 数据治理中心 DataArts Studio

配置元数据采集任务 - 数据治理中心 DataArts Studio

配置RestApi源端参数 - 数据治理中心 DataArts Studio

SQLServer同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

实例监控 - 数据治理中心 DataArts Studio

跨空间进行作业调度 - 数据治理中心 DataArts Studio

IF条件判断教程 - 数据治理中心 DataArts Studio

授权使用实时数据集成 - 数据治理中心 DataArts Studio

LTS数据连接参数说明 - 数据治理中心 DataArts Studio

DLI Spark - 数据治理中心 DataArts Studio

MRS Hive SQL - 数据治理中心 DataArts Studio

配置DLI目的端参数 - 数据治理中心 DataArts Studio

API编排典型配置 - 数据治理中心 DataArts Studio

CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

（可选）购买规格增量包 - 数据治理中心 DataArts Studio

DLI Flink Job - 数据治理中心 DataArts Studio

开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线