搜索_华为云

查看并修改CDM集群配置 - 数据治理中心 DataArts Studio

无法查看、操作该集群中的迁移作业和连接。按组批量启动作业会运行组内所有作业。如果开启了用户隔离功能，即使华为账号下的其他IAM用户无法查看到组内作业，按组批量启动作业依然会将组内作业运行，因此在用户隔离场景不建议使用按组批量启动作业功能。关闭该功能时，该集群中的迁移作业、连接

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
配置数据入湖检测规则（高级特性） - 数据治理中心 DataArts Studio

约束与限制数据集成（离线作业）的表数据迁移和数据安全敏感数据发现中的推荐识别场景下，仅支持MRS Hive、DWS、DLI和RDS MySQL数据源。数据集成（离线作业）的表敏感数据检测对表内容格式要求如下：表字段数量至多为500。对于字符串类型的表字段，仅会检测前1

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
如何配置Hudi Compaction的Spark周期任务？ - 数据治理中心 DataArts Studio

automatic false Hudi commit文件老化的开关图1 关闭Migration compaction任务如上配置项配置完成后，作业启动后不再进行compaction任务，只会定期生成compaction计划，Spark SQL作业可以通过“run compaction on”命令执行compaction计划。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（实时作业）
Flink Jar作业开发指导 - 数据治理中心 DataArts Studio

优化资源使用效率，提升作业的执行性能。注意：系统支持Flink Jar作业运行前能够查询历史checkpoint，并选择从指定checkpoint启动。要使Flink Checkpoin生效，需要配置两个运行参数：用来控制checkpoint间隔 -yD：execution

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
新建作业 - 数据治理中心 DataArts Studio

实时处理作业：处理实时的连续数据，主要用于实时性要求高的场景。实时作业是由一个或多个节点组成的业务关系，每个节点可单独被配置调度策略，而且节点启动的任务可以永不下线。在实时作业里，带箭头的连线仅代表业务上的关系，而非任务执行流程，更不是数据流。实时处理作业可以配置节点级别的调度任务

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
配置OBS目的端参数 - 数据治理中心 DataArts Studio

如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 directory/ 文件格式传输数据时使用的格式。其中CSV和JSON仅支持迁移到数据表场景，二

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
新增字段操作指导 - 数据治理中心 DataArts Studio

常用于标记数据库来源，以确保导入到目的端数据的完整性。图1 字段映射目前支持以下类型自定义字段：常量常量参数即参数值是固定的参数，不需要重新配置值。例如“lable”=“friends”用来标识常量值。变量您可以使用时间宏、表名宏、版本宏等变量来标记数据库来源信息。变

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
新增字段操作指导 - 数据治理中心 DataArts Studio

常用于标记数据库来源，以确保导入到目的端数据的完整性。图1 字段映射目前支持以下类型自定义字段：常量常量参数即参数值是固定的参数，不需要重新配置值。例如“lable”=“friends”用来标识常量值。变量您可以使用时间宏、表名宏、版本宏等变量来标记数据库来源信息。变

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
MRS Flink Job - 数据治理中心 DataArts Studio

流处理：指Flink作业为流处理运行模式，节点执行时只要作业启动成功即执行成功。后续每次周期运行时检查任务是否处于运行状态，如果处于运行状态，则认为节点执行成功。注意，此处不会为Flink增加对应的batch或streaming模式参数，您还需要为Flink作业指定对应参数。 MRS集群名是选择MRS集群。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
DORIS SQL - 数据治理中心 DataArts Studio

若选择SQL语句方式，数据开发模块将无法解析您输入SQL语句中携带的参数。数据连接是选择数据连接。数据库是填写数据库名称，该数据库已创建好，建议不要使用默认数据库。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
如何查看表行数和库大小 - 数据治理中心 DataArts Studio

如何查看表行数和库大小在数据治理流程中，我们常常需要统计数据表行数或数据库的大小。其中，数据表的行数可以通过SQL命令或数据质量作业获取；数据库大小可以直接在数据目录组件中查看，详情请参考如下操作指导：统计数据表行数统计数据库大小统计数据表行数对于不同类型的数据源，DataArts

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
查询API信息 - 数据治理中心 DataArts Studio

environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > API管理接口
步骤1：流程设计 - 数据治理中心 DataArts Studio

数据源与目的数据源之间的网络带宽 100MB - 数据源和集成工具之间的网络连通性描述本示例不涉及 - 数据库类迁移，调研表的个数，最大表的规模本示例不涉及，本示例需要从OBS文件迁移到数据库了解数据库迁移的作业规模，了解最大表的迁移时间是否可接受文件类迁移，文件的个数，有没有单文件超过TB级文件

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
管理员操作 - 数据治理中心 DataArts Studio

由于企业模式下需要区分开发环境和生产环境，因此您需要分别准备对应生产环境和开发环境的两套数据湖服务，用于隔离开发和生产环境：对于集群化的数据源（例如MRS、DWS、RDS、MySQL、Oracle、DIS、ECS），DataArts Studio通过管理中心的创建数据连接区分开发环境和生产环境的数据湖服务，在开发

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间 > 企业模式角色操作
作业开发API - 数据治理中心 DataArts Studio

作业开发API 创建作业修改作业查询作业列表查询作业详情查询作业文件导出作业批量导出作业导入作业立即执行作业启动作业停止作业删除作业停止作业实例重跑作业实例查询实时作业运行状态查询作业实例列表查询作业实例详情查询系统任务详情父主题：数据开发API（V1）

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1）
开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

据catalog。数据库名称选择数据库。 DLI数据目录如果选择DLI默认的数据目录dli，表示为DLI的数据库和数据表。 DLI数据目录如果选择DLI所绑定的LakeFormation已创建元数据catalog，表示为LakeFormation的数据库和数据表。队列名称

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
新建数据对账作业 - 数据治理中心 DataArts Studio

成。数据连接来源对象/目的对象支持的数据源类型：DWS、MRS Hive、MRS Spark、DLI、ORACLE、RDS（MySQL、PostgreSQL）、Hetu、MRS Spark（Hudi）、MRS ClickHouse、DORIS。从下拉列表中选择已创建的数据连接。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
新建数据库 - 数据治理中心 DataArts Studio

在脚本开发导航栏，选择，右键单击数据连接名称，选择“新建数据库”，配置如表1所示的参数。表1 新建数据库参数是否必选说明数据库名称是数据库的名称，命名要求如下： DLI：数据库名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。 DWS：数据库名称只能包含数字、英文字母和下

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 数据管理
CDM有哪些优势？ - 数据治理中心 DataArts Studio

满足要求。 CDM任务基于分布式计算框架，自动将任务切分为独立的子任务并行执行，能够极大提高数据迁移的效率。针对Hive、HBase、MySQL、DWS（数据仓库服务）数据源，使用高效的数据导入接口导入数据。多种数据源支持数据源类型繁杂，针对不同数据源开发不同的任务，脚本数量成千上万。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
更新模型工作区 - 数据治理中心 DataArts Studio

environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 关系建模接口

总条数： 960

上一页
1
...
13
14
15
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看并修改CDM集群配置 - 数据治理中心 DataArts Studio

配置数据入湖检测规则（高级特性） - 数据治理中心 DataArts Studio

如何配置Hudi Compaction的Spark周期任务？ - 数据治理中心 DataArts Studio

Flink Jar作业开发指导 - 数据治理中心 DataArts Studio

新建作业 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

MRS Flink Job - 数据治理中心 DataArts Studio

DORIS SQL - 数据治理中心 DataArts Studio

如何查看表行数和库大小 - 数据治理中心 DataArts Studio

查询API信息 - 数据治理中心 DataArts Studio

步骤1：流程设计 - 数据治理中心 DataArts Studio

管理员操作 - 数据治理中心 DataArts Studio

作业开发API - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

新建数据对账作业 - 数据治理中心 DataArts Studio

新建数据库 - 数据治理中心 DataArts Studio

CDM有哪些优势？ - 数据治理中心 DataArts Studio

更新模型工作区 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线