搜索_华为云

支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

上表中非云服务的数据源，例如MySQL，既可以支持用户本地数据中心自建的MySQL，也可以是用户在ECS上自建的MySQL，还可以是第三方云的MySQL服务。整库迁移支持的数据源类型整库迁移适用于将本地数据中心或在ECS上自建的数据库，同步到云上的数据库服务或大数据服务中，适用于数据库离线迁移场景，不适用于在线实时迁移。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
源端为HDFS - 数据治理中心 DataArts Studio

SIZE：按文件大小分割。注意这里不会将文件做切分来实现均衡。例如：有10个文件，9个10M，1个200M，在并发任务数中指定“throttlingConfig.numExtractors”（抽取并发数）为“2”，则会分两个分片，一个处理9个10M的文件，一个处理1个200M的文件。 fromJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
Job内嵌对象 - 数据治理中心 DataArts Studio

Date 作业调度计划时间，即周期调度配置的时间，例如每天凌晨1:01调度作业。 startTime java.util.Date 作业执行时间，有可能与planTime同一个时间，也有可能晚于planTime（由于作业引擎繁忙等）。 eventData String 当作业使用事件驱动调度时，从通道获取的消息。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
管理静态脱敏任务 - 数据治理中心 DataArts Studio

选择“委托”，在委托列表中查找MRS预置的MRS_ECS_DEFAULT_AGENCY委托，并单击“授权”。如果未找到MRS预置的MRS_ECS_DEFAULT_AGENCY委托，则可以通过自定义购买方式来购买MRS集群，在高级配置中选择绑定MRS_ECS_DEFAULT_AGENCY委托。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 静态脱敏任务
开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

系统支持Flink Jar作业运行前能够查询历史checkpoint，并选择从指定checkpoint启动。要使Flink Checkpoin生效，需要配置两个运行参数：用来控制checkpoint间隔 -yD：execution.checkpointing.interval=1000 用来控制保留的checkpoint数量

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
数据开发配置数据搬迁 - 数据治理中心 DataArts Studio

在数据开发主界面，单击左侧导航上的“脚本开发”，进入脚本目录。单击脚本目录中的，选择“显示复选框”。勾选需要导出的脚本，单击 > 导出脚本。导出完成后，即可通过浏览器下载地址，获取到导出的zip文件。图1 选择并导出脚本在弹出的“导出脚本”界面，选择需要导出的脚本的状态，单击“确定”。图2 导出脚本导出作业

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
查询集群列表 - 数据治理中心 DataArts Studio

REBOOT_FAILURE：重启失败。 type String 节点类型，只支持一种类型“cdm”。 id String 节点的虚拟机ID。 name String 节点的虚拟机名称。 isFrozen String 节点是否冻结：0：否。1：是。 components String 组件。 config_status

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

MRS资源队列选择已创建好的MRS资源队列。说明：您需要先在数据安全服务队列权限功能中，配置对应的队列后，才能在此处选择到已配置的队列。当有多处同时配置了资源队列时，此处配置的资源队列为最高优先级。数据库选择数据库。MRS API连接方式下不支持选择数据库。运行程序参数配置运行参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
Kafka连接 - 数据治理中心 DataArts Studio

broker列表，格式如：“host1:port1,host2:port2”。 llinkConfig.host 是 String MRS Manager的浮动IP地址，可以单击输入框后的“选择”来选定已创建的MRS集群，CDM会自动填充下面的鉴权参数。 linkConfig.user 是 String 登录MRS

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
Flink Jar作业开发指导 - 数据治理中心 DataArts Studio

系统支持Flink Jar作业运行前能够查询历史checkpoint，并选择从指定checkpoint启动。要使Flink Checkpoin生效，需要配置两个运行参数：用来控制checkpoint间隔 -yD：execution.checkpointing.interval=1000 用来控制保留的checkpoint数量

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
逻辑模型 - 数据治理中心 DataArts Studio

模型校验前缀：针对关系建模里面的物理表（关系表）、维度建模里面的事实表、数据集市的汇总表的新建、修改、导入表时，会校验是否有前缀，没有的话会校验失败。进行逆向操作时，也会校验是否有前缀。描述逻辑模型的描述信息。更多操作如下。单击已新建的逻辑模型右侧的“编辑”，可以修改逻辑模型的参数信息。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 数据调研
Cassandra连接参数说明 - 数据治理中心 DataArts Studio

取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 mongodb_link 服务节点一个或者多个节点的地址，以“;”分隔。建议同时配置多个节点。 192.168.0.1;192.168.0.2 端口连接的Cassandra节点的端口号。 9042

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

兼容标准ANSI SQL 99和SQL 2003，同时兼容PostgreSQL/Oracle数据库生态，为各行业PB级海量大数据分析提供有竞争力的解决方案。数据湖探索（DLI）华为云DLI是完全兼容Apache Spark和Apache Flink生态，实现批流一体的Ser

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
补数据场景使用介绍 - 数据治理中心 DataArts Studio

历史中出现数据错误的作业实例，或者构建更多的作业记录以便调试程序等。补数据作业除了支持SQL脚本，其他节点也支持。如果SQL脚本的内容有变化，补数据作业运行的是最新版本的脚本。使用补数据功能时，如SQL中变量是DATE，脚本中就写${DATE}，在作业参数中会自动增加脚本参

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
补数据场景使用介绍 - 数据治理中心 DataArts Studio

历史中出现数据错误的作业实例，或者构建更多的作业记录以便调试程序等。补数据作业除了支持SQL脚本，其他节点也支持。如果SQL脚本的内容有变化，补数据作业运行的是最新版本的脚本。使用补数据功能时，如SQL中变量是DATE，脚本中就写${DATE}，在作业参数中会自动增加脚本参

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
SDK调用常见错误码/错误信息 - 数据治理中心 DataArts Studio

h、header、query、body等。说明：如果自行对接了第三方网关等，请求地址和数据服务展示的地址不一致，需要在请求头中补充参数x-forwarded-host，值为签名时使用的请求地址。如果使用get请求，不要定义body体。 DLG.0902 Fail to call

帮助中心 > 数据治理中心 DataArts Studio > SDK参考 > 数据服务SDK参考
目的端为OBS - 数据治理中心 DataArts Studio

分隔符或换行符，写入目的端时CDM会使用双引号（"）作为包围符将该字段内容括起来，作为一个整体存储，避免其中的字段分隔符误将一个字段分隔成两个，或者换行符误将字段换行。例如：数据库中某字段为hello,world，使用包围符后，导出到CSV文件的时候数据为"hello,world"。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

配置HDFS目的端参数表1 HDFS作为目的端时的作业参数参数类型参数名说明取值样例基本参数写入目录写入数据到HDFS服务器的目录。 /user/cdm/output 文件格式传输数据时使用的格式。其中CSV和JSON仅支持迁移到数据表场景，二进制格式适用于文件迁移场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
常用EL表达式样例合集 - 数据治理中心 DataArts Studio

split(Job.getNodeOutput("前一节点名"),"]")[0],"[")[0],"\\"")[0]} 当前一节点的输出结果是多个（两个及以上）字段时，输出结果形如[["000"],["001"]]所示。此时需要结合For Each节点及其支持的Loop内嵌对象EL表达式如#{Loop

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
原子指标 - 数据治理中心 DataArts Studio

在左侧流程目录中选中一个流程，单击“新建”按钮，开始新建原子指标。在新建原子指标页面，参考表1配置参数。在本示例中，需要创建经营面积和销售额两个原子指标数据。图2 新建原子指标1（配置基本信息、配置数据对象）图3 新建原子指标1（配置表达式）表1 新建原子指标参数说明参数名称

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据指标 > 指标开发

总条数： 441

上一页
1
...
12
13
14
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

源端为HDFS - 数据治理中心 DataArts Studio

Job内嵌对象 - 数据治理中心 DataArts Studio

管理静态脱敏任务 - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

数据开发配置数据搬迁 - 数据治理中心 DataArts Studio

查询集群列表 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

Kafka连接 - 数据治理中心 DataArts Studio

Flink Jar作业开发指导 - 数据治理中心 DataArts Studio

逻辑模型 - 数据治理中心 DataArts Studio

Cassandra连接参数说明 - 数据治理中心 DataArts Studio

DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

补数据场景使用介绍 - 数据治理中心 DataArts Studio

补数据场景使用介绍 - 数据治理中心 DataArts Studio

SDK调用常见错误码/错误信息 - 数据治理中心 DataArts Studio

目的端为OBS - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

常用EL表达式样例合集 - 数据治理中心 DataArts Studio

原子指标 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线