搜索_华为云

任务性能调优 - 数据治理中心 DataArts Studio

作业任务参数调优 MySQL到MRS Hudi参数调优 MySQL到DWS参数调优 MySQL到DMS Kafka参数调优 DMS Kafka到OBS参数调优 Apache Kafka到MRS Kafka参数调优 SQLServer到MRS Hudi参数调优 PostgreSQL到DWS参数调优

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
（可选）修改作业日志存储路径 - 数据治理中心 DataArts Studio

（可选）修改作业日志存储路径作业日志和DLI脏数据默认存储在以dlf-log-{Project id}命名的OBS桶中，您也可以自定义日志和DLI脏数据存储路径，支持基于工作区全局配置OBS桶。约束限制该功能依赖于OBS服务。 OBS路径仅支持OBS桶，不支持并行文件系统。

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 管理工作空间
GBASE连接参数说明 - 数据治理中心 DataArts Studio

默认为关系数据库，不可更改。 - 数据库服务器配置为要连接的数据库的IP地址或域名，多个值以;分隔。 192.168.0.1;192.168.0.2 端口配置为要连接的数据库的端口。 3306 数据库名称配置为要连接的数据库名称。 dbname 用户名待连接数据库的用户。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
创建作业 - 数据治理中心 DataArts Studio

SQL节点属性说明参数名是否必选参数类型说明 scriptName 是 String 脚本名称 database 否 String 数据库名称 MRS Hive中的数据库，默认default。 connectionName 否 String 连接名称 scriptArgs 否

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
配置数据血缘 - 数据治理中心 DataArts Studio

into/overwrite等DML操作产生的MRS表之间的血缘。 CDM Job 支持MRS Hive、DLI、DWS、RDS、OBS以及CSS之间表文件迁移所产生的血缘。 ETL Job 支持DLI、OBS、MySQL以及DWS之间的ETL任务产生的血缘。手动配置血缘在DataArts Studio数据

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
配置SQLServer目的端参数 - 数据治理中心 DataArts Studio

配置SQLServer目的端参数表1 SQL Server作为目的端时的作业参数参数类型参数名说明取值样例基本参数模式或表空间待写入数据的数据库名称，支持自动创建Schema。单击输入框后面的按钮可选择模式或表空间。 schema 表名写入数据的目标表名，单击输入框后面的按钮可进入表的选择界面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
数据管理流程 - 数据治理中心 DataArts Studio

和对应的数据库和数据表，则可跳过数据管理操作，直接进入脚本开发或作业开发。数据管理的使用流程如下：图1 数据管理流程创建数据连接，连接相关数据湖底座服务。具体请参见新建数据连接。基于相应服务，新建数据库。具体请参见新建数据库。如果是DWS连接，则需要新建数据库模式；否则

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 数据管理
查询码表列表 - 数据治理中心 DataArts Studio

environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 码表管理接口
文件格式介绍 - 数据治理中心 DataArts Studio

"timed_out": false, "total": 1000002, "max_score": 1.0 } JSON数组：JSON文件是包含多个JSON对象的数组。 [{ "took" : 190, "timed_out" : false, "total"

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
（可选）修改作业日志存储路径 - 数据治理中心 DataArts Studio

（可选）修改作业日志存储路径作业日志和DLI脏数据默认存储在以dlf-log-{Project id}命名的OBS桶中，您也可以自定义日志和DLI脏数据存储路径，支持基于工作区全局配置OBS桶。约束限制该功能依赖于OBS服务。 OBS路径仅支持OBS桶，不支持并行文件系统。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 创建并配置简单模式工作空间
配置PostgreSQL源端参数 - 数据治理中心 DataArts Studio

配置PostgreSQL源端参数支持从云端的数据库服务导出数据。这些非云服务的数据库，既可以是用户在本地数据中心自建的数据库，也可以是用户在ECS上部署的，还可以是第三方云上的数据库服务。表1 PostgreSQL作为源端时的作业参数参数类型参数名说明取值样例基本参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
文件格式介绍 - 数据治理中心 DataArts Studio

"timed_out": false, "total": 1000002, "max_score": 1.0 } JSON数组：JSON文件是包含多个JSON对象的数组。 [{ "took" : 190, "timed_out" : false, "total"

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
自动建表原理介绍 - 数据治理中心 DataArts Studio

38位时，Hive按38位创建，s小于0时，按0创建，受Hive数据类型限制，此场景可能会导致数据写入后精度丢失。表1 MySQL->Hive自动建表时的字段映射数据类型（MySQL）数据类型（Hive）说明数值类型 tinyint(1)，bit(1) BOOLEAN - TINYINT

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
创建脚本 - 数据治理中心 DataArts Studio

gineSQL、RDSSQL、ImpalaSQL、PYTHON、SparkPython其中之一时，这个参数是必选的。用户可以通过查询连接列表（待下线）接口获取当前系统中已经存在的连接。默认值为空。 database 否 String 执行SQL语句所关联的数据库，当type参数值

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 脚本开发API
获取SQL节点的输出结果值 - 数据治理中心 DataArts Studio

通过StringUtil内嵌对象EL表达式分割二维数组结果，获取前一节点输出的字段值，输出结果类型为String。本例中，MRS Hive SQL节点返回单字段二维数组，Kafka Client节点发送的数据定义为StringUtil内嵌对象EL表达式，通过此表达式即可分割二维数组，获取MRS Hive SQL节点输出的字段值。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
问题案例总览 - 数据治理中心 DataArts Studio

数据源安全组放通哪些端口可满足Migration访问？ Hudi 如何配置Hudi Compaction的Spark周期任务？ DWS MySQL到DWS实时同步中，同步新增列的DDL时报错怎么办？ MySQL到DWS实时同步中，DWS为什么需要对主键null值进行过滤？ Kafka Kafka到DLI实时同步中，作业运行失败，报“Array

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（实时作业）
Doris数据连接参数说明 - 数据治理中心 DataArts Studio

load 端口。数据库名称是配置需要连接的数据库。当“适用组件”勾选“数据集成”时，参数“数据库名称”到“引用符号”才需要配置，其中数据库名称为必填项。使用本地API 否开关开启时，使用本地API加速。开关关闭时，不使用本地API加速。使用数据库本地API加速。（

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
修改脚本内容 - 数据治理中心 DataArts Studio

、ImpalaSQL、HetuEngineSQL、RDSSQL其中之一时，才支持此参数。 type为DLI SQL时，可以通过查看所有数据库接口获取数据库信息。 type为其他类型的时候，需要通过JDBC方式连上集群，查询数据库信息。默认值为空。 queueName 是 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 脚本开发API
更新模型工作区 - 数据治理中心 DataArts Studio

environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 关系建模接口
数据集成（实时作业） - 数据治理中心 DataArts Studio

数据源安全组放通哪些端口可满足Migration访问？如何配置Hudi Compaction的Spark周期任务？ MySQL到DWS实时同步中，同步新增列的DDL时报错怎么办？ MySQL到DWS实时同步中，DWS为什么需要对主键null值进行过滤？ Kafka到DLI实时同步中，作业运行失败，报“Array

帮助中心 > 数据治理中心 DataArts Studio > 常见问题

总条数： 817

上一页
1
...
4
5
6
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

任务性能调优 - 数据治理中心 DataArts Studio

（可选）修改作业日志存储路径 - 数据治理中心 DataArts Studio

GBASE连接参数说明 - 数据治理中心 DataArts Studio

创建作业 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

配置SQLServer目的端参数 - 数据治理中心 DataArts Studio

数据管理流程 - 数据治理中心 DataArts Studio

查询码表列表 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

（可选）修改作业日志存储路径 - 数据治理中心 DataArts Studio

配置PostgreSQL源端参数 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

自动建表原理介绍 - 数据治理中心 DataArts Studio

创建脚本 - 数据治理中心 DataArts Studio

获取SQL节点的输出结果值 - 数据治理中心 DataArts Studio

问题案例总览 - 数据治理中心 DataArts Studio

Doris数据连接参数说明 - 数据治理中心 DataArts Studio

修改脚本内容 - 数据治理中心 DataArts Studio

更新模型工作区 - 数据治理中心 DataArts Studio

数据集成（实时作业） - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线