搜索_华为云

产品功能 - 数据治理中心 DataArts Studio

构建数据处理业务流水线。预设数据集成、SQL、Spark、Shell、机器学习等多种任务类型，通过任务间依赖完成复杂数据分析处理。支持导入和导出作业。资源管理支持统一管理在脚本开发和作业开发使用到的file、jar、archive类型的资源。作业调度支持单次调度、周期

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
配置Hive目的端参数 - 数据治理中心 DataArts Studio

TO_NULL TO_EMPTY_STRRING TO_NULL_STRING TO_NULL 导入前清空数据选择目的端表中数据的处理方式。是：任务启动前会清除目标表中数据。否：导入前不清空目标表中的数据，如果选“否”且表中有数据，则数据会追加到已有的表中。是换行符处理方式

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
数据集成操作列表 - 数据治理中心 DataArts Studio

cluster modifyCluster 开机 cluster startCluster 重启 cluster restartCluster 导入作业 cluster clusterImportJob 绑定弹性IP cluster bindEip 解绑弹性IP cluster unbindEip

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 审计日志 > 支持云审计的关键操作
分析数据 - 数据治理中心 DataArts Studio

SEQUENCEFILE, RCFILE, PARQUET, CARBON类型。如果原始数据表存储格式不满足要求，您可以通过CDM将原始数据直接导入到DLI中进行分析，无需上传OBS。通过DLI分析数据进入数据湖探索DLI控制台，参考DLI用户指南中的创建数据库创建数据库。参考创

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 贸易数据极简上云与统计分析
管理中心操作列表 - 数据治理中心 DataArts Studio

updateWorkspaceUser 删除工作空间用户 User deleteWorkspaceUser 下载文件 Config downloadFile 创建导入导出任务 Config createObsImportOrExportTask 父主题：支持云审计的关键操作

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 审计日志 > 支持云审计的关键操作
如何将云下内网或第三方云上的私网与CDM连通？ - 数据治理中心 DataArts Studio

单击“增加”，添加端口映射关系。单击“开始映射”，这时才会真正开始映射，接收数据包。至此，就可以在CDM上通过弹性IP读取本地内网MySQL的数据，然后导入到云服务DWS中。 CDM要访问本地数据源，也必须给CDM集群配置EIP。一般云服务DWS默认也是只允许VPC内部访问，创建CDM集群时

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
数据服务专享版的API如何通过公网访问？ - 数据治理中心 DataArts Studio

法再直接通过公网访问。在这种情况下，您可以导出当前集群的API，然后重新新建一个开启“公网入口”的数据服务专享版集群，再将旧集群的API导入到新集群上，即可开启公网访问。另外，如果您已有开启公网入口的APIG专享版或ROMA Connect实例，也可以选择将API发布到APIG专享版或ROMA

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据服务
区域和可用区如何选择？ - 数据治理中心 DataArts Studio

通过公网或者专线打通网络；而在同区域情况下，同子网、同安全组的不同实例默认网络互通。资源的价格不同区域的资源价格可能有差异，请参见华为云服务价格详情。如何选择可用区？ DataArts Studio实例中的数据集成CDM集群所在可用区。DataArts Studio实例通过

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
Oracle数据迁移到DWS - 数据治理中心 DataArts Studio

dbadmin 密码用户的密码。 - 使用Agent Agent功能待下线，无需配置。 - Agent Agent功能待下线，无需配置。 - 导入模式 COPY模式：将源数据经过DWS管理节点后复制到数据节点。如果需要通过Internet访问DWS，只能使用COPY模式。 COPY 单击“保存”完成创建连接。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
新建DataArts Studio与MySQL数据库的连接 - 数据治理中心 DataArts Studio

创建MySQL连接时，CDM会自动尝试启用MySQL数据库的local_infile系统变量，开启MySQL的LOAD DATA功能加快数据导入，提高导入数据到MySQL数据库的性能。注意，开启本参数后，日期类型将不符合格式的会存储为0000-00-00，更多详细信息可在MySQL官网文档查看。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
CDM Job - 数据治理中心 DataArts Studio

设置为“选择已存在的作业”，且确保两个集群下分别存在该作业。您可以在其中一个集群新建CDM作业并导出，然后再导入作业到另一个集群，实现作业同步，具体操作方法请参见导出导入CDM作业。 CDM作业类型是选择已存在的作业。创建新作业。说明：如果作业类型为“选择已存在的作业”

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
开发Shell脚本 - 数据治理中心 DataArts Studio

ython脚本的调度频率合理配置MaxSessions的值。当前用户已锁定该脚本，否则需要通过“抢锁”锁定脚本后才能继续开发脚本。新建或导入脚本后默认被当前用户锁定，详情参见编辑锁定功能。操作步骤参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
创建MySQL连接器 - 数据治理中心 DataArts Studio

变量）。是使用Agent Agent功能待下线，无需配置。 - local_infile字符集 mysql通过local_infile导入数据时，可配置编码格式。 utf8 驱动版本适配mysql的驱动。 - Agent Agent功能待下线，无需配置。 - 单次请求行数指定每次请求获取的行数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
DataArts Studio配置数据搬迁简介 - 数据治理中心 DataArts Studio

对应旧空间的集群。搬迁依赖于OBS功能，请您提前规划OBS桶和文件夹目录。 DataArts Studio数据搬迁时，依赖各组件的备份或导入导出能力。您可以根据自己的数据需求，自由选择搬迁哪个组件的数据。管理中心配置数据搬迁数据集成配置数据搬迁数据架构配置数据搬迁数据开发配置数据搬迁

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
关系数据库连接 - 数据治理中心 DataArts Studio

Boolean 是否使用数据库本地API加速。创建MySQL连接时，使用本地API加速，可以使用MySQL的LOAD DATA功能加快数据导入，提高导入数据到MySQL数据库的性能。说明： REPLACE 和 IGNORE 修饰符用于处理与现有行具有相同唯一键值（PRIMARY KEY或UNIQUE索引值）的新输入的行。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
数据治理模块域 - 数据治理中心 DataArts Studio

是满足6项数据标准，包括：明确数据Owner、发布数据标准、定义数据密级、明确数据源、数据质量评估、元数据注册。此标准由数据代表在入湖前完成梳理并在数据治理平台上进行资产注册。数据标准数据标准管理着重建立统一的数据语言，各级数据层级业务对象的定义是数据标准的载体，并对应发布各

 帮助中心 > 数据治理中心 DataArts Studio > 数据治理方法论 > 数据治理框架
配置MRS Hudi目的端参数 - 数据治理中心 DataArts Studio

自动创建该表。如果“表名”参数配置的表已存在，则不创建，数据写入到已存在的表中。不自动创表导入前清空数据选择目的端表中数据的处理方式：是：任务启动前会清除目标表中数据。否：导入前不清空目标表中的数据，如果选“否”且表中有数据，则数据会追加到已有的表中。否全量模式写Hoodie

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。因此，在单表或整库导入到DWS/FusionInsight LibrA时，建议您在此处手动选择分布列，如果您没有选择，CDM会自动选择一个分布列。关于分布列的更多信息，请参见数据仓库服务。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
步骤6：数据开发处理 - 数据治理中心 DataArts Studio

历史数据到源数据表，使用数据集成将历史数据从OBS导入到SDI贴源层的原始数据表。历史数据清洗，使用数据开发的MRS Hive SQL脚本将源数据表清洗之后导入DWI层的标准出行数据表。将基础数据插入维度表中。将DWI层的标准出行数据导入DWR层的事实表中。数据汇总，通过Hive

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
补数据场景使用介绍 - 数据治理中心 DataArts Studio

案例场景在某企业的产品数据表中，有一个记录产品销售额的源数据表A，现在需要把产品销售额的历史数据导入的目的表B里面，需要您配置补数据作业的相关操作。需要导入的列表情况如表1所示。表1 需要导入的列表情况源数据表名目的表名 A B 配置方法准备源表和目的表。为了便于后续作业运行

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程

总条数： 606

上一页
1
...
23
24
25
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

产品功能 - 数据治理中心 DataArts Studio

配置Hive目的端参数 - 数据治理中心 DataArts Studio

数据集成操作列表 - 数据治理中心 DataArts Studio

分析数据 - 数据治理中心 DataArts Studio

管理中心操作列表 - 数据治理中心 DataArts Studio

如何将云下内网或第三方云上的私网与CDM连通？ - 数据治理中心 DataArts Studio

数据服务专享版的API如何通过公网访问？ - 数据治理中心 DataArts Studio

区域和可用区如何选择？ - 数据治理中心 DataArts Studio

Oracle数据迁移到DWS - 数据治理中心 DataArts Studio

新建DataArts Studio与MySQL数据库的连接 - 数据治理中心 DataArts Studio

CDM Job - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

创建MySQL连接器 - 数据治理中心 DataArts Studio

DataArts Studio配置数据搬迁简介 - 数据治理中心 DataArts Studio

关系数据库连接 - 数据治理中心 DataArts Studio

数据治理模块域 - 数据治理中心 DataArts Studio

配置MRS Hudi目的端参数 - 数据治理中心 DataArts Studio

CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

步骤6：数据开发处理 - 数据治理中心 DataArts Studio

补数据场景使用介绍 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线