搜索_华为云

数据架构概述 - 数据治理中心 DataArts Studio

Studio控制台首页，选择对应工作空间的“数据架构”模块，进入数据架构页面，查看“总览”，如图1所示。图1 数据架构总览我的待办显示“我的申请”和“待我审核”的数量。单击每一项上面统计数量将分别跳转到“我的申请”和“待我审核”页面。资产概览显示数据架构中所有对象的总量。单击每个对象名称后的统计数量将跳转到该对象的管理页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构
配置Hive源端参数 - 数据治理中心 DataArts Studio

“读取方式”选择“JDBC”，“使用SQL语句”选择“否”时显示此参数。填写该参数表示指定抽取的WHERE子句，不指定则抽取整表。如果要迁移的表中没有WHERE子句的字段，则会迁移失败。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
实时报警平台搭建 - 数据治理中心 DataArts Studio

创建数据表关键操作说明：图9中的脚本开发区为临时调试区，关闭脚本页签后，开发区的内容将丢失。如需保留该SQL脚本，请单击，将脚本保存至指定的目录中。关键参数说明：数据连接：1中创建的DLI数据连接。数据库：2中创建的数据库。资源队列：使用DLI提供的默认资源队列“default”。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
Python - 数据治理中心 DataArts Studio

选择执行Python语句的主机。需确认该主机配有用于执行Python脚本的环境。须知： Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

已知单线程flush的FileGroup的数据 = 单次Commit的FileGroup数量 / 作业并发数。单线程flush的FileGroup的数量 <= 5，推荐值2。单线程flush的FileGroup的数量 <= 10，推荐值5。单线程flush的FileGroup的数量 <= 25，推荐值10。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
记录数据迁移入库时间 - 数据治理中心 DataArts Studio

添加完字段后，请确保自定义入库时间字段与目的端表字段类型相匹配。单击“下一步”配置任务参数，一般情况下全部保持默认即可。单击“保存并运行”，回到作业管理的表/文件迁移界面，在作业管理界面可查看作业执行进度和结果。作业执行成功后，单击作业操作列的“历史记录”，可查看该作业的历史执行记录、读取和写入的统计数据。在

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
记录数据迁移入库时间 - 数据治理中心 DataArts Studio

添加完字段后，请确保自定义入库时间字段与目的端表字段类型相匹配。单击“下一步”配置任务参数，一般情况下全部保持默认即可。单击“保存并运行”，回到作业管理的表/文件迁移界面，在作业管理界面可查看作业执行进度和结果。作业执行成功后，单击作业操作列的“历史记录”，可查看该作业的历史执行记录、读取和写入的统计数据。在

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
SDK使用前准备 - 数据治理中心 DataArts Studio

SDK”。单击SDK使用引导区域里对应语言的SDK，下载SDK包到本地。进行SDK包完整性校验。Windows操作系统下，打开本地命令提示符框，输入如下命令，在本地生成已下载SDK包的SHA256值，其中，“D:\java-sdk.zip”为SDK包的本地存放路径和SDK包名，请根据实际情况修改。

帮助中心 > 数据治理中心 DataArts Studio > SDK参考 > 数据服务SDK参考
Shell - 数据治理中心 DataArts Studio

s的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell和Python脚本都是发往ECS主机的/tmp目录下去运行的，需要确保/tmp目录磁盘不被占满。参数否

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
通过数据质量对比数据迁移前后结果 - 数据治理中心 DataArts Studio

通过数据质量对比数据迁移前后结果数据对账对数据迁移流程中的数据一致性至关重要，数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。本章以DWS数据迁移到MRS Hive分区表为例，介绍如何通过DataArts Studio中的数据质量模块实现数据迁移前后的一致性校验。前提条件已在数据仓

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
实时作业概述 - 数据治理中心 DataArts Studio

多类场景下的数据同步支持单表、整库及分库分表实时增量数据同步。单表同步：支持将源端一个实例下的单张表实时同步至目的端一个实例下的单张表。整库同步：支持将源端一个实例下多个库的多张表批量实时同步到目的端一个实例下的多个库表，一个任务中最多支持200张目标表。分库分表同步：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
基线运维概述 - 数据治理中心 DataArts Studio

关键路径：影响基线任务的多条路径中，运行耗时最长的路径。事件：基线任务及其上游任务出错，或关键路径上的任务变慢时，会产生事件。事件会影响基线任务的按时完成。监控范围关键任务以及其依赖链上游的所有任务。功能介绍将重要任务添加到基线上后，系统将根据基线的优先级保障基线任务的资源，并根据

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 基线运维
管理资产标签 - 数据治理中心 DataArts Studio

行分类和描述，以便于检索。 “分类”是指按照种类、等级或性质分别归类。分类是自上而下的，通过对事物进行分析，按照一定的标准，划分出不同的类别。二者主要区别如下：表1 标签和分类区别属性分类标签排他性有无关系从属相关（关联）创建事前规划任意时间代价高

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 查看工作空间数据地图
开发并调度Import GES作业 - 数据治理中心 DataArts Studio

基于标准化点/边数据集，自动生成图的元数据，实现最终将图数据（点数据集、边数据集和元数据）定期导入到GES服务中。图1 业务场景说明开发并调度Import GES作业假设MySQL中的原始数据表是每日更新的，我们希望每天都能将基于原始数据的最新图数据更新到GES中，则需要使

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
管理维度表 - 数据治理中心 DataArts Studio

据将按照配置的参数存储到规定的库中。图9 异常数据输出配置各参数具体含义如下：数据库或Schema：表示存储异常数据的数据库或Schema。表前缀：表示存储异常数据的表的前缀。表后缀：表示存储异常数据的表的后缀。配置完成后单击保存配置。（可选）质量规则的检查范围默认

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

MongoDB作为目的端时的作业参数参数名说明取值样例数据库名称选择待导入数据的数据库。 mddb 集合名称选择待导入数据的集合，相当于关系数据库的表名。单击输入框后面的按钮可进入表的选择界面，用户也可以直接输入表名称。如果选择界面没有待选择的表，请确认表是否已经创建

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
获取主题树信息 - 数据治理中心 DataArts Studio

imit的整数倍，不满足则向下取整，默认值0。请求参数表3 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String IAM Token，通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）使用Token认证时必选。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 主题管理接口

总条数： 1197

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据架构概述 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

实时报警平台搭建 - 数据治理中心 DataArts Studio

Python - 数据治理中心 DataArts Studio

Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

记录数据迁移入库时间 - 数据治理中心 DataArts Studio

记录数据迁移入库时间 - 数据治理中心 DataArts Studio

SDK使用前准备 - 数据治理中心 DataArts Studio

Shell - 数据治理中心 DataArts Studio

通过数据质量对比数据迁移前后结果 - 数据治理中心 DataArts Studio

实时作业概述 - 数据治理中心 DataArts Studio

基线运维概述 - 数据治理中心 DataArts Studio

管理资产标签 - 数据治理中心 DataArts Studio

开发并调度Import GES作业 - 数据治理中心 DataArts Studio

管理维度表 - 数据治理中心 DataArts Studio

配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

获取主题树信息 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线