搜索_华为云

数据指标概述 - 数据治理中心 DataArts Studio

数据指标概述在DataArts Studio数据指标的使用中，指标定义用于指导指标开发，用于定义指标的设置目的、计算公式等，并不进行实际运算，可与指标开发进行关联。而指标开发是指标定义的具体实现，定义了指标如何计算。数据指标功能当前需申请白名单后才能使用。如需使用该特性，请联系客服或技术支持人员。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据指标
数据治理模块域 - 数据治理中心 DataArts Studio

数据治理模块域数据治理主要专注于如下模块域：数据集成数据集成用来完成数据入湖动作，不是简单的数据搬家，而是按照一定的方法论进行数据备份。数据入湖的前提条件是满足6项数据标准，包括：明确数据Owner、发布数据标准、定义数据密级、明确数据源、数据质量评估、元数据注册。此标准由

 帮助中心 > 数据治理中心 DataArts Studio > 数据治理方法论 > 数据治理框架
DIS Dump - 数据治理中心 DataArts Studio

说明：转储至CloudTable，仅华北-北京一区域支持。单击，在弹出的对话框中配置转储任务的参数（参数说明请见《数据接入服务用户指南》的管理转储任务）。表2 高级参数参数是否必选说明节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
开发SQL脚本 - 数据治理中心 DataArts Studio

支持。单击右上角的，设置相关脚本的环境变量。举例如下所示：设置Hive SQL脚本的环境变量： --hiveconf hive.merge.mapfiles=true; --hiveconf mapred.job.queue.name=queue1 设置Spark SQL脚本的环境变量：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

当“作业调度身份是否可配置”设置为“是”，该参数可见。配置委托后，作业执行过程中，以委托的身份与其他服务交互。作业优先级自动匹配创建作业时配置的作业优先级，此处支持修改。实例超时时间配置作业实例的超时时间，设置为0或不配置时，该配置项不生效。如果您为作业设置了异常通知，当作业实

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
更新表的异常数据输出配置 - 数据治理中心 DataArts Studio

String 主题域分组中文名，只读，创建和更新时无需填写。 l2 String 主题域中文名，只读，创建和更新时无需填写。 l3 String 业务对象中文名，只读，创建和更新时无需填写。 l1_id String 主题域分组ID，只读，ID字符串。 l2_id String 主题域ID，只读，创建和更新时无需填写。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 质量规则接口
CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。不同源端数据源的作业分片维度有所不同，因此某

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
Shell - 数据治理中心 DataArts Studio

若选择Shell语句方式，数据开发模块将无法解析您输入Shell语句中携带的参数。 Shell节点运行的输出结果不能大于30M，大于30M会报错。主机连接是选择执行Shell脚本的主机。须知： Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/s

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
DMS Kafka连接参数说明 - 数据治理中心 DataArts Studio

启用SSL认证后，Kafka会将Kafka Broker连接地址视做域名不断进行解析，导致性能消耗。建议修改CDM集群对应的ECS主机（通过集群IP查找对应的ECS主机）中的“/etc/hosts”文件，为其添加Broker连接地址的自映射，以便客户端能够快速解析实例的Broker。例如Kafka Broker地址配置为10

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
新建DataArts Studio与MRS Hive数据湖的连接 - 数据治理中心 DataArts Studio

和开发环境的两套数据湖服务，用于隔离开发和生产环境：对于集群化的数据源（例如MRS、DWS、RDS、MySQL、Oracle、DIS、ECS），如果使用两套集群，DataArts Studio通过管理中心的创建数据连接区分开发环境和生产环境的数据湖服务，在开发和生产流程中自动切

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

组出方向放通云下数据源所在的主机、数据源所在的主机可以访问公网且防火墙规则已开放连接端口。如果目标数据源为云上服务（如DWS、MRS及ECS等），则网络互通需满足如下条件： CDM集群与云上服务处于不同区域的情况下，需要通过公网或者专线打通网络。通过公网互通时，需确保CDM集群

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
配置权限集 - 数据治理中心 DataArts Studio

用于权限管控。即空间权限集一般无需进行权限同步，且不支持为空间权限集关联角色；而权限集可通过权限同步进行权限管控（实际使用时，更推荐通过权限集关联角色进行权限管控）。本章主要描述如何通过创建权限集和配置权限集进行权限管控，在实际使用中更加推荐您通过配置角色进行权限管控。前提条件

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
新建DataArts Studio与MySQL数据库的连接 - 数据治理中心 DataArts Studio

关系型数据库数据源的访问地址，可填写为IP或域名。 “IP或域名”如果手动填写，必须写内网IP，端口必须为对资源组网段放开的端口（如需设置请参见设置安全组规则），否则可能导致网络连接不通。如果为RDS或GaussDB等云上数据源，可以通过管理控制台获取访问地址：根据注册的账号登录对应云服务的管理控制台。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
配置OBS目的端参数 - 数据治理中心 DataArts Studio

OBS作为目的端时的作业参数参数类型参数名说明取值样例基本参数桶名写入数据的OBS桶名。 bucket_2 写入目录写入数据到OBS服务器的目录，目录前面不加“/”。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合，可以实现定期同

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
配置Hive源端参数 - 数据治理中心 DataArts Studio

过滤及在字段映射页面添加新字段。说明：源端为Hive数据源且使用JDBC方式读取数据时，CDM不支持多并发，即后续操作中抽取并发数只能设置为1。 HDFS 使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置离线处理集成作业 - 数据治理中心 DataArts Studio

运行。因此作业抽取并发数和集群最大抽取并发数参数设置为适当的值可以有效提升迁移速度。作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
产品优势 - 数据治理中心 DataArts Studio

连接并萃取数据价值、全流程数据质量监控、统一数据资产管理、数据开发服务等，帮助企业构建完整的数据中台解决方案。全链路数据治理管控数据全生命周期管控，提供数据架构定义及可视化的模型设计，智能化的帮助用户生成数据处理代码，数据处理全流程质量监控，异常事件实时通知。丰富的数据开发类型

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

Hive。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。标签否标识数据连接的属性。设置标签后，便于统一管理。说明：标签的名称，只能包含中文、英文字母、数字和下划线，不能以下划线开头，且长度不能超过100个字符。适用组件

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
处理消息 - 数据治理中心 DataArts Studio

使用截止时间。仅定期执行需要此参数，默认服务器当前时间三天后。响应参数状态码： 400 表4 响应Body参数参数参数类型描述 error_code String 错误码。 error_msg String 错误描述。请求示例对收到的通知消息进行确认。 /v1/0833a5737480d53b2f2

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > 消息管理接口
查询集群列表 - 数据治理中心 DataArts Studio

REBOOT_FAILURE：重启失败。 type String 节点类型，只支持一种类型“cdm”。 id String 节点的虚拟机ID。 name String 节点的虚拟机名称。 isFrozen String 节点是否冻结：0：否。1：是。 components String 组件。 config_status

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理

总条数： 853

上一页
1
...
8
9
10
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据指标概述 - 数据治理中心 DataArts Studio

数据治理模块域 - 数据治理中心 DataArts Studio

DIS Dump - 数据治理中心 DataArts Studio

开发SQL脚本 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

更新表的异常数据输出配置 - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

Shell - 数据治理中心 DataArts Studio

DMS Kafka连接参数说明 - 数据治理中心 DataArts Studio

新建DataArts Studio与MRS Hive数据湖的连接 - 数据治理中心 DataArts Studio

创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

配置权限集 - 数据治理中心 DataArts Studio

新建DataArts Studio与MySQL数据库的连接 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

产品优势 - 数据治理中心 DataArts Studio

Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

处理消息 - 数据治理中心 DataArts Studio

查询集群列表 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线