搜索_华为云

源端为HBase/CloudTable - 数据治理中心 DataArts Studio

String 需要抽取数据的表名，例如“cdm”。 fromJobConfig.columnFamilies 否 String 抽取数据所属的列族。 fromJobConfig.columns 否 String 需要抽取的列，列号之间使用“&”分割，列族与列之间用“:”分隔，例如：“cf1:c1&cf2:c2”。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
权限管理 - 数据治理中心 DataArts Studio

Studio仅支持其中的IAM角色方式，不支持IAM策略。 IAM角色：IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒度，提供有限的服务相关角色用于授权。传统的IAM角色并不能满足用户对精细化授权的要求，无法完全达到企业对权限最小化的安全管控要求。 I

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
车联网大数搬迁入湖简介场景介绍 - 数据治理中心 DataArts Studio

ase集群的数据： CDH → CDM（华为云） → MRS 使用云专线直接迁移时的优缺点：优点：数据无需做多次的搬迁，缩短整体搬迁周期。缺点：在数据大量传输过程中会占用专线带宽，对客户并行进行的业务存在影响，跨越多个交换机设备。 CDM通过DES（数据快递服务）迁移1个月前的历史数据，迁移路径如下：

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
时间宏变量使用解析 - 数据治理中心 DataArts Studio

在创建表/文件迁移作业时，CDM支持在源端和目的端的以下参数中配置时间宏变量：源端的源目录或文件源端的表名 “通配符”过滤类型中的目录过滤器和文件过滤器 “时间过滤”中的起始时间和终止时间分区过滤条件和Where子句目的端的写入目录目的端的表名支持通过宏定义变量表示符“${}”来完成时间类型的宏定义，当前

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
发布脚本任务 - 数据治理中心 DataArts Studio

布包名称进行模糊查询。图2 查看任务状态对于暂时不发布的发布项，开发者、部署者和管理员可以进行撤销。发布后，通过操作列的“查看详情”可以查看任务的发布状态和启动状态，在操作列的“版本对比”可以查看发布包不同版本间的内容差异。图3 查看发布详情父主题：脚本开发

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发
Hive连接参数说明 - 数据治理中心 DataArts Studio

集群配置名仅当“是否使用集群配置”为“是”时，此参数有效。此参数用于选择用户已经创建好的集群配置。集群配置的创建方法请参见管理集群配置。 hive_01 单击“显示高级属性”，然后单击“添加”，您可以添加客户端的配置属性。所添加的每个属性需配置属性名称和值。对于不再需要的属性，可单击属性后的“删除”按钮进行删除。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
更新表的异常数据输出配置 - 数据治理中心 DataArts Studio

REJECT: 已驳回 logic_tb_id String 逻辑实体的ID，ID字符串。 biz_catalog_id String 归属的业务分类的id，ID字符串。 catalog_path String 归属的业务分类的路径 {"l1Id":"","l2Id":"","l3Id":""}。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 质量规则接口
配置OBS目的端参数 - 数据治理中心 DataArts Studio

FS/OBS）之间相互迁移数据，此处的“文件格式”只能选择与源端的文件格式一致。说明：当源端为MRS Hive数据源时，仅支持配置CSV格式。当源端为FTP/SFTP数据源时，仅支持配置二进制格式。 CSV格式重复文件处理方式当源端为HDFS数据源时配置。只有文件名和

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
购买DataArts Studio基础包 - 数据治理中心 DataArts Studio

灾能力和网络时延的要求。如果您的应用需要较高的容灾能力，建议您将资源部署在同一区域的不同可用区内。如果您的应用要求实例之间的网络延时较低，则建议您将资源创建在同一可用区内。详情请参见什么是可用区。虚拟私有云 vpc1 DataArts Studio实例中的数据集成CDM集

 帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例
配置OBS源端参数 - 数据治理中心 DataArts Studio

SV文件的前N行数据作为标题行，不写入目的端的表。否标题行数 “前N行为标题行”选择“是”时才有该参数。抽取数据时将被跳过的标题行数。说明：标题行数不为空，取值为1-99之间的整数。 1 解析首行为列名 “前N行为标题行”选择“是”时才有该参数。选择是否将标题的首行解析为

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置数据血缘 - 数据治理中心 DataArts Studio

Spark节点的“血缘关系”页签，手动配置血缘的输入表。假如MRS Spark作业中的输入表为“hive”，则血缘输入配置如图3所示。图3 配置血缘输入完成血缘的输入表配置后，单击确定，继续配置血缘的输出表。假如MRS Spark作业中的输出表为“a”，则血缘输出配置如图4所示。图4 配置血缘输出完

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
配置数据血缘 - 数据治理中心 DataArts Studio

Spark节点的“血缘关系”页签，手动配置血缘的输入表。假如MRS Spark作业中的输入表为“hive”，则血缘输入配置如图3所示。图3 配置血缘输入完成血缘的输入表配置后，单击确定，继续配置血缘的输出表。假如MRS Spark作业中的输出表为“a”，则血缘输出配置如图4所示。图4 配置血缘输出完

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
DataArts Studio使用流程 - 数据治理中心 DataArts Studio

Studio平台将源数据上传或者接入到云上。数据集成提供同构/异构数据源之间批量数据迁移的服务，支持自建和云上的文件系统，以及关系数据库，数据仓库，NoSQL，大数据云服务，对象存储等数据源。数据集成支持的数据源创建CDM集群创建CDM与数据源之间的连接新建表/文件迁移作业数据目录（元数据采集）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南
如何将一个空间的数据开发作业和数据连接迁移到另一空间？ - 数据治理中心 DataArts Studio

如何将一个空间的数据开发作业和数据连接迁移到另一空间？您需要通过导入导出功能，分别将旧空间的数据连接和作业数据导入到新空间内。数据连接数据，需要在管理中心的资源迁移进行导入导出。具体操作请参考资源迁移。作业数据，需要在数据开发中将作业导入导出。具体操作请参考导出导入作业。父主题：

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 管理中心
新建衍生指标 - 数据治理中心 DataArts Studio

更新：当数据重复时系统中的原有数据为草稿状态，则会覆盖生成新的草稿数据。系统中的原有数据为发布状态，则会生成下展数据。单击“添加文件”，选择编辑完成的导入模板。单击“上传文件”，上传完成后，自动跳转到“上次导入”页签，查看已导入的数据。单击“关闭”。导出可通过导出的方式将衍生指标导出到本地。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标
Python - 数据治理中心 DataArts Studio

中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell和Python脚本都是发往ECS主机的/tmp目录下去运行的，需要确保/tmp目录磁盘不被占满。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
图数据自动化构建与分析场景介绍 - 数据治理中心 DataArts Studio

生成新的元数据xml文件。生成的元数据xml文件，属性（Property）中的数据复合类型（Cardinality），目前仅支持填写为“single”类型，不支持自定义。生成元数据功能本身，支持一次生成多对点表和边表的元数据xml文件。但考虑到Import GES节点的“边数

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
新建指标 - 数据治理中心 DataArts Studio

管理所有业务指标，包括指标的来源、定义等，使用目录维护业务指标。注意，数据质量模块的指标与数据架构模块的业务指标、技术指标当前是相互独立的，不支持交互。前提条件已在DataArts Studio控制台的“实例 > 进入控制台 > 空间管理 > 数据质量 > 业务指标监控 > 指标

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 业务指标监控（待下线）
Shell - 数据治理中心 DataArts Studio

中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell和Python脚本都是发往ECS主机的/tmp目录下去运行的，需要确保/tmp目录磁盘不被占满。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
批量配置作业 - 数据治理中心 DataArts Studio

单击作业目录中的，选择“显示复选框”。图1 显示作业复选框勾选需要批量配置的作业，单击 > 作业配置。图2 作业配置菜单配置作业的通用项。图3 通用配置表1 通用配置参数说明节点状态轮询时间设置所选作业的所有节点轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业

总条数： 1484

上一页
1
...
4
5
6
...
75
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

源端为HBase/CloudTable - 数据治理中心 DataArts Studio

权限管理 - 数据治理中心 DataArts Studio

车联网大数搬迁入湖简介场景介绍 - 数据治理中心 DataArts Studio

时间宏变量使用解析 - 数据治理中心 DataArts Studio

发布脚本任务 - 数据治理中心 DataArts Studio

Hive连接参数说明 - 数据治理中心 DataArts Studio

更新表的异常数据输出配置 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

购买DataArts Studio基础包 - 数据治理中心 DataArts Studio

配置OBS源端参数 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

DataArts Studio使用流程 - 数据治理中心 DataArts Studio

如何将一个空间的数据开发作业和数据连接迁移到另一空间？ - 数据治理中心 DataArts Studio

新建衍生指标 - 数据治理中心 DataArts Studio

Python - 数据治理中心 DataArts Studio

图数据自动化构建与分析场景介绍 - 数据治理中心 DataArts Studio

新建指标 - 数据治理中心 DataArts Studio

Shell - 数据治理中心 DataArts Studio

批量配置作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线