搜索_华为云

管理集群标签 - 数据治理中心 DataArts Studio

Studio服务进入数据集成界面可以看到。单击集群名称后，选择“标签”页签。图2 修改集群配置单击“添加/编辑标签”，通过添加、修改标签为CDM集群设置资源标识。图3 添加标签一个集群最多可添加10个标签。标签键（key）的最大长度为36个字符，标签值（value）的最大长度为43个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
源端为Kafka - 数据治理中心 DataArts Studio

topic列表，可以为多个topic，以“,”作为分隔符。 fromJobConfig.kafkaConsumerStrategy 是枚举从Kafka拉取数据时的初始偏移量设置： LATEST：最大偏移量，即最新的数据。 EARLIEST：最小偏移量，即最老的数据。 fromJobConfig.isPermanency

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
配置Redis目的端参数 - 数据治理中心 DataArts Studio

迁移。否键分隔符用来分隔关系型数据库的表和列名。 _ 值分隔符以STRING方式存储时，列之间的分隔符。 ; key值有效期用于设置统一的生存时间，单位：秒。 300 父主题：配置CDM作业目的端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
源端为DIS - 数据治理中心 DataArts Studio

fromJobConfig.streamName 是 String DIS的通道名。 fromJobConfig.disConsumerStrategy 是枚举设置从DIS拉取数据时的初始偏移量： LATEST：最大偏移量，即最新的数据。 FROM_LAST_STOP：从上次停止处继续拉取。 EARLIEST：最小偏移量，即最早的数据。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
管理作业标签 - 数据治理中心 DataArts Studio

如果导入的作业名有重复，系统会按后面一列来识别，标签标识按照该行来处理。添加方式：支持追加和覆盖两种。追加：若该作业已设置了作业标签，新添加的标签不会覆盖原来的标签。覆盖：若该作业已设置了作业标签，新添加的标签将会直接覆盖原来的标签。单击“确定”，完成导入。导出作业标签在数据开发主界面的左侧导航栏，选择“配置管理

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
源端为HBase/CloudTable - 数据治理中心 DataArts Studio

选择是否拆分Rowkey，例如“true”。 fromJobConfig.delimiter 否 String 用于切分Rowkey的分隔符，若不设置则不切分，例如“|”。 fromJobConfig.startTime 否 String 时间区间左边界（包含该值），格式为“yyyy-MM-dd

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
管理回收站 - 数据治理中心 DataArts Studio

除的权限集（包含空间权限集、权限集以及通用角色）或动态脱敏策略数据。不同数据还原时的操作基本一致，后续步骤以还原权限集数据为例，为您介绍如何还原数据。在权限集页签，找到待还原的权限集，单击列表操作栏中的“还原”进行数据还原。或者勾选待还原的权限集，单击列表上方的“还原”，进行批量还原。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全
新建复合指标 - 数据治理中心 DataArts Studio

环比增长率描述描述信息。支持的长度为0~600个字符。表达式 *设定表达式选择所需要的衍生指标或复合指标，并根据实际需求在“表达式”中设置表达式。同比增长率 *同比配置选择年同比、月同比或者周同比。 *设定衍生指标选择所需要的衍生指标，此处仅展示有时间限定衍生指标。系统

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标
数据库、数据仓库、数据湖与华为智能数据湖方案是什么，有哪些区别和联系？ - 数据治理中心 DataArts Studio

包括结构化、半结构化和非结构化数据。数据处理工具，则分为两大类：第一类工具，聚焦如何把数据“搬到”湖里。包括定义数据源、制定数据同步策略、移动数据、编制数据目录等。第二类工具，关注如何对湖中的数据进行分析、挖掘、利用。数据湖需要具备完善的数据管理能力、多样化的数据分析能力

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
开发并调度Import GES作业 - 数据治理中心 DataArts Studio

数据窗口，如图6所示。在新建元数据窗口内，分别选择MRS中的“edge_friends”边表和“vertex_user”点表，输出目录可以设置为OBS点表和边表所在目录，然后单击生成，系统会自动在“元数据”参数处回填已生成的元数据Schema所在的OBS目录。 Import_GE

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
定义识别规则 - 数据治理中心 DataArts Studio

*数据密级对配置的数据进行等级划分。如果现有的分级不满足需求，请进入数据密级页面进行设置，详情请参见定义数据密级。数据分类对配置的数据进行分类划分。如果现有的分类不满足需求，请进入数据分类页面进行设置，详情请参见定义数据分类。规则描述对当前规则进行简单描述。内置 *规则模板

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
迁移文件时加解密 - 数据治理中心 DataArts Studio

目的端支持的数据源：HDFS（使用二进制格式传输时支持）。下面分别以HDFS导出加密文件时解密、导入文件到HDFS时加密为例，介绍AES-256-GCM加解密的使用方法。源端配置解密创建从HDFS导出文件的CDM作业时，源端数据源选择HDFS、文件格式选择二进制格式后，在“源端作业配置”的“高级属性”中，配置如下参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
Import GES - 数据治理中心 DataArts Studio

用于存储导入图过程中不符合元数据定义的点、边数据集和详细日志。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
定义识别规则分组 - 数据治理中心 DataArts Studio

数据识别规则页面。单击页面上方“规则分组”页签，进入分组列表页面。图1 新建数据识别规则组单击“新建”，输入新建分组名称和描述，参数设置参考表1，并勾选左侧列表中的识别规则。配置完成后单击“确定”即可。图2 新建分组参数配置您所勾选的规则将显示在右侧列表中，右侧已选列表

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
配置Hudi目的端参数 - 数据治理中心 DataArts Studio

字段的值替换为当前时间。所选字段必须为timestamp类型。 - 写入参数在执行Spark SQL往hudi插入数据前，通过set语法设置参数，从而控制spark的写入行为。 hoodie.combine.before.upsert 父主题：配置作业目的端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
文件增量迁移 - 数据治理中心 DataArts Studio

配置作业定时自动执行，“重复周期”为1天。这样每天就可以把昨天生成的文件都导入到目的端目录，实现增量同步。文件增量迁移场景下，“路径过滤器”的使用方法同“文件过滤器”一样，需要路径名称里带有时间字段，这样可以定期增量同步指定目录下的所有文件。时间过滤参数位置：在创建表/文件迁移作业时

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导 > 增量迁移原理介绍
迁移文件时加解密 - 数据治理中心 DataArts Studio

目的端支持的数据源：HDFS（使用二进制格式传输时支持）。下面分别以HDFS导出加密文件时解密、导入文件到HDFS时加密为例，介绍AES-256-GCM加解密的使用方法。源端配置解密创建从HDFS导出文件的CDM作业时，源端数据源选择HDFS、文件格式选择二进制格式后，在“源端作业配置”的“高级属性”中，配置如下参数。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
新建业务场景 - 数据治理中心 DataArts Studio

调度任务的生效时间段。调度周期选择调度任务的执行周期，并配置相关参数。分钟小时天周间隔时间调度任务的间隔时间。调度时间设置调度任务的起始时间和结束时间。父主题：业务指标监控（待下线）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 业务指标监控（待下线）
文件增量迁移 - 数据治理中心 DataArts Studio

配置作业定时自动执行，“重复周期”为1天。这样每天就可以把昨天生成的文件都导入到目的端目录，实现增量同步。文件增量迁移场景下，“路径过滤器”的使用方法同“文件过滤器”一样，需要路径名称里带有时间字段，这样可以定期增量同步指定目录下的所有文件。时间过滤参数位置：在创建表/文件迁移作业时

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践 > 增量迁移原理介绍
实时作业监控 - 数据治理中心 DataArts Studio

等信息。在节点监控页签，可以查看实时作业的运行日志。同时，您可以查看当前作业版本、作业运行状态、启动、重跑、作业开发、是否显示指标监控、设置作业刷新频率等。实时作业监控：禁用节点后恢复您可以对实时作业中某个节点配置“禁用”后恢复运行，恢复运行时可以重新选择运行位置。参考访问DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 作业监控

总条数： 1208

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理集群标签 - 数据治理中心 DataArts Studio

源端为Kafka - 数据治理中心 DataArts Studio

配置Redis目的端参数 - 数据治理中心 DataArts Studio

源端为DIS - 数据治理中心 DataArts Studio

管理作业标签 - 数据治理中心 DataArts Studio

源端为HBase/CloudTable - 数据治理中心 DataArts Studio

管理回收站 - 数据治理中心 DataArts Studio

新建复合指标 - 数据治理中心 DataArts Studio

数据库、数据仓库、数据湖与华为智能数据湖方案是什么，有哪些区别和联系？ - 数据治理中心 DataArts Studio

开发并调度Import GES作业 - 数据治理中心 DataArts Studio

定义识别规则 - 数据治理中心 DataArts Studio

迁移文件时加解密 - 数据治理中心 DataArts Studio

Import GES - 数据治理中心 DataArts Studio

定义识别规则分组 - 数据治理中心 DataArts Studio

配置Hudi目的端参数 - 数据治理中心 DataArts Studio

文件增量迁移 - 数据治理中心 DataArts Studio

迁移文件时加解密 - 数据治理中心 DataArts Studio

新建业务场景 - 数据治理中心 DataArts Studio

文件增量迁移 - 数据治理中心 DataArts Studio

实时作业监控 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线