搜索_华为云

新建一个业务场景 - 数据治理中心 DataArts Studio

单击“下一步”，配置调度信息，如下图所示。单击“提交”，完成作业场景的创建。在业务场景管理列表中，单击操作列的“运行”，跳转到运维管理模块。单击右上角的刷新按钮，可以查看业务场景的运行状态为成功。单击运行结果，可查看具体的坪效结果。父主题：使用教程

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 使用教程
Oracle数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

高级属性里的可选参数一般情况下保持默认即可。目的端作业配置目的连接名称：选择创建云搜索服务连接中的“csslink”。索引：待写入数据的Elasticsearch索引，也可以输入一个新的索引，CDM会自动在云搜索服务中创建。类型：待写入数据的Elasticsearch类型，可输入新的类型，CDM支持在目的端自动创建类型。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

ht LibrA的运行非常重要，在CDM数据迁移到DWS/FusionInsight LibrA过程中，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
新建规则 - 数据治理中心 DataArts Studio

所属目录业务规则的存储目录，可选择已创建的目录。目录创建请参见图1。定义关系关系是定义指标和数值间或者指标和指标间的逻辑表达式，可以包含算术运算。指标使用小写字母a-z代替它的缩写，按添加指标的顺序依次为a,b,c,...。说明：只支持一个合法逻辑表达式，支持简单的四则算术运算。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 业务指标监控（待下线）
配置环境变量 - 数据治理中心 DataArts Studio

关于EL表达式的使用，请参见表达式概述。描述否参数说明。配置完一个环境变量后，您还可以进行新增、修改或删除等操作。新增：单击“新增”配置新的环境变量。修改：参数值为常量时，直接在文本框中修改参数值；参数值为EL表达式时，可以单击文本框后方的编辑EL表达式，修改参数值。修改完成后，请“保存”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
配置数据血缘 - 数据治理中心 DataArts Studio

Job 支持DLI、OBS、MySQL以及DWS之间的ETL任务产生的血缘。手动配置血缘在DataArts Studio数据开发的作业中，您可以在数据开发作业节点中，自定义血缘关系的输入表和输出表。注意，当手动配置血缘时，此节点的自动血缘解析将不生效。支持手动配置血缘的作业节点类型如下所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
配置数据血缘 - 数据治理中心 DataArts Studio

Job 支持DLI、OBS、MySQL以及DWS之间的ETL任务产生的血缘。手动配置血缘在DataArts Studio数据开发的作业中，您可以在数据开发作业节点中，自定义血缘关系的输入表和输出表。注意，当手动配置血缘时，此节点的自动血缘解析将不生效。支持手动配置血缘的作业节点类型如下所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
源端为Redis - 数据治理中心 DataArts Studio

关系表行数据在Redis中的存储方式分为“string”和“hash”两种存储方式。 STRING：表示用字符串通过分隔符来表示一行数据的各列，可以有效节省存储空间。 HASH：表示一行数据通过“列名：列值”的方式存储在hash表中。 fromJobConfig.valueSeparator

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
运行历史 - 数据治理中心 DataArts Studio

记录。单击某一条运行记录，可查看当时的脚本信息和运行结果。下载脚本历史运行结果。系统默认支持所有用户都能下载脚本的历史运行结果。您可以在结果页签单击“下载结果”。支持将CSV格式的结果文件下载到本地。查询结果和下载结果最大支持1000条。作业运行历史在DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
数据服务SDK概述 - 数据治理中心 DataArts Studio

I的认证方式有关。只有当通过数据服务创建数据API使用推荐的APP认证方式时，才能通过SDK方式进行数据API调用；当使用其他认证方式时，可以通过API调用工具或浏览器调用。 APP认证：将APP认证方式的API授权给应用后，使用应用的密钥对（AppKey和AppSecret）进

 帮助中心 > 数据治理中心 DataArts Studio > SDK参考 > 数据服务SDK参考
项目ID和账号ID - 数据治理中心 DataArts Studio

在“API凭证”页面，查看账号名和账号ID、IAM用户名和IAM用户ID，在项目列表中查看项目和项目ID。调用API获取项目ID 项目ID可以通过调用查询指定条件下的项目信息API获取，接口为“GET https://{Endpoint}/v3/projects”，其中{Endp

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 使用前必读
CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。目的端

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
配置MongoDB/DDS源端参数 - 数据治理中心 DataArts Studio

基本参数数据库名称选择待迁移的数据库。 mongodb 集合名称相当于关系数据库的表名。单击输入框后面的按钮可进入选择集合名的界面，用户也可以直接输入集合名称。如果选择界面没有待选择的表，请确认表是否已经创建，或者对应连接里的账号是否有元数据查询的权限。 COLLECTION 高级属性

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
数据架构使用流程 - 数据治理中心 DataArts Studio

模型设计：应用逻辑模型、关系建模、维度建模和数据集市的方法，进行分层建模。逻辑模型：用于创建逻辑模型以及逻辑模型的修改和删除，转化为物理模型。同时，可以对逻辑实体进行创建及发布，进行逆向数据库等操作。关系建模：基于关系建模，新建SDI层和DWI层两个模型。 SDI：Source Data

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构
CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。目的端

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

配置源端MySQL库表与目的端Kafka Topic的映射规则。可指定为固定的一个Topic，也可使用内置变量做映射，将不同源表数据同步到不同的Topic中。可以使用的内置变量有：源Topic名：#{source_Topic_name} 同步kafka partition策略支持以下三种投递策略将源端的数据按规则同步到Kafka

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
MySQL数据迁移到DWS - 数据治理中心 DataArts Studio

表名：待写入数据的表名，可以手动输入一个不存在表名，CDM会在DWS中自动创建该表。是否压缩：DWS提供的压缩数据能力，如果选择“是”，将进行高级别压缩，CDM提供了适用I/O读写量大，CPU富足（计算相对小）的压缩场景。更多压缩级别详细说明请参见压缩级别。存储模式：可以根据具体应用场

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
车联网大数搬迁入湖简介场景介绍 - 数据治理中心 DataArts Studio

使用CDM将CDH集群中的HBase HFile抽取出来存入到MRS（MapReduce） HDFS中，再通过HBase修复命令重建HBase表。基于这种迁移方案，可以使用以下2种迁移方式同时进行： CDM通过专线直接迁移近一个月的数据以及备HBase集群的数据： CDH → CDM（华为云） → MRS

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
MD5校验文件一致性 - 数据治理中心 DataArts Studio

该功能由目的端作业参数“校验MD5值”控制，读取文件后写入OBS时，通过HTTP Header将MD5值提供给OBS做写入校验，并将校验结果写入OBS桶（该桶可以不是存储迁移文件的桶）。如果源端没有MD5文件则不校验。迁移文件到文件系统时，目前只支持校验CDM抽取的文件是否与源文件一致（即只校验抽取的数据）。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

选择待导入数据的数据库。 mddb 集合名称选择待导入数据的集合，相当于关系数据库的表名。单击输入框后面的按钮可进入表的选择界面，用户也可以直接输入表名称。如果选择界面没有待选择的表，请确认表是否已经创建，或者对应连接里的账号是否有元数据查询的权限。 COLLECTION 迁移行为

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数

总条数： 824

上一页
1
...
34
35
36
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建一个业务场景 - 数据治理中心 DataArts Studio

Oracle数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

新建规则 - 数据治理中心 DataArts Studio

配置环境变量 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

源端为Redis - 数据治理中心 DataArts Studio

运行历史 - 数据治理中心 DataArts Studio

数据服务SDK概述 - 数据治理中心 DataArts Studio

项目ID和账号ID - 数据治理中心 DataArts Studio

CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

配置MongoDB/DDS源端参数 - 数据治理中心 DataArts Studio

数据架构使用流程 - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

MySQL数据迁移到DWS - 数据治理中心 DataArts Studio

车联网大数搬迁入湖简介场景介绍 - 数据治理中心 DataArts Studio

MD5校验文件一致性 - 数据治理中心 DataArts Studio

配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线