搜索_华为云

DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

√ √ √ × √ × 云数据库 RDS（云数据库MySQL） √ √ √ √ √ √ × 云数据库 RDS（云数据库PostgreSQL） √ √ √ √ √ × × 云数据库 RDS（云数据库SQL Server） √ × × √ × × × MySQL √ √ × × √ √

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
OBS数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

用户名、密码：配置为访问云搜索服务集群的用户，需要拥有数据库的读写权限。图2 创建云搜索服务连接单击“保存”回到连接管理界面。创建OBS连接单击CDM集群后的“作业管理”，进入作业管理界面，再选择“连接管理 > 新建连接”，进入选择连接器类型的界面，如图3所示。图3 选择连接器类型连

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
数据源和资源组网络不通如何排查？ - 数据治理中心 DataArts Studio

数据源和资源组网络不通如何排查？问题描述配置Migration实时集成作业时，检测源端、目的端数据源与资源组的连通性报异常。图1 连通性检测异常解决方案请根据异常项参考下表进行排查。表1 网络不通排查方法类型异常项方法数据源 - CDM异常实例状态检查异常检查集群是否在及是否正常运行。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（实时作业）
DWS数据连接参数说明 - 数据治理中心 DataArts Studio

配置元数据实时同步的数据库和数据表范围，不填写默认不筛选。可填写为如下两种形式之一： database_name：筛选数据库名包含“database_name”的数据库 database_name.table_name：筛选数据库名包含“database_name”的数据库，在匹配到的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
如何处理API对应的数据表数据量较大时，获取数据总条数比较耗时的问题？ - 数据治理中心 DataArts Studio

如何处理API对应的数据表数据量较大时，获取数据总条数比较耗时的问题？问题场景创建API时，已打开“返回总条数”开关。当API对应的数据表数据量较大时，获取数据总条数比较耗时。图1 返回总条数解决方案在分页查询时，您可以通过参数（参数名use_total_num）控制是否计算并返回数据总条数。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据服务
通过公网连通网络 - 数据治理中心 DataArts Studio

入方向放行：放通弹性公网IP到数据库监听端口的访问。出方向放行：放通数据库监听端口到弹性公网IP的数据传输。本地IDC自建数据库添加白名单。本地IDC自建数据库需要添加弹性公网IP（例如100.x.x.x/32）访问数据库的权限。各类型数据库添加白名单的方法不同，具体方法请参考各数据库官方文档进行操作。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在本地IDC
开发Shell脚本 - 数据治理中心 DataArts Studio

本的责任人和描述信息。脚本内容大小不能超过16MB。企业模式下，支持从脚本开发界面快速前往发布。标放置在上，单击“前往发布”，进入待发布任务界面。在编辑器上方，单击“运行”。Shell语句运行完成后，在编辑器下方可以查看脚本的执行历史和执行结果。对于执行结果支持如下操作：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
复制脚本 - 数据治理中心 DataArts Studio

复制脚本本章节主要介绍如何复制一个脚本。前提条件已完成脚本开发，请参见开发脚本。操作步骤参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > （可选）管理脚本
复制名称和重命名作业 - 数据治理中心 DataArts Studio

复制名称和重命名作业您可以通过复制名称功能复制当前作业名称，通过重命名功能修改当前作业名称。前提条件已完成作业开发。如何开发作业，请参见开发Pipeline作业。复制名称参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
构造请求 - 数据治理中心 DataArts Studio

构造请求本节介绍REST API请求的组成，并以调用IAM服务的管理员创建IAM用户接口为例说明如何调用API。该API用于管理员创建IAM用户。您还可以通过这个视频教程了解如何构造请求调用API：https://bbs.huaweicloud.com/videos/102987

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 如何调用API
跨空间进行作业调度 - 数据治理中心 DataArts Studio

启动调度job_agent。然后测试运行工作空间A作业job1，待job1实例运行成功后，前往工作空间B实例监控中查看作业运行结果是否符合预期。 job_agent被触发运行。如果当天日期和IF条件中的日期匹配，则job_agent作业中的Subjob节点成功运行、子作业job2也执行完成。否则Subjob节点被跳过。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
CDM有哪些优势？ - 数据治理中心 DataArts Studio

能够极大提高数据迁移的效率。针对Hive、HBase、MySQL、DWS（数据仓库服务）数据源，使用高效的数据导入接口导入数据。多种数据源支持数据源类型繁杂，针对不同数据源开发不同的任务，脚本数量成千上万。支持数据库、Hadoop、NoSQL、数据仓库、文件等多种类型的数据源。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
ThriftService instance, please check the cluster has available resources and check YARN or Spark driver's logs for further information”，如何处理 - 数据治理中心 DataArts Studio

resources and check YARN or Spark driver's logs for further information”，如何处理？问题描述执行SQL语句失败后，系统提示错误信息“Failed to create ThriftService instance,

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
新建数据质量作业 - 数据治理中心 DataArts Studio

单击“导入记录”页签，可查看对应的导入记录。批量运行质量作业系统支持批量运行质量作业，一次最多可批量运行200个质量作业。选择“数据质量监控 > 质量作业”，选择要批量运行的质量作业。单击“更多 > 批量运行”，即可完成质量作业的批量运行。图12 批量运行企业模式下，需要选择运行环境，系统支持可选择“开发环境”或“生产环境”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
使用教程 - 数据治理中心 DataArts Studio

使用教程创建MRS Hive连接器创建MySQL连接器 MySQL数据迁移到MRS Hive分区表 MySQL数据迁移到OBS MySQL数据迁移到DWS MySQL整库迁移到RDS服务 Oracle数据迁移到云搜索服务 Oracle数据迁移到DWS OBS数据迁移到云搜索服务

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
数据开发应用示例 - 数据治理中心 DataArts Studio

type：脚本类型。 content：脚本的内容。 connectionName：脚本关联的连接名称。 database：脚本执行的时候，关联的数据库名称。 queueName：sql执行的时候，运行在dli的队列名称。父主题：应用示例

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 应用示例
配置PostgreSQL/SQL Server源端参数 - 数据治理中心 DataArts Studio

配置PostgreSQL/SQL Server源端参数作业中源连接为从云数据库 PostgreSQL、云数据库 SQL Server、PostgreSQL、Microsoft SQL Server导出的数据时，源端作业参数如表1所示。表1 PostgreSQL/SQL Server作为源端时的作业参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
迁移作业原理 - 数据治理中心 DataArts Studio

主要运行逻辑如下：数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。不同源端数据源的作业分片维度有所不同，因此某些作业可能出现未严格按作业“抽取并发数”参数分片的情况。 CDM依次将Task提交给运行池运行。根据集

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
管理通知 - 数据治理中心 DataArts Studio

实时作业只支持状态为运行异常/失败时发送通知，批处理作业在状态为运行成功和运行异常/失败时都能发送通知。通常使用默认资源队列时，由于DLI的资源队列繁忙，用户间可能会出现抢占资源的情况，不能保证每次都可以得到资源执行相关操作。建议您在业务低峰期再次重试，或选择自建队列运行业务。作业运

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 通知管理
管理维度表 - 数据治理中心 DataArts Studio

据存储在异常表中，可以打开“异常数据输出配置”开关。图8 异常数据输出开关单击开关，并打开“生成异常数据”按钮，表示异常数据将按照配置的参数存储到规定的库中。图9 异常数据输出配置各参数具体含义如下：数据库或Schema：表示存储异常数据的数据库或Schema。表前缀：表示存储异常数据的表的前缀。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模

总条数： 1241

上一页
1
...
11
12
13
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

OBS数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

数据源和资源组网络不通如何排查？ - 数据治理中心 DataArts Studio

DWS数据连接参数说明 - 数据治理中心 DataArts Studio

如何处理API对应的数据表数据量较大时，获取数据总条数比较耗时的问题？ - 数据治理中心 DataArts Studio

通过公网连通网络 - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

复制脚本 - 数据治理中心 DataArts Studio

复制名称和重命名作业 - 数据治理中心 DataArts Studio

构造请求 - 数据治理中心 DataArts Studio

跨空间进行作业调度 - 数据治理中心 DataArts Studio

CDM有哪些优势？ - 数据治理中心 DataArts Studio

ThriftService instance, please check the cluster has available resources and check YARN or Spark driver's logs for further information”，如何处理 - 数据治理中心 DataArts Studio

新建数据质量作业 - 数据治理中心 DataArts Studio

使用教程 - 数据治理中心 DataArts Studio

数据开发应用示例 - 数据治理中心 DataArts Studio

配置PostgreSQL/SQL Server源端参数 - 数据治理中心 DataArts Studio

迁移作业原理 - 数据治理中心 DataArts Studio

管理通知 - 数据治理中心 DataArts Studio

管理维度表 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线