搜索_华为云

DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

ORACLE ORACLE数据库系统是以分布式数据库为核心的一组软件产品，是目前最流行的客户/服务器(CLIENT/SERVER)或B/S体系结构的数据库之一。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
作业开发流程 - 数据治理中心 DataArts Studio

作业开发流程作业开发功能提供如下能力：提供图形化设计器，支持拖拉拽方式快速构建数据处理工作流。预设数据集成、计算&分析、资源管理、数据监控、其他等多种任务类型，通过任务间依赖完成复杂数据分析处理。支持多种作业调度方式。支持导入和导出作业。支持作业状态运维监控和作业结果通知

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
脚本开发流程 - 数据治理中心 DataArts Studio

脚本开发流程脚本开发功能提供如下能力：提供在线脚本编辑器，支持进行SQL、Shell、Python等脚本在线代码开发和调测。支持导入和导出脚本。支持使用变量和函数。提供编辑锁定能力，支持多人协同开发场景。支持脚本的版本管理能力，支持生成保存版本和提交版本。保存版本时，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发
Open/Close Resource - 数据治理中心 DataArts Studio

服务是选择需要开机/关机的服务： ECS CDM 开关机设置是选择开关机类型：开关开关机对象是选择需要开机/关机的具体对象，例如开启某个CDM集群。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
购买批量数据迁移增量包 - 数据治理中心 DataArts Studio

实例类型目前数据集成集群支持以下部分规格供用户选择： cdm.large：大规格，8核CPU、16G内存的虚拟机，最大带宽/基准带宽为3/0.8 Gbps，集群作业并发数上限为16。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

开发实时处理单任务DLI Spark作业前提条件参见新建作业创建一个实时处理的单任务DLI Spark作业。配置DLI Spark作业表1 配置属性参数参数是否必选说明作业名称是输入DLI Spark作业名称。作业名称只能包含英文字母、数字、下划线和中划线，且长度为

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
创建DataArts Studio数据连接 - 数据治理中心 DataArts Studio

对于集群化的数据源（例如MRS、DWS、RDS、MySQL、Oracle、DIS、ECS），如果使用两套集群，DataArts Studio通过管理中心的创建数据连接区分开发环境和生产环境的数据湖服务，在开发和生产流程中自动切换对应的数据湖。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink Jar作业前提条件参见新建作业创建一个实时处理的单任务Flink Jar作业。配置MRS Flink Jar作业表1 配置MRS Flink Jar作业属性参数参数是否必选说明 Flink作业名称是输入Flink作业名称。系统支持

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
新建Hadoop集群配置 - 数据治理中心 DataArts Studio

“客户端类型”选择“仅配置文件”，“下载路径”选择“服务器端”或“远端主机”，自定义文件保存路径后，单击“确定”开始生成客户端配置文件。将生成的配置文件，保存到本地路径。具体可参见MapReduce服务文档。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
Kafka连接参数说明 - 数据治理中心 DataArts Studio

Apache Kafka Apache Kafka连接适用于用户在本地数据中心或ECS上自建的第三方Kafka，其中本地数据中心的Kafka需通过专线连接。连接Apache Hadoop上的Kafka数据源时，相关参数如表2所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
步骤3：数据集成 - 数据治理中心 DataArts Studio

对象存储访问标识(AK) AK和SK分别为登录OBS服务器的访问标识与密钥。您需要先创建当前账号的访问密钥，并获得对应的AK和SK。您可以通过如下方式获取访问密钥。登录控制台，在用户名下拉列表中选择“我的凭证”。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
重启集群 - 数据治理中心 DataArts Studio

强制重启业务进程会中断，并重启集群的虚拟机。 restartLevel 否 String 重启级别： SERVICE：重启服务。 VM：重启虚拟机。默认值为“SERVICE”。 type 是 String 集群节点类型，只支持“cdm”。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
业务指标 - 数据治理中心 DataArts Studio

业务指标经过数据调研和需求分析之后，您需要根据需求落地指标。指标是衡量目标总体特征的统计数值，是能表征企业某一业务活动中业务状况的数值指示器。指标一般由指标名称和指标数值两部分组成，指标名称及其涵义体现了指标质的规定性和量的规定性两个方面的特点，指标数值反映了指标在具体时间、地点

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计
指标定义 - 数据治理中心 DataArts Studio

指标定义经过数据调研和需求分析之后，您需要根据需求落地指标。指标是衡量目标总体特征的统计数值，是能表征企业某一业务活动中业务状况的数值指示器。指标一般由指标名称和所属流程两部分组成，指标名称及其涵义体现了指标质的规定性和量的规定性两个方面的特点，指标数值反映了指标在具体时间、地点

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据指标 > 指标设计
配置CDM作业字段映射 - 数据治理中心 DataArts Studio

配置CDM作业字段映射操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段，也可单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
查询集群实例信息 - 数据治理中心 DataArts Studio

flavor flavor object 节点的虚拟机规格，请参见flavor参数说明。 datastore Datastore object 集群信息，请参见datastore参数说明。 dbuser String 数据库用户，这里为cdm。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
Hive连接参数说明 - 数据治理中心 DataArts Studio

Apache Hive Apache Hive连接适用于用户在本地数据中心或ECS上自建的第三方Hadoop，其中本地数据中心的Hadoop需通过专线连接。 Apache Hive的连接参数如表3所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
配置方式生成API - 数据治理中心 DataArts Studio

GET：请求服务器返回指定资源，推荐使用GET请求。 POST：请求服务器新增资源或执行特殊操作。POST请求当前不支持body体，而是直接透传。描述对API进行简要描述。标签对API设置标签。用于标记当前API的属性，创建后可以通过标签快速检索定位API。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 创建API
实时作业概述 - 数据治理中心 DataArts Studio

复杂网络环境下的数据同步支持云数据库、本地IDC、ECS自建数据库等多种环境下的数据同步。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

这些非云服务的数据库，既可以是用户在本地数据中心自建的数据库，也可以是用户在ECS上部署的，还可以是第三方云上的数据库服务。从这些数据源导出数据时，CDM使用JDBC接口抽取数据，源端作业参数相同，详细请参见配置PostgreSQL/SQL Server源端参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业

总条数： 252

上一页
1
...
6
7
8
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

作业开发流程 - 数据治理中心 DataArts Studio

脚本开发流程 - 数据治理中心 DataArts Studio

Open/Close Resource - 数据治理中心 DataArts Studio

购买批量数据迁移增量包 - 数据治理中心 DataArts Studio

开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

创建DataArts Studio数据连接 - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

新建Hadoop集群配置 - 数据治理中心 DataArts Studio

Kafka连接参数说明 - 数据治理中心 DataArts Studio

步骤3：数据集成 - 数据治理中心 DataArts Studio

重启集群 - 数据治理中心 DataArts Studio

业务指标 - 数据治理中心 DataArts Studio

指标定义 - 数据治理中心 DataArts Studio

配置CDM作业字段映射 - 数据治理中心 DataArts Studio

查询集群实例信息 - 数据治理中心 DataArts Studio

Hive连接参数说明 - 数据治理中心 DataArts Studio

配置方式生成API - 数据治理中心 DataArts Studio

实时作业概述 - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线