搜索_华为云

管理员操作 - 数据治理中心 DataArts Studio

和开发环境的两套数据湖服务，用于隔离开发和生产环境：对于集群化的数据源（例如MRS、DWS、RDS、MySQL、Oracle、DIS、ECS），DataArts Studio通过管理中心的创建数据连接区分开发环境和生产环境的数据湖服务，在开发和生产流程中自动切换对应的数据湖。因

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间 > 企业模式角色操作
元数据实时同步接口(邀测) - 数据治理中心 DataArts Studio

元数据实时同步接口(邀测) 功能介绍元数据实时同步接口，支持批量。该接口功能处于邀测阶段，后续将随功能公测将逐步开放。调用方法请参见如何调用API。 URI POST /v1/{project_id}/metadata/async-bulk 表1 路径参数参数是否必选参数类型

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据目录API > 数据地图接口
字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。在创

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
Open/Close Resource - 数据治理中心 DataArts Studio

节点名称，可以包含中文、英文字母、数字、“_”、“-”、“/”、“<”、“>”等各类特殊字符，长度为1～128个字符。服务是选择需要开机/关机的服务： ECS CDM 开关机设置是选择开关机类型：开关开关机对象是选择需要开机/关机的具体对象，例如开启某个CDM集群。表2 高级参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置实时集成作业 - 数据治理中心 DataArts Studio

配置实时集成作业完成数据连接、网络、资源组等准备工作的配置后，您可创建并配置实时集成作业，将多种输入及输出数据源搭配组成同步链路，进行数据的实时同步。前提条件已开通华为账号，并授权使用实时数据集成服务，详情请参考注册华为账号并开通华为云和授权使用实时数据集成。已购买资源组，详情请参见购买数据集成资源组。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
开发Python脚本 - 数据治理中心 DataArts Studio

见主机连接参数说明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。在创

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。在创

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
Kafka连接参数说明 - 数据治理中心 DataArts Studio

于不再需要的属性，可单击属性后的“删除”按钮进行删除。 Apache Kafka Apache Kafka连接适用于用户在本地数据中心或ECS上自建的第三方Kafka，其中本地数据中心的Kafka需通过专线连接。连接Apache Hadoop上的Kafka数据源时，相关参数如表2所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
Hive连接 - 数据治理中心 DataArts Studio

Hive连接介绍通过Hive连接，可以对MRS的Hive数据源进行抽取、加载数据。连接样例本示例为连接样例消息体。在实际使用中，AK（accessKey）和SK（securityKey）建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 { "links":

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
开发Shell脚本 - 数据治理中心 DataArts Studio

见主机连接参数说明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
配置CDM作业字段映射 - 数据治理中心 DataArts Studio

配置CDM作业字段映射操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段，也可单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
重启集群 - 数据治理中心 DataArts Studio

SOFTLY：一般重启。默认值为“IMMEDIATELY”。强制重启业务进程会中断，并重启集群的虚拟机。 restartLevel 否 String 重启级别： SERVICE：重启服务。 VM：重启虚拟机。默认值为“SERVICE”。 type 是 String 集群节点类型，只支持“cdm”。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
步骤2：数据开发处理 - 数据治理中心 DataArts Studio

步骤2：数据开发处理本步骤通过BI报表原始数据，分析10大用户关注最多的产品和10大用户评价最差的商品，然后通过作业定期调度执行并将结果每日导出到表中，以支撑信息分析。分析10大用户关注最多的产品在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
购买技术资产数量增量包 - 数据治理中心 DataArts Studio

购买技术资产数量增量包技术资产数量增量包用于扩充技术资产数量配额。不同版本的DataArts Studio实例，默认提供了不同的技术资产数量规格限制。该规格是以数据目录中表和OBS文件的数量之和计算的。您可以在新版本模式的DataArts Studio实例卡片上通过“更多 >

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
购买数据模型数量增量包 - 数据治理中心 DataArts Studio

购买数据模型数量增量包数据模型数量增量包用于扩充数据模型数量配额。不同版本的DataArts Studio实例，默认提供了不同的数据模型数量规格限制。该规格是以数据架构中逻辑模型、物理模型、维度表、事实表和汇总表的数量之和计算的。您可以在新版本模式的DataArts Studio实例卡片上通过“更多

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
查询集群实例信息 - 数据治理中心 DataArts Studio

h:mm:ssZ。 name String 实例名称。 id String 实例ID。 flavor flavor object 节点的虚拟机规格，请参见flavor参数说明。 datastore Datastore object 集群信息，请参见datastore参数说明。 dbuser

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
查询连接 - 数据治理中心 DataArts Studio

查询连接功能介绍查询连接接口。调用方法请参见如何调用API。 URI GET /v1.1/{project_id}/clusters/{cluster_id}/cdm/link/{link_name} 表1 路径参数参数是否必选参数类型描述 project_id 是

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 连接管理
数据开发 - 数据治理中心 DataArts Studio

information”，如何处理？使用python调用执行脚本的api报错：The request parameter invalid，如何处理？在ECS上调试好的shell脚本，在DLF中shell脚本执行异常，如何处理？ DataArts Studio调度CDM任务时报错Given transaction

帮助中心 > 数据治理中心 DataArts Studio > 常见问题
实时作业概述 - 数据治理中心 DataArts Studio

支持多种数据源链路组合，您可以将多种输入及输出数据源搭配组成同步链路进行数据同步。详情请参见支持的数据源。复杂网络环境下的数据同步支持云数据库、本地IDC、ECS自建数据库等多种环境下的数据同步。在配置同步任务前，您可以根据数据库所在网络环境，选择合适的同步解决方案来确保数据集成资源组与您将同步的数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）

总条数： 236

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理员操作 - 数据治理中心 DataArts Studio

元数据实时同步接口(邀测) - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

Open/Close Resource - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

Kafka连接参数说明 - 数据治理中心 DataArts Studio

Hive连接 - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

配置CDM作业字段映射 - 数据治理中心 DataArts Studio

重启集群 - 数据治理中心 DataArts Studio

步骤2：数据开发处理 - 数据治理中心 DataArts Studio

购买技术资产数量增量包 - 数据治理中心 DataArts Studio

购买数据模型数量增量包 - 数据治理中心 DataArts Studio

查询集群实例信息 - 数据治理中心 DataArts Studio

查询连接 - 数据治理中心 DataArts Studio

数据开发 - 数据治理中心 DataArts Studio

实时作业概述 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线