搜索_华为云

管理员操作 - 数据治理中心 DataArts Studio

包含数据湖准备以及数据准备与同步。数据湖准备：由于企业模式下需要区分开发环境和生产环境，因此您需要分别准备对应生产环境和开发环境的两套数据湖服务，用于隔离开发和生产环境：对于集群化的数据源（例如MRS、DWS、RDS、MySQL、Oracle、DIS、ECS），DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间 > 企业模式角色操作
Apache Kafka同步到MRS Kafka - 数据治理中心 DataArts Studio

Apache Kafka官方文档中的配置说明。配置目的端参数。图5 Kafka目的端配置项目标Topic名称规则。配置源端MySQL库表与目的端Kafka Topic的映射规则。可指定为固定的一个Topic，也可使用内置变量做映射，将不同源表数据同步到不同的Topic中。可以

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
GBase数据连接参数说明 - 数据治理中心 DataArts Studio

连接属性否常见配置举例如下： connectTimeout=360000与socketTimeout=360000：迁移数据量较大、或通过查询语句检索全表时，会由于连接超时导致迁移失败。此时可自定义连接超时时间与socket超时时间（单位ms），避免超时导致失败。 tinyInt1isBit=false或mysql

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
Oracle同步到MRS Hudi - 数据治理中心 DataArts Studio

选择库表库与表均支持自定义选择，即可选择一库一表，也可选择多库多表。配置目的端参数。源库表和目标匹配策略。各同步场景下源端库表和目标端库表的匹配策略请参考下表。表5 源库表和目标匹配策略同步场景配置方式整库库匹配策略。与来源库同名：数据将同步至与来源Oracle

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
管理文件水印 - 数据治理中心 DataArts Studio

容不可见，需要进行水印提取。对非结构化数据文件（docx、pptx、xlsx和pdf）注入明水印，可在本地打开文件，查看水印内容。约束与限制结构化数据文件暗水印的注入和提取时，需限制文件大小在4MB之内。非结构化数据文件明水印在注入时，需限制文件大小在20MB之内。不支持为已注入水印的文件再次注入水印。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护
步骤3：数据开发处理 - 数据治理中心 DataArts Studio

处不再展开描述。至此，基于电影评分的数据集成与开发流程示例完成。此外，您还可以根据原始数据，分析不同类型电影的评分、浏览情况等，为营销决策、广告推荐、用户行为预测等提供高质量的信息。父主题：初级版：基于DWS的电影评分数据集成与开发流程

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
新建数据库 - 数据治理中心 DataArts Studio

新建数据库数据连接创建完成后，您可以基于数据连接，通过可视化模式或SQL脚本方式新建数据库。（推荐）可视化模式：您可以直接在DataArts Studio数据开发模块通过No Code方式，新建数据库。 SQL脚本方式：您也可以在DataArts Studio数据开发模块或对

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 数据管理
查询作业详情 - 数据治理中心 DataArts Studio

用户自定义。 resourcePath 是 String 自定义Spark Jar包OBS资源路径 parameters 是 String Spark Jar包自定义参数对于开发的自定义Jar包，可以在此处对参数进行输入替换 input 否 String 输入路径 MRS Sp

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

在某行某列值为“null”，则会被解析为null值。 - MD5文件名后缀文件格式为二进制格式时支持此参数。校验CDM抽取的文件，是否与源文件一致。 .md5 父主题：配置作业源端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
新建整库迁移作业 - 数据治理中心 DataArts Studio

支持整库迁移的数据源请参见支持的数据源。约束限制配置源端和目的端参数时，字段名不可包含&和%。前提条件已新建连接，详情请参见创建CDM与数据源之间的连接。 CDM集群与待迁移数据源可以正常通信。操作步骤进入CDM主界面，单击左侧导航上的“集群管理”，选择集群后的“作业管理”。选择“整库迁移

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
元数据实时同步接口(邀测) - 数据治理中心 DataArts Studio

元数据实时同步接口(邀测) 功能介绍元数据实时同步接口，支持批量。该接口功能处于邀测阶段，后续将随功能公测将逐步开放。调用方法请参见如何调用API。 URI POST /v1/{project_id}/metadata/async-bulk 表1 路径参数参数是否必选参数类型

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据目录API > 数据地图接口
Rest Client数据连接参数说明 - 数据治理中心 DataArts Studio

适用组件勾选数据集成时显示该参数。 DataArts无法直接与非全托管服务进行连接，需要提供DataArts Studio与非全托管服务通信的代理。CDM集群可以提供通信代理服务，请选择一个CDM集群，如果没有可用的CDM集群，请先通过数据集成增量包进行创建。数据集成配置测试地址是测试连

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
MySQL同步到DWS - 数据治理中心 DataArts Studio

源库表和目标匹配策略同步场景配置方式整库 Schema匹配策略。与来源库同名：数据将同步至与来源MySQL库名相同的DWS Schema中。自定义：数据将同步至自行指定的DWS Schema中。表匹配策略。与来源表同名：数据将同步至与来源MySQL表名相同的DWS表中。自定义：数据将同步至自行指定的DWS表中。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
Open/Close Resource - 数据治理中心 DataArts Studio

节点名称，可以包含中文、英文字母、数字、“_”、“-”、“/”、“<”、“>”等各类特殊字符，长度为1～128个字符。服务是选择需要开机/关机的服务： ECS CDM 开关机设置是选择开关机类型：开关开关机对象是选择需要开机/关机的具体对象，例如开启某个CDM集群。表2 高级参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
创建作业 - 数据治理中心 DataArts Studio

用户自定义。 resourcePath 是 String 自定义Spark Jar包OBS资源路径 parameters 是 String Spark Jar包自定义参数对于开发的自定义Jar包，可以在此处对参数进行输入替换 input 否 String 输入路径 MRS Sp

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
修改作业 - 数据治理中心 DataArts Studio

用户自定义。 resourcePath 是 String 自定义Spark Jar包OBS资源路径。 parameters 是 String Spark Jar包自定义参数。对于开发的自定义Jar包，可以在此处对参数进行输入替换。 input 否 String 输入路径。 MRS

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
新建数据表 - 数据治理中心 DataArts Studio

何在数据开发模块新建数据表。前提条件已创建数据库及DWS数据库模式，请参见新建数据库和（可选）新建数据库模式。已在数据开发模块中创建与数据表类型匹配的数据连接，请参见新建数据连接。新建数据表（可视化模式）参考访问DataArts Studio实例控制台，登录DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 数据管理
Kafka连接参数说明 - 数据治理中心 DataArts Studio

于不再需要的属性，可单击属性后的“删除”按钮进行删除。 Apache Kafka Apache Kafka连接适用于用户在本地数据中心或ECS上自建的第三方Kafka，其中本地数据中心的Kafka需通过专线连接。连接Apache Hadoop上的Kafka数据源时，相关参数如表2所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
步骤2：数据开发处理 - 数据治理中心 DataArts Studio

步骤2：数据开发处理本步骤通过BI报表原始数据，分析10大用户关注最多的产品和10大用户评价最差的商品，然后通过作业定期调度执行并将结果每日导出到表中，以支撑信息分析。分析10大用户关注最多的产品在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
创建并管理工作空间 - 数据治理中心 DataArts Studio

Studio实例下允许创建的工作空间数量配额暂无限制，请您根据业务需求自行规划。存储作业日志和脏数据依赖于OBS服务。前提条件请参见购买DataArts Studio基础包，确认已购买DataArts Studio实例。背景说明购买DataArts Studio实例的用户，系统将默认为其创建一个默认的工作空

 帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 管理工作空间

总条数： 281

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理员操作 - 数据治理中心 DataArts Studio

Apache Kafka同步到MRS Kafka - 数据治理中心 DataArts Studio

GBase数据连接参数说明 - 数据治理中心 DataArts Studio

Oracle同步到MRS Hudi - 数据治理中心 DataArts Studio

管理文件水印 - 数据治理中心 DataArts Studio

步骤3：数据开发处理 - 数据治理中心 DataArts Studio

新建数据库 - 数据治理中心 DataArts Studio

查询作业详情 - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

新建整库迁移作业 - 数据治理中心 DataArts Studio

元数据实时同步接口(邀测) - 数据治理中心 DataArts Studio

Rest Client数据连接参数说明 - 数据治理中心 DataArts Studio

MySQL同步到DWS - 数据治理中心 DataArts Studio

Open/Close Resource - 数据治理中心 DataArts Studio

创建作业 - 数据治理中心 DataArts Studio

修改作业 - 数据治理中心 DataArts Studio

新建数据表 - 数据治理中心 DataArts Studio

Kafka连接参数说明 - 数据治理中心 DataArts Studio

步骤2：数据开发处理 - 数据治理中心 DataArts Studio

创建并管理工作空间 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线