搜索_华为云

开发Python脚本 - 数据治理中心 DataArts Studio

已新建主机连接，该Linux主机配有用于执行Python脚本的环境。新建主机连接请参见主机连接参数说明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中Ma

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
步骤2：数据集成 - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发量，与集群规格和表大小有关。按集群规格建议每1CUs（1CUs=1核4G）配置为4。表每行数据大小为1MB以下的可以多并发抽取，超过1MB的建议单线程抽取数据。是否写入脏数据：建议配置为“是”，然后参考图10配置相关参数。脏数据是指与目的端字段不匹的数据，

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
修改自定义项 - 数据治理中心 DataArts Studio

修改自定义项功能介绍修改自定义项（包括表自定义项、属性自定义项、主题自定义项、业务指标自定义项）。调用方法请参见如何调用API。 URI PUT /v2/{project_id}/design/customized-fields 表1 路径参数参数是否必选参数类型描述

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 自定义项接口
与其他云服务的关系 - 数据治理中心 DataArts Studio

Insight，简称DLI）作为数据湖底座，进行数据集成、开发、治理与开放。 MapReduce服务 DataArts Studio支持将MapReduce服务（简称MRS）作为数据湖底座，进行数据集成、开发与治理。云数据仓库服务 DataArts Studio支持将云数据仓库服务（GaussDB(DWS)，简

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
配置增量元数据采集任务 - 数据治理中心 DataArts Studio

图8 配置调度属性单击“提交”，完成采集任务的创建。单击任务管理列表中的“运行”或“启动调度”，跳转到任务监控页面并查看任务状态。父主题：数据目录典型场景教程

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程
DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

M作业、离线作业和实时作业三种场景，支持的数据源情况如下：数据集成（CDM作业）的数据连接在CDM集群中创建，CDM集成作业支持的数据源与CDM集群版本相关，详情请参见数据集成（CDM作业）支持的数据源。数据集成（离线作业）的数据连接来自于管理中心中适用组件已勾选“数据集成”

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
资产识别与管理 - 数据治理中心 DataArts Studio

资产识别与管理云资源的标识与管理可通过标签实现。使用场景通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签（对于DataArts Studio而言，标签作用于其实例上），各服务产生的计费详单中都会体现这些资源实例和实例上设置的标签。

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍 > 安全
参考：作业分片维度 - 数据治理中心 DataArts Studio

CDM在进行作业分片时，根据源端数据源的差异，分片维度有所不同。详情如表1所示。表1 不同源端数据源的作业分片维度数据源分类源端数据源作业分片原理数据仓库数据仓库服务（DWS）支持按表字段分片。不支持按表分区分片。数据湖探索（DLI）支持分区表的分区信息分片。不支持非分区表分片。 Hadoop

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
发现敏感数据 - 数据治理中心 DataArts Studio

据采集任务。管理中心组件对应的数据连接，已开启“元数据实时同步”功能，详见创建DataArts Studio数据连接。约束与限制当前仅支持对数据仓库服务（DWS）、数据湖探索（DLI）、MapReduce服务（MRS Hive）类型的数据源进行敏感数据识别，且仅支持标准数仓类型的DWS数据源。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
CDM有哪些优势？ - 数据治理中心 DataArts Studio

针对Hive、HBase、MySQL、DWS（数据仓库服务）数据源，使用高效的数据导入接口导入数据。多种数据源支持数据源类型繁杂，针对不同数据源开发不同的任务，脚本数量成千上万。支持数据库、Hadoop、NoSQL、数据仓库、文件等多种类型的数据源。多种网络环境支持随

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
数据目录如何可视化展示数据血缘？ - 数据治理中心 DataArts Studio

功的数据开发作业调度任务时，系统会生成作业中的血缘关系，并在数据目录中进行可视化展示。数据血缘的生成和展示，详情请参见节点数据血缘。父主题：数据目录

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据目录
查看工作空间内的数据资产 - 数据治理中心 DataArts Studio

详情：使用数据地图根据表名直接查看表详情，快速查阅明细信息，掌握使用规则。血缘：通过数据地图的血缘分析可以查看每个数据表的来源、去向，并查看每个表及字段的加工逻辑。父主题：查看工作空间数据地图

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 查看工作空间数据地图
HBase连接参数说明 - 数据治理中心 DataArts Studio

2.x版本的集群。如果选择集群后连接失败，请检查MRS集群与作为Agent的CDM实例是否网络互通。网络互通需满足如下条件： DataArts Studio实例（指DataArts Studio实例中的CDM集群）与MRS集群处于不同区域的情况下，需要通过公网或者专线打通网络。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
配置连接参数 - 数据治理中心 DataArts Studio

配置连接参数 OBS连接参数说明 PostgreSQL/SQLServer连接参数说明数据仓库服务（DWS）连接参数说明云数据库MySQL/MySQL数据库连接参数说明 Oracle数据库连接参数说明 DLI连接参数说明 Hive连接参数说明 HBase连接参数说明 HDFS连接参数说明

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
管理资产标签 - 数据治理中心 DataArts Studio

“分类”是指按照种类、等级或性质分别归类。分类是自上而下的，通过对事物进行分析，按照一定的标准，划分出不同的类别。二者主要区别如下：表1 标签和分类区别属性分类标签排他性有无关系从属相关（关联）创建事前规划任意时间代价高低来源请参见新建数据分类

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 查看工作空间数据地图
DataArts Studio和ROMA有什么差异？ - 数据治理中心 DataArts Studio

帮助企业建立统一数据模型。在实际使用中，经常需要DataArts Studio和ROMA的密切配合使用，支撑用户的数字化转型。父主题：咨询与计费

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
新建数据表 - 数据治理中心 DataArts Studio

何在数据开发模块新建数据表。前提条件已创建数据库及DWS数据库模式，请参见新建数据库和（可选）新建数据库模式。已在数据开发模块中创建与数据表类型匹配的数据连接，请参见新建数据连接。新建数据表（可视化模式）参考访问DataArts Studio实例控制台，登录DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 数据管理
补数据监控 - 数据治理中心 DataArts Studio

页面，补数据作业实例运行状态显示为“待确认执行”，可以进行手动确认执行，单击“确认执行”后，补数据作业实例运行状态显示为“等待运行”。父主题：运维调度

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度
新建实时集成作业 - 数据治理中心 DataArts Studio

用于批量分析和数据仓库。实时处理：对源源不断产生的新数据进行实时处理和分析，以满足业务对数据的即时性需求。这种处理方式要求数据在产生后能够立即被处理，并给出相应的结果或触发相应的操作。选择目录选择作业所属的目录，默认为根目录。单击“确定”，创建作业。父主题：数据集成（实时作业）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
批作业监控 - 数据治理中心 DataArts Studio

是否忽略OBS监听默认为“是”。企业模式下，开发者不能对作业实例进行重跑。查看作业的节点信息单击作业名称，在打开的页面中单击作业节点，查看该节点的相关关联作业/脚本与监控信息。单击作业名称，在打开的页面中查看该作业的作业实例，详情请参见批作业监控：作业实例。调度作业相关支持执行调度、暂停调度、恢复调

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 作业监控

总条数： 1612

上一页
1
...
5
6
7
...
81
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开发Python脚本 - 数据治理中心 DataArts Studio

步骤2：数据集成 - 数据治理中心 DataArts Studio

修改自定义项 - 数据治理中心 DataArts Studio

与其他云服务的关系 - 数据治理中心 DataArts Studio

配置增量元数据采集任务 - 数据治理中心 DataArts Studio

DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

资产识别与管理 - 数据治理中心 DataArts Studio

参考：作业分片维度 - 数据治理中心 DataArts Studio

发现敏感数据 - 数据治理中心 DataArts Studio

CDM有哪些优势？ - 数据治理中心 DataArts Studio

数据目录如何可视化展示数据血缘？ - 数据治理中心 DataArts Studio

查看工作空间内的数据资产 - 数据治理中心 DataArts Studio

HBase连接参数说明 - 数据治理中心 DataArts Studio

配置连接参数 - 数据治理中心 DataArts Studio

管理资产标签 - 数据治理中心 DataArts Studio

DataArts Studio和ROMA有什么差异？ - 数据治理中心 DataArts Studio

新建数据表 - 数据治理中心 DataArts Studio

补数据监控 - 数据治理中心 DataArts Studio

新建实时集成作业 - 数据治理中心 DataArts Studio

批作业监控 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线