搜索_华为云

新建数据质量规则 - 数据治理中心 DataArts Studio

计算数据表的单表大小、字段分组、相关波动率近一天的规则波动监控。近7天波动率计算数据表的单表大小、字段分组、相关波动率近七天的规则波动监控。近30天波动率计算数据表的单表大小、字段分组、相关波动率近三十天的规则波动监控。字段级唯一性字段唯一值计算数据表中指定字段的唯一值行数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
查看业务场景实例 - 数据治理中心 DataArts Studio

查看业务场景实例管理所有运行的业务场景，查看运行状态、运行日志、问题处理等。界面说明介绍“业务指标监控 > 运维管理”页面中的区域和按键功能。图1 运维管理页面表1 运维管理页面说明序号区域描述 1 菜单栏运维管理的菜单栏，包括业务场景实例和我的订阅。业务场景

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 业务指标监控（待下线）
设置实时处理集成作业告警规则 - 数据治理中心 DataArts Studio

Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。在数据开发主界面的左侧导航栏，选择“运维调度 > 作业监控”。选择“实时集成作业监控”页签，单击作业名称。在详情页面，选择“监控信息”，单击“创建告警规则”，进入云监控服务的创建告警规则界面，创建该作业的告警规则。设置完成后，单

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 实时处理集成作业开发 > 管理并查看监控指标
新建Hadoop集群配置 - 数据治理中心 DataArts Studio

MRS集群：MRS HDFS，MRS HBase，MRS Hive。 FusionInsight集群：FusionInsight HDFS，FusionInsight HBase，FusionInsight Hive。 Apache集群：Apache HDFS，Apache HBase，Apache

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接
Spark Python脚本如何引用Python脚本？ - 数据治理中心 DataArts Studio

print("xxx") --py-files hdfs:///tmp/pyspark/hello.py 在作业算子MRS Spark Python中引用Python脚本：在运行程序参数中配置参数--py-files和参数值hdfs:///tmp/pyspark/hello.py。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
设置CDM告警规则 - 数据治理中心 DataArts Studio

进入CDM主界面，选择“集群管理”，选择集群操作列中的“更多 > 查看监控指标”。单击监控指标页面左上角的返回按钮，进入云监控服务的界面，选择“云数据迁移服务”服务监控项对应操作列的“创建告警规则”。图1 “云数据迁移服务”服务监控项根据界面提示设置CDM集群的告警规则。设置完成后，单

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 创建并管理CDM集群 > 管理并查看CDM监控指标
在作业监控页面里的“上次实例状态”只有运行成功、运行失败，这是为什么？ - 数据治理中心 DataArts Studio

在作业监控页面里的“上次实例状态”只有运行成功、运行失败，这是为什么？问题描述在作业监控页面里的“上次实例状态”只有运行成功、运行失败。解决方案上次实例状态是作业已经执行完成，只有成功、失败；实例监控里面状态有取消、暂停等好几种，是因为展示了作业的所有状态，另外作业运行异常和错误都会是作业失败的状态。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
配置资源权限 - 数据治理中心 DataArts Studio

目前已经支持的组件及相关权限如表1所示。具体权限解释可参考MRS配置组件权限策略。表1 支持的组件及权限列表组件名权限说明 HDFS HDFS文件的权限： Read：读权限 Write：写权限 Excute：执行权限 Hive Hive数据库、数据表、列的权限： Select：查询权限

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > Ranger权限访问控制
管理样本库 - 数据治理中心 DataArts Studio

管理样本库数据安全支持将您提供的OBS或HDFS样本文件生成样本库。当新建随机脱敏或字符替换类型的脱敏算法时，可以选择将敏感数据脱敏为样本库文件中的值。本章主要介绍如何创建样本。前提条件已在OBS或HDFS中上传样本文件。样本文件只支持txt格式，大小建议不超过10MB，其中数据可通过换行“\n”、空格“

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 静态脱敏任务
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 关键操作指导
配置CDM作业字段映射 - 数据治理中心 DataArts Studio

配置CDM作业字段映射操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段，也可单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业
步骤4：元数据采集 - 数据治理中心 DataArts Studio

步骤4：元数据采集为了在DataArts Studio平台中对迁移到云上的原始数据进行管理和监控，我们必须先在DataArts Studio数据目录模块中对SDI贴源层数据进行元数据采集并监控。采集并监控元数据在DataArts Studio控制台首页，选择对应工作空间的“数据目录”模块，进入数据目录页面。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
上传存量数据 - 数据治理中心 DataArts Studio

集群创建完成后，选择集群后面的“作业管理 > 连接管理 > 新建连接”，进入选择连接类型的界面，如图1所示。图1 选择连接器类型连接H公司本地的Apache Hadoop HDFS文件系统时，连接类型选择“Apache HDFS”，然后单击“下一步”。图2 创建HDFS连接名称：用户

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 贸易数据极简上云与统计分析 > 使用CDM上传数据到OBS
配置Hive源端参数 - 数据治理中心 DataArts Studio

CDM作业实际启动时间-偏移量”。 TBL_E 读取方式包括HDFS和JDBC两种读取方式。默认为HDFS方式，如果没有使用WHERE条件进行数据过滤及在字段映射页面添加新字段的需求，选择HDFS方式即可。 HDFS文件方式读取数据时，性能较好，但不支持使用WHERE条件进行数据过滤及在字段映射页面添加新字段。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置Hive源端参数 - 数据治理中心 DataArts Studio

Hive作为源端时的作业参数参数类型参数名说明取值样例基本参数读取方式包括HDFS和JDBC两种读取方式。默认为HDFS方式，如果没有使用WHERE条件做数据过滤及在字段映射页面添加新字段的需求，选择HDFS方式即可。 HDFS文件方式读取数据时，性能较好，但不支持使用WHERE条件做数据过滤及在字段映射页面添加新字段。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业源端参数
MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

ive分区方法减少每一次扫描的总数据量，这种做法可以显著地改善性能。 Hive的分区使用HDFS的子目录功能实现，每一个子目录包含了分区对应的列名和每一列的值。当分区很多时，会有很多HDFS子目录，如果不依赖工具，将外部数据加载到Hive表各分区不是一件容易的事情。云数据迁移服务

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 使用教程
管理资源 - 数据治理中心 DataArts Studio

选择资源所在的位置，当前支持OBS和HDFS两种资源存储位置。HDFS当前只支持MRS Spark、MRS Flink Job、MRS MapReduce节点。文件路径是当“资源位置”选择OBS时，文件路径选择OBS文件路径。当“资源位置”选择HDFS时，文件路径选择MRS集群名称。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理
查询权限集中配置的url信息 - 数据治理中心 DataArts Studio

查询权限集中配置的url信息功能介绍查询权限集中配置的url信息，例如obs、hdfs等组件中的url路径。调用方法请参见如何调用API。 URI GET /v1/{project_id}/security/permission-sets/datasource/urls 表1

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据安全API > 权限管理接口

总条数： 498

上一页
1
2
3
4
5
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建数据质量规则 - 数据治理中心 DataArts Studio

查看业务场景实例 - 数据治理中心 DataArts Studio

设置实时处理集成作业告警规则 - 数据治理中心 DataArts Studio

新建Hadoop集群配置 - 数据治理中心 DataArts Studio

Spark Python脚本如何引用Python脚本？ - 数据治理中心 DataArts Studio

设置CDM告警规则 - 数据治理中心 DataArts Studio

在作业监控页面里的“上次实例状态”只有运行成功、运行失败，这是为什么？ - 数据治理中心 DataArts Studio

配置资源权限 - 数据治理中心 DataArts Studio

管理样本库 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

配置CDM作业字段映射 - 数据治理中心 DataArts Studio

步骤4：元数据采集 - 数据治理中心 DataArts Studio

上传存量数据 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

管理资源 - 数据治理中心 DataArts Studio

查询权限集中配置的url信息 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线