搜索_华为云

管理配置中心 - 数据治理中心 DataArts Studio

数据库中的表，但能否更新成功是由底层数仓引擎的支持情况决定的。由于不同类型的数仓支持的更新表的能力不同，在数据架构中所做的表更新操作，如果数仓不支持，则无法确保数据库中的表和数据架构中的表是一致的。例如，DLI类型的表更新操作不支持删除表字段，如果在数据架构的表中删除了表字段，则无法在数据库中相应的删除表字段。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
Redis连接参数说明 - 数据治理中心 DataArts Studio

Manager的用户名和密码。从HDFS导出目录时，如果需要创建快照，这里配置的用户需要HDFS系统的管理员权限。如果要创建MRS安全集群的数据连接，不能使用admin用户。因为admin用户是默认的管理页面用户，这个用户无法作为安全集群的认证用户来使用。您可以创建一个新的MRS用户

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
贯标与评估流程 - 数据治理中心 DataArts Studio

评估工作部遴选试点评估单位。入选的试点评估单位向评估机构提交有效的申请材料。评估机构受理评估申请后，组织实施文件评审和现场评审并出具评估报告，给予评估等级的推荐意见，并报评估工作部备案。评估工作部对评估机构报送的评估结果进行合规性审查。对于合规性审查中发现存在较大问题的评估结果有权驳回。对

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍 > 数据治理解决方案 > 数据管理能力成熟度模型DCMM
OBS连接参数说明 - 数据治理中心 DataArts Studio

取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 obs_link OBS终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同。您可以通过以下方式获取OBS桶的Endpoint信息： OBS桶的Endpoin

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

本章节介绍如何在数据开发模块上进行Hive SQL开发。场景说明数据开发模块作为一站式大数据开发平台，支持多种大数据工具的开发。Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的SQL查询功能；可以将SQL语句转换为MapReduce任务进行运行。环境准备已开

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
参考：CDM性能实测数据 - 数据治理中心 DataArts Studio

性能测试中，表数据规格为5000W行100列，HDFS二进制文件数据规格分别为3597W行100列、6667W行100列和10000W行100列。多并发抽取/写入速率，定义为分别取作业抽取并发数为1、10、20、30、50时，最大的抽取/写入速率。数据源抽取写入性能实测数据常见数据源的性能实测结果分别如表1和表2所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

包，可以跳过这部分内容。如果您需要再创建新的CDM集群，请参考购买批量数据迁移增量包章节，完成购买数据集成增量包的操作。集群规格选择“cdm.xlarge”。集群所属的VPC与MRS所属的VPC一致，同时也要与云专线连通的VPC的一致。其它参数可以自定义，或者保持默认。创建CDH

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
开发Python脚本 - 数据治理中心 DataArts Studio

明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
步骤1：流程设计 - 数据治理中心 DataArts Studio

了解数据库迁移的作业规模，了解最大表的迁移时间是否可接受文件类迁移，文件的个数，有没有单文件超过TB级文件本示例的CSV文件仅1个，未超过TB级 - 3 数据开发是否需要作业编排调度？是 - 编排调度会涉及哪些服务，例如MRS、DWS、CDM等？本示例涉及DataArts Studio数据集成和数据质量、MRS

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
步骤1：数据准备 - 数据治理中心 DataArts Studio

csv文件上传数据到对应文件夹中。由于DLI在关联CSV表格用于创建OBS外表时，不支持指定文件名、仅支持指定文件路径，因此需要将CSV表格分别放到不同的文件路径下，且确保文件路径下仅包含所需的CSV表格。使用OBS控制台上传文件的操作，请参见《对象存储服务控制台指南》中的上传文件。本示例中涉及

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
重跑作业实例 - 数据治理中心 DataArts Studio

工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。表3 参数说明参数名是否必选类型描述 retry_location 否 String 作业重跑的位置。error_node （从错误节点开始重跑） first_node

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
示例场景说明 - 数据治理中心 DataArts Studio

本实践通过DataArts Studio服务的数据开发DLF组件和数据湖探索服务（DLI）对某电商商城的用户、商品、评论数据（脱敏后）进行分析，输出用户和商品的各种数据特征，可为营销决策、广告推荐、信用评级、品牌监控、用户行为预测提供高质量的信息。在此期间，您可以学习到数据开发模块脚

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
步骤3：数据集成 - 数据治理中心 DataArts Studio

取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 obs_link OBS终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同。您可以通过以下方式获取OBS桶的Endpoint信息： OBS桶的Endpoin

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
如何配置Hudi Compaction的Spark周期任务？ - 数据治理中心 DataArts Studio

创建Spark SQL单任务作业配置与Hudi相对应的Spark数据连接，并选中需要操作Hudi表对应的数据库。图3 配置连接与数据库根据实际情况配置compaction的调度周期。图4 配置调度周期填写Spark SQL的compaction语句，提交并运行作业。 set

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（实时作业）
步骤2：数据准备 - 数据治理中心 DataArts Studio

a.csv”，将后文提供的样例数据复制粘贴到CSV文件中，然后保存CSV文件。以下是Windows下生成.csv文件的办法之一：使用文本编辑工具（例如记事本等）新建一个txt文档，将后文提供的样例数据复制进文档中。注意复制后检查数据的行数及数据分行的正确性（注意，如果是从PD

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
上传CDM连接驱动 - 数据治理中心 DataArts Studio

已参见FTP/SFTP连接参数说明创建SFTP连接并将对应的驱动上传至线下文件服务器（可选）。如何获取驱动不同类型的关系数据库，需要适配不同类型的驱动。注意，上传的驱动版本不必与待连接的数据库版本相匹配，直接参考表1获取建议版本的JDK8 .jar格式驱动即可。表1 获取驱动关系数据库类型驱动名称

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
记录数据迁移入库时间 - 数据治理中心 DataArts Studio

单击“保存并运行”，回到作业管理的表/文件迁移界面，在作业管理界面可查看作业执行进度和结果。作业执行成功后，单击作业操作列的“历史记录”，可查看该作业的历史执行记录、读取和写入的统计数据。在历史记录界面单击“日志”，可查看作业的日志信息。前往目的端数据源查看数据迁移的入库时间。父主题：

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
记录数据迁移入库时间 - 数据治理中心 DataArts Studio

单击“保存并运行”，回到作业管理的表/文件迁移界面，在作业管理界面可查看作业执行进度和结果。作业执行成功后，单击作业操作列的“历史记录”，可查看该作业的历史执行记录、读取和写入的统计数据。在历史记录界面单击“日志”，可查看作业的日志信息。前往目的端数据源查看数据迁移的入库时间。父主题：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
（推荐）通过SDK调用APP认证方式的API - 数据治理中心 DataArts Studio

对于pre_order_by的值，您可以进行如下修改：删掉某可选的排序参数，则此排序参数不再参与排序。修改自定义排序方式的排序参数为升序或降序方式，则此排序参数按照修改后的排序方式排序。 pre_order_by的值，不支持进行如下修改，否则会修改不生效或导致调用报错。删掉某必选的排序参数，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
步骤1：数据准备 - 数据治理中心 DataArts Studio

创建CSV文件（UTF-8无bom格式），文件名称为对应的数据表名，将后文提供的各样例数据分别复制粘贴到不同CSV文件中，然后保存CSV文件。以下是Windows下生成.csv文件的办法之一：使用文本编辑工具（例如记事本等）新建一个txt文档，将后文提供的样例数据复制进文

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程

总条数： 1467

上一页
1
...
7
8
9
...
74
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理配置中心 - 数据治理中心 DataArts Studio

Redis连接参数说明 - 数据治理中心 DataArts Studio

贯标与评估流程 - 数据治理中心 DataArts Studio

OBS连接参数说明 - 数据治理中心 DataArts Studio

开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

参考：CDM性能实测数据 - 数据治理中心 DataArts Studio

CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

步骤1：流程设计 - 数据治理中心 DataArts Studio

步骤1：数据准备 - 数据治理中心 DataArts Studio

重跑作业实例 - 数据治理中心 DataArts Studio

示例场景说明 - 数据治理中心 DataArts Studio

步骤3：数据集成 - 数据治理中心 DataArts Studio

如何配置Hudi Compaction的Spark周期任务？ - 数据治理中心 DataArts Studio

步骤2：数据准备 - 数据治理中心 DataArts Studio

上传CDM连接驱动 - 数据治理中心 DataArts Studio

记录数据迁移入库时间 - 数据治理中心 DataArts Studio

记录数据迁移入库时间 - 数据治理中心 DataArts Studio

（推荐）通过SDK调用APP认证方式的API - 数据治理中心 DataArts Studio

步骤1：数据准备 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线