搜索_华为云

数据架构使用流程 - 数据治理中心 DataArts Studio

数仓规划：对数仓分层以及数仓建模进行统一管理。支持用户自定义数仓分层。标准设计：新建码表&数据标准。新建码表：通常只包括一系列允许的值和附加文本描述，与数据标准关联用于生成值域校验质量监控。新建数据标准：用于描述公司层面需共同遵守的属性层数据含义和业务规则。其描述了公司层面对某个数据的共同理解，这些理解一旦

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构
通过数据开发使用参数传递灵活调度CDM作业 - 数据治理中心 DataArts Studio

保存并提交作业版本，单击“测试运行”，执行数据开发作业。数据开发作业执行成功后，单击右上角的“前往监控”，进入“作业监控”页面，查看生成的任务或实例是否符合需求，如图6所示。图6 查看运行结果

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
Redis数据连接参数说明 - 数据治理中心 DataArts Studio

通过KMS加解密数据源认证信息，选择KMS中的任一默认密钥或自定义密钥即可。说明：第一次通过DataArts Studio或KPS使用KMS加密时，会自动生成默认密钥dlf/default或kps/default。关于默认密钥的更多信息，请参见什么是默认密钥。绑定Agent 是 CDM集群提供了DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

通过KMS加解密数据源认证信息，选择KMS中的任一默认密钥或自定义密钥即可。说明：第一次通过DataArts Studio或KPS使用KMS加密时，会自动生成默认密钥dlf/default或kps/default。关于默认密钥的更多信息，请参见什么是默认密钥。绑定Agent 是使用集群配置为是时，是必选项。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
DLI Flink Job - 数据治理中心 DataArts Studio

nk基础镜像，使用Dockerfile将作业运行需要的依赖（文件、jar包或者软件）打包到镜像中，生成自己的自定义镜像，然后将镜像发布到SWR（容器镜像服务）中，最后在此选择自己生成的镜像，运行作业。自定义镜像可以改变Spark作业和Flink作业的容器运行环境。用户可以将一些

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
For Each - 数据治理中心 DataArts Studio

循环产生的子作业可以并发执行，您可设置并发数。说明：如果子作业中包含CDM Job节点，子作业并发数需要设置为1。子作业实例名称后缀否 For循环生成的子任务名称：For循环节点名称 + 下划线 + 后缀。后缀可配置，如果不配置，则按照数字顺序依次递增。表2 高级参数参数是否必选

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
查找表模型列表 - 数据治理中心 DataArts Studio

error_msg String 错误信息。 data Object 返回的数据信息。请求示例分页查询前十条关系建模表信息。 GET https://{endpoint}/v2/{project_id}/design/table-model?offset=1&limit=10&m

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 关系建模接口
MRS Hive数据连接参数说明 - 数据治理中心 DataArts Studio

Id和Secret Access Key）。说明：每个用户仅允许新增两个访问密钥。为保证访问密钥的安全，访问密钥仅在初次生成时自动下载，后续不可再次通过管理控制台界面获取。请在生成后妥善保管。密钥(SK) - 数据集成配置 Hive版本 HIVE_3_X 适用组件勾选数据集成后，呈现此参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
入门实践 - 数据治理中心 DataArts Studio

Hive表构建图数据并自动导入GES 在DataArts Studio中，您可以将原始数据表按照GES数据导入要求处理为标准点数据集和边数据集，并通过自动生成元数据功能，将图数据（点数据集、边数据集和元数据）定期导入到GES服务中，在GES中对最新数据进行可视化图形分析。案例案例：贸易数据统计与分析

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门
Elasticsearch整库迁移到云搜索服务 - 数据治理中心 DataArts Studio

作业配置完成后，单击“保存并运行”，回到作业管理界面，在整库迁移的作业管理界面可查看执行进度和结果。本地Elasticsearch索引中的每个类型都会生成一个子作业并发执行，可以单击作业名查看子作业进度。作业执行完成后，单击作业操作列的“历史记录”，可查看该作业的历史执行记录、读取和写入的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
新建DataArts Studio与MRS Hive数据湖的连接 - 数据治理中心 DataArts Studio

Id和Secret Access Key）。说明：每个用户仅允许新增两个访问密钥。为保证访问密钥的安全，访问密钥仅在初次生成时自动下载，后续不可再次通过管理控制台界面获取。请在生成后妥善保管。密钥(SK) - 数据集成配置 Hive版本 HIVE_3_X 适用组件勾选数据集成后，呈现此参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

支持以CSV、JSON或二进制格式抽取FTP/SFTP的数据。参见配置FTP/SFTP源端参数。 HTTP 用于读取一个公网HTTP/HTTPS URL的文件，包括第三方对象存储的公共读取场景和网盘场景。当前只支持从HTTP URL导出数据，不支持导入。参见配置HTTP源端参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
步骤1：数据准备 - 数据治理中心 DataArts Studio

为对应的数据表名，将后文提供的各样例数据分别复制粘贴到不同CSV文件中，然后保存CSV文件。以下是Windows下生成.csv文件的办法之一：使用文本编辑工具（例如记事本等）新建一个txt文档，将后文提供的样例数据复制进文档中。注意复制后检查数据的行数及数据分行的正确性（注意

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
使用Python脚本连接MRS安全集群执行Impala SQL - 数据治理中心 DataArts Studio

MRS 3.x之前版本：选择“系统设置 > 权限配置 > 用户管理”。在需导出文件的用户所在行，选择“更多 > 下载认证凭据”，待文件自动生成后指定保存位置，并妥善保管该文件。人机用户创建好后，需要登录一次FusionInsight Manager重置密码后才有效。认证凭据中会携带kerberos服务的“krb5

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
数据架构概述 - 数据治理中心 DataArts Studio

单击“关联质量规则”，配置下图所示的相关参数，完成质量规则的关联。有关关联质量规则的更多信息，您也可以参考关联质量规则。图2 关联质量规则生成异常数据：打开此项，表示异常数据将按照配置的参数存储到规定的库中。父主题：数据架构

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构
更新衍生指标 - 数据治理中心 DataArts Studio

error_msg String 错误信息。 data Object 返回的数据信息。请求示例根据传入的参数，更新衍生指标。 PUT https://{endpoint}/v2/{project_id}/design/derivative-indexs { "id" : "

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 衍生指标接口
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

tmp”作为后缀），迁移成功后，再进行rename或move操作，在目的端恢复文件。否作业成功标识文件当作业执行成功时，会在写入目录下生成一个标识文件，文件名由用户指定。不指定时默认关闭该功能。 finish.txt 自定义目录层次支持用户自定义文件的目录层次。例如：【表名

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置Hive目的端参数 - 数据治理中心 DataArts Studio

hive表清理数据模式 “导入前清空数据”设置为“是”时，呈现此参数。选择Hive表清理数据模式。 LOAD_OVERWRITE模式：将生成一个临时数据文件目录，使用Hive的load overwrite语法将临时目录加载到Hive表中。 TRUCATE模式：只清理分区下的数据文件，不删除分区。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
定义识别规则 - 数据治理中心 DataArts Studio

则模板”页签查看。选择内置规则后，可输入测试数据，测试能否通过内置规则识别。 *规则名称规则类型选择“内置”，规则名称自动关联分类模板生成。自定义 *规则名称规则类型选择“自定义”，您可以自行填写分类名称，名称为必填项。建议包含规则含义，避免无意义的描述，以便于使用中能快速选择需要的规则。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
开发Pipeline作业 - 数据治理中心 DataArts Studio

保存后，在右侧的版本里面，会自动生成一个保存版本，支持版本回滚。保存版本时，一分钟内多次保存只记录一次版本。对于中间数据比较重要时，可以通过“新增版本”按钮手动增加保存版本。实时处理作业单击画布上方的“保存”，保存作业的配置信息。保存后，在右侧的版本里面，会自动生成一个保存版本，支持版

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发

总条数： 643

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据架构使用流程 - 数据治理中心 DataArts Studio

通过数据开发使用参数传递灵活调度CDM作业 - 数据治理中心 DataArts Studio

Redis数据连接参数说明 - 数据治理中心 DataArts Studio

Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

DLI Flink Job - 数据治理中心 DataArts Studio

For Each - 数据治理中心 DataArts Studio

查找表模型列表 - 数据治理中心 DataArts Studio

MRS Hive数据连接参数说明 - 数据治理中心 DataArts Studio

入门实践 - 数据治理中心 DataArts Studio

Elasticsearch整库迁移到云搜索服务 - 数据治理中心 DataArts Studio

新建DataArts Studio与MRS Hive数据湖的连接 - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

步骤1：数据准备 - 数据治理中心 DataArts Studio

使用Python脚本连接MRS安全集群执行Impala SQL - 数据治理中心 DataArts Studio

数据架构概述 - 数据治理中心 DataArts Studio

更新衍生指标 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

配置Hive目的端参数 - 数据治理中心 DataArts Studio

定义识别规则 - 数据治理中心 DataArts Studio

开发Pipeline作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线