搜索_华为云

数据集市 - 数据治理中心 DataArts Studio

REPLICATION方式：在每一个DN节点上存储一份全量表数据。这种存储方式的优点是每个DN上都有此表的全量数据，在join操作中可以避免数据重分布操作，从而减小网络开销；缺点是每个DN都保留了表的完整数据，造成数据的冗余。一般情况下只有较小的维度表才会定义为Replication表。 HASH方式：采

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计
新建维度 - 数据治理中心 DataArts Studio

environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 维度接口
查找事实表 - 数据治理中心 DataArts Studio

environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 事实表接口
创建表模型 - 数据治理中心 DataArts Studio

environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 关系建模接口
DLI Spark - 数据治理中心 DataArts Studio

（容器镜像服务）中，最后在此选择自己生成的镜像，运行作业。自定义镜像可以改变Spark作业和Flink作业的容器运行环境。用户可以将一些私有能力内置到自定义镜像中，从而增强作业的功能、性能。关于自定义镜像的更多详情，请参见自定义镜像。作业名称是填写DLI Spark作业的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
查看维度颗粒度 - 数据治理中心 DataArts Studio

environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 维度接口
Java - 数据治理中心 DataArts Studio

running”消息体。在“Main.java”中加入以下引用。 import com.cloud.apigateway.sdk.utils.Client; import com.cloud.apigateway.sdk.utils.Request; import org.apache

帮助中心 > 数据治理中心 DataArts Studio > SDK参考 > 数据服务SDK参考 > 使用APP认证调用API
管理脱敏算法 - 数据治理中心 DataArts Studio

算法测试功能的限制，静态脱敏时并不限制样本文件大小不超过10kb。新建哈希类型的脱敏算法时，其中的dws-SM3密码杂凑算法是DWS引擎专有算法，结果为16进制字符串，其字母为小写，要求DWS集群版本不低于8.1.3。通用-SM3密码杂凑算法为DLI或MRS引擎通用算法，结果为16进制字符串，其字母为大写。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 静态脱敏任务
MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

DWS的写入模式，可在目的端配置中设置，实时处理集成作业推荐使用COPY MODE。 UPSERT：为批量更新入库模式。 COPY：为DWS专有的高性能批量入库模式。批写最大数据量 int 50000 DWS单次写入的最大条数，可在目的端配置中设置。当缓存的数据达到“批写最大数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
新建维度 - 数据治理中心 DataArts Studio

REPLICATION：在每一个DN节点上存储一份全量表数据。这种存储方式的优点是每个DN上都有此表的全量数据，在join操作中可以避免数据重分布操作，从而减小网络开销；缺点是每个DN都保留了表的完整数据，造成数据的冗余。一般情况下只有较小的维度表才会定义为Replication表。 HASH：采用这

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
更新表模型 - 数据治理中心 DataArts Studio

environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 关系建模接口
创建数据集成作业 - 数据治理中心 DataArts Studio

创建数据集成作业本章节将介绍如何创建DataArts Studio数据集成作业。本例中，需要创建如下三类集成作业： OBS到MySQL迁移作业：为方便演示，需要将OBS中的CSV格式的样例数据导入到MySQL数据库中。 MySQL到OBS迁移作业：正式业务流程中，需要将MyS

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

DLI的链路场景），则可以单击后选择“添加新字段”来手动增加，确保导入到目的端的数据完整。关系数据库、Hive、MRS Hudi及DLI做源端时，不支持获取样值功能。支持通过字段映射界面的，可自定义添加常量、变量及表达式。当作业源端为OBS、迁移CSV文件时，并且配置“解析首行为列名”参数的场景下显示列名。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
DLI Flink Job - 数据治理中心 DataArts Studio

（容器镜像服务）中，最后在此选择自己生成的镜像，运行作业。自定义镜像可以改变Spark作业和Flink作业的容器运行环境。用户可以将一些私有能力内置到自定义镜像中，从而增强作业的功能、性能。关于自定义镜像的更多详情，请参见自定义镜像。 CUs 是 CUs为DLI计费单位，一个CU是1核4G的资源配置。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
获取主题树信息 - 数据治理中心 DataArts Studio

environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 主题管理接口
新建事实表 - 数据治理中心 DataArts Studio

REPLICATION：在每一个DN节点上存储一份全量表数据。这种存储方式的优点是每个DN上都有此表的全量数据，在join操作中可以避免数据重分布操作，从而减小网络开销；缺点是每个DN都保留了表的完整数据，造成数据的冗余。一般情况下只有较小的维度表才会定义为Replication表。 HASH：采用这

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
支持的数据类型 - 数据治理中心 DataArts Studio

uniqueidentifier 16字节的GUID（Globally Unique Identifier，全球唯一标识符），是Sql Server根据网络适配器地址和主机CPU时钟产生的唯一号码，其中，每个为都是0~9或a~f范围内的十六进制数字。不支持不支持不支持 cursor 游标数据类型。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
支持的数据源（2.9.2.200） - 数据治理中心 DataArts Studio

库迁移支持的数据源类型。本文介绍2.9.2.200版本CDM集群所支持的数据源。因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

Studio提供的实例管理、工作空间管理、数据连接管理、资源迁移功能。已发布区域：全部管理中心实例管理支持实例创建，以及创建时依赖的企业项目、虚拟私有云、子网和安全组等配置。实例管理工作空间管理工作空间从系统层面为管理者提供对使用DataArts Studio的用户（成员）权限、资源、DataArts

帮助中心 > 数据治理中心 DataArts Studio > 功能总览
支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

库迁移支持的数据源类型。本文介绍2.9.3.300版本CDM集群所支持的数据源。因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源

总条数： 541

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据集市 - 数据治理中心 DataArts Studio

新建维度 - 数据治理中心 DataArts Studio

查找事实表 - 数据治理中心 DataArts Studio

创建表模型 - 数据治理中心 DataArts Studio

DLI Spark - 数据治理中心 DataArts Studio

查看维度颗粒度 - 数据治理中心 DataArts Studio

Java - 数据治理中心 DataArts Studio

管理脱敏算法 - 数据治理中心 DataArts Studio

MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

新建维度 - 数据治理中心 DataArts Studio

更新表模型 - 数据治理中心 DataArts Studio

创建数据集成作业 - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

DLI Flink Job - 数据治理中心 DataArts Studio

获取主题树信息 - 数据治理中心 DataArts Studio

新建事实表 - 数据治理中心 DataArts Studio

支持的数据类型 - 数据治理中心 DataArts Studio

支持的数据源（2.9.2.200） - 数据治理中心 DataArts Studio

数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线