搜索_华为云

新建衍生指标 - 数据治理中心 DataArts Studio

系统中的原有数据为草稿状态，则会覆盖生成新的草稿数据。系统中的原有数据为发布状态，则会生成下展数据。单击“添加文件”，选择编辑完成的导入模板。单击“上传文件”，上传完成后，自动跳转到“上次导入”页签，查看已导入的数据。单击“关闭”。导出可通过导出的方式将衍生指标导出到本地。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标
Elasticsearch连接参数说明 - 数据治理中心 DataArts Studio

连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 es_link Elasticsearch服务器列表配置为一个或多个Elasticsearch服务器的IP地址或域名，包括端口号，格式为“ip:port”，多个地址之间使用“;”分隔。 192.168.0.1:9200;192

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
For Each节点使用介绍 - 数据治理中心 DataArts Studio

准备数据集数据。您可以通过以下方式之一获取数据集：您可以将表1数据导入到DLI表中，然后将SQL脚本读取的结果作为数据集。您可以将表1数据保存在OBS的CSV文件中，然后通过DLI SQL或DWS SQL创建OBS外表关联这个CSV文件，然后将OBS外表查询的结果作为数据集。DLI创建外表请

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
数据开发API（V1）概览 - 数据治理中心 DataArts Studio

- - 删除连接（待下线）删除一个连接。 - - 导出连接（待下线）导出zip压缩包格式的连接文件，包括所有连接的定义。 - - 导入连接（待下线）将存放在OBS桶的连接文件导入到数据开发模块中，一次可以导入一个或多个连接。 - - 脚本开发表3 脚本开发 API 说明 API流量限制（次/s）

帮助中心 > 数据治理中心 DataArts Studio > API参考 > API概览
For Each节点使用介绍 - 数据治理中心 DataArts Studio

准备数据集数据。您可以通过以下方式之一获取数据集：您可以将表1数据导入到DLI表中，然后将SQL脚本读取的结果作为数据集。您可以将表1数据保存在OBS的CSV文件中，然后通过DLI SQL或DWS SQL创建OBS外表关联这个CSV文件，然后将OBS外表查询的结果作为数据集。DLI创建外表请

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业在本章节您可以学习到数据开发模块资源管理、作业编辑等功能。场景说明用户在使用DLI服务时，大部分时间会使用SQL对数据进行分析处理，有时候处理的逻辑特别复杂，无法通过SQL处理，那么可以通过Spark作业进行分析处理。本章节通过一个例子演示如何

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

需要解压缩的文件的后缀名。当一批文件中以该值为后缀时，才会执行解压缩操作，否则就保持原样传输。当输入"*"时或输入为空时，所有文件都会被解压。 tar.gz 文件分隔符多文件列表时指定的文件分隔符。 | 启动作业标识文件当源端路径下存在启动作业的标识文件时才启动任务，否则会挂起等待一段时间。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置角色 - 数据治理中心 DataArts Studio

是通过在数据源上创建或纳管一个角色，进而承载用户和权限之间的关联关系。当您在角色管理页面，为权限集关联了角色之后，权限就不再同步到用户，而是只同步到角色。推荐您通过角色管理这种方式更加直观地管理权限关系、进行权限管控，角色管理还支持使用纳管角色管理已有的数据源权限。通用角色：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
数据开发操作列表 - 数据治理中心 DataArts Studio

environmentVariable importEnvParams 更新空间配置项 workspaceConfig updateWorkSpaceConfigs 上传文件 file uploadFile 配置空间委托 agency saveAgency 保存敏感变量 sensitiveParam saveSensitiveParam

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 审计日志 > 支持云审计的关键操作
数据迁移进阶实践 - 数据治理中心 DataArts Studio

数据迁移进阶实践增量迁移原理介绍时间宏变量使用解析事务模式迁移迁移文件时加解密 MD5校验文件一致性字段转换器配置指导新增字段操作指导指定文件名迁移正则表达式分隔半结构化文本记录数据迁移入库时间文件格式介绍不支持数据类型转换规避指导

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
关键操作指导 - 数据治理中心 DataArts Studio

关键操作指导增量迁移原理介绍事务模式迁移迁移文件时加解密 MD5校验文件一致性字段转换器配置指导新增字段操作指导指定文件名迁移正则表达式分隔半结构化文本记录数据迁移入库时间文件格式介绍不支持数据类型转换规避指导自动建表原理介绍父主题：数据集成（CDM作业）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

spark.sql.mergeSmallFiles.enabled（启用合并小文件功能，可以通过将小文件合并成较大的文件来提高性能，可以减少处理许多小文件的时间，并通过减少需要从远程存储中读取的文件数量来提高数据本地性。）如果不使用的话，可以手动配置相关参数进行关闭，参数值设置为false。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
配置资源权限 - 数据治理中心 DataArts Studio

Configs：修改配置权限 Storm Storm的Topology权限： Submit Topology：提交拓扑 File Upload：上传文件 File DownLoad：下载文件 Kill Topology：删除拓扑 Rebalance：Rebalance权限 Activate：激活权限 Deactivate：去激活权限

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > Ranger权限访问控制
数据集市 - 数据治理中心 DataArts Studio

单击“生成代码”，可以对已经生成的代码进行刷新。单击“复制到指标代码”可以复制代码到下面的指标代码，单击“格式化”，可以对指标代码进行格式化。单击“发布”，并在弹出框中，选择审核人，单击“确认提交”，提交汇总表的发布审核。企业模式下，进行发布时，可以选择发布到生产环境或开发环境。默认发布到生产环境，不勾选则无法发布。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计
参考：作业分片维度 - 数据治理中心 DataArts Studio

JDBC读取方式时，不支持分片。对象存储对象存储服务（OBS）支持按文件分片。文件系统 FTP 支持按文件分片。 SFTP 支持按文件分片。 HTTP 支持按文件分片。关系型数据库云数据库 MySQL 支持按表字段分片。仅当配置“按表分区抽取”时，按表分区分片。云数据库 PostgreSQL

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
数据开发配置数据搬迁 - 数据治理中心 DataArts Studio

在数据开发主界面，单击左侧导航上的“资源管理”，进入资源管理页面。单击资源目录中的，选择“导入资源”。图8 选择导入资源在弹出的导入资源窗口中，“文件位置”选择为“本地”，选择从旧空间导出的资源文件，“重名处理策略”默认选择“覆盖”，单击下一步。图9 导入资源资源开始导入，导入成功后系统会显示导入的资源名。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
配置MRS Hudi目的端参数 - 数据治理中心 DataArts Studio

Hudi建表参数 Location 存储在OBS或HDFS上数据库表的文件路径。 - Hudi表类型 Hudi表存储类型。 MOR表：数据先写入avro格式的日志文件，读取时合并到parquet文件。 COW表：数据直接写入parquet文件。 MOR Hudi表主键对Hudi建表设置主键，多个值以逗号隔开。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
Python - 数据治理中心 DataArts Studio

生成一个新的Signer，填入AppKey和AppSecret。 1 2 3 4 5 6 7 8 # 认证用的ak和sk编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示

 帮助中心 > 数据治理中心 DataArts Studio > SDK参考 > 数据服务SDK参考 > 使用APP认证调用API
执行Python脚本，报错“UnicodeEncodeError :‘ascii' codec cant encode characters in position 63-64 : ordinal not in range ( 128 )”怎么处理？ - 数据治理中心 DataArts Studio

所示。图2 主机上做软连接在文件中设置标准编码方式。 # -*- coding: utf-8 -*-；或者设置主机的编码格式：在python安装目录的Lib\site-packages文件夹下新建一个sitecustomize.py文件，在文件中写入如下内容。 # encoding=utf8

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
CDM支持的监控指标 - 数据治理中心 DataArts Studio

该指标为从物理机层面采集的磁盘使用率，数据准确性低于从弹性云服务器内部采集的数据。单位：%。 0.001%~90% CDM集群实例 1分钟 disk_io 磁盘io 该指标为从物理机层面采集的磁盘每秒读取和写入的字节数，数据准确性低于从弹性云服务器内部采集的数据。单位：Byte/sec 0~10GB

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群 > 管理并查看CDM监控指标

总条数： 645

上一页
1
...
14
15
16
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建衍生指标 - 数据治理中心 DataArts Studio

Elasticsearch连接参数说明 - 数据治理中心 DataArts Studio

For Each节点使用介绍 - 数据治理中心 DataArts Studio

数据开发API（V1）概览 - 数据治理中心 DataArts Studio

For Each节点使用介绍 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

配置角色 - 数据治理中心 DataArts Studio

数据开发操作列表 - 数据治理中心 DataArts Studio

数据迁移进阶实践 - 数据治理中心 DataArts Studio

关键操作指导 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

配置资源权限 - 数据治理中心 DataArts Studio

数据集市 - 数据治理中心 DataArts Studio

参考：作业分片维度 - 数据治理中心 DataArts Studio

数据开发配置数据搬迁 - 数据治理中心 DataArts Studio

配置MRS Hudi目的端参数 - 数据治理中心 DataArts Studio

Python - 数据治理中心 DataArts Studio

执行Python脚本，报错“UnicodeEncodeError :‘ascii' codec cant encode characters in position 63-64 : ordinal not in range ( 128 )”怎么处理？ - 数据治理中心 DataArts Studio

CDM支持的监控指标 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线