搜索_华为云

配置DWS源端参数 - 数据治理中心 DataArts Studio

ECIMAL、BIT、BOOLEAN、DATE、TIME、TIMESTAMP类型，建议该字段带有索引。 id 分片字段是否允许空值是否允许分片字段包含空值。多并发抽取时，若确定分片字段不含Null，将该值设为“否”可提升性能，若不确定，请设为“是”，否则可能会丢数据。是父主题：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业源端参数
配置Kafka源端参数 - 数据治理中心 DataArts Studio

格式为yyyy-MM-dd HH:mm:ss，支持配合DLF变量等方式设置 2024-07-25 23:59:59 等待时间消费者获取数据返回值为空，持续X秒，任务停止。 30秒最大抽取时间消费者最大抽取时间，单位min。 kafka抽取consumer端最大运行时间，当到达运行时间

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业源端参数
创建连接（待下线） - 数据治理中心 DataArts Studio

通过DWS管理控制台获取集群名称：登录管理控制台。单击“数据仓库服务”，左侧列表选择集群管理。在集群管理列表中可以获取到集群名称。默认值为空。 ip 否 String DWS集群的访问地址。通过DWS管理控制台获取访问地址：登录管理控制台。单击“数据仓库服务”，左侧列表选择集群管理。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 连接管理API（待下线）
查看数据质量报告 - 数据治理中心 DataArts Studio

正向规则包含唯一值率、重复值率、合法比率规则，反向规则包含空值率规则。正向规则评分=满足规则的数据行数/数据总行数*满分（5，10，100）。反向规则评分=（1-满足规则的数据行数/数据总行数）*满分（5，10，100）。当表为空，即总行数为0时，正向规则评分固定为满分，反向评分固定为0分。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
配置PostgreSQL/SQL Server源端参数 - 数据治理中心 DataArts Studio

DM作业实际启动时间-偏移量”。 DS='${dateformat(yyyy-MM-dd,-1,DAY)}' 分区字段是否允许空值是否允许分区字段包含空值。是按表分区抽取支持从分区表的各个分区并行抽取数据。启用该功能时，可以通过下面的“表分区”参数指定具体的表分区。该功能不支持非分区表。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业源端参数
发布任务包 - 数据治理中心 DataArts Studio

表3 请求Body参数参数名是否必选参数类型说明 package_ids 是 array[string] 发布包ID集合，不能为空，且一次不能超过100个 startup_mode 否 Integer 发布后是否立即启动作业。取值范围为0和1，默认为1 1：发布成功后立即启动作业

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2） > 作业开发API
新建数据标准 - 数据治理中心 DataArts Studio

英文名称数据标准的英文名称。只能包含英文字母、数字、左右括号、空格和下划线，且以英文字母开头。数据长度设置数据长度：可以为空。数据长度为空时，对数据长度不做限制。选择可以设置为具体的数值。输入1~10000之间的数值。选择可以设置为一个范围。输入数据范围的临界值，输入值范围1~10000。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 标准设计
溯源数据水印 - 数据治理中心 DataArts Studio

约束与限制数据水印溯源的源文件大小不能超过20MB。为实现准确溯源，请确保数据的完整性以及正确性：数据水印溯源的表数据文件第一列不允许为空，表数据记录数建议在5000以上。创建数据水印溯源任务在DataArts Studio控制台首页，选择对应工作空间的“数据安全”模块，进入数据安全页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 管理数据水印
开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

创建资源提交Spark作业用户需要在数据开发模块中创建一个作业，通过作业的DLI Spark节点提交Spark作业。创建一个数据开发模块空作业，作业名称为“job_DLI_Spark”。图2 创建作业然后进入作业开发页面，拖动DLI Spark节点到画布并单击，配置节点的属性。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
GBASE连接参数说明 - 数据治理中心 DataArts Studio

Agent功能待下线，无需配置。 GBASE为GBASE8A时显示该参数。 - 引用符号可选参数，数据库包围标识符。对某些数据库意味着大小写敏感，如不需用请置空。 " 驱动版本不同类型的关系数据库，需要适配不同的驱动，更多详情请参见如何获取驱动。 GBASE为GBASE8A时显示该参数。 - 单次请求行数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接 > 配置连接参数
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

GZ时支持此参数。需要解压缩的文件的后缀名。当一批文件中以该值为后缀时，才会执行解压缩操作，否则就保持原样传输。当输入"*"时或输入为空时，所有文件都会被解压。 tar.gz 文件分隔符多文件列表时指定的文件分隔符。 | 启动作业标识文件当源端路径下存在启动作业的标识文件时才启动任务，否则会挂起等待一段时间。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业源端参数
配置HTTP源端参数 - 数据治理中心 DataArts Studio

压缩格式非无时，显示该参数。该参数需要解压缩的文件后缀名。当一批文件中以该值为后缀时，才会执行解压缩操作，否则保持原样传输。当输入*或为空时，所有文件都会被解压。 * 文件分隔符传输多个文件时，CDM使用这里配置的文件分隔符来区分各个文件，默认为|。列表文件选择“是”时，不显示该参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业源端参数
Sub Job - 数据治理中心 DataArts Studio

您只能选择已存在的批处理作业名称，此批处理作业不能为作业本身，并且该批处理作业为不包含Sub Job节点的作业。子作业参数名称是/否当节点属性中子作业参数配置为空时，子作业使用自身参数变量执行。父作业的“子作业参数名称”不显现。当节点属性中子作业参数配置了数据时，子作业将使用配置参数变量执行。此时父

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
开发一个MRS Flink作业 - 数据治理中心 DataArts Studio

jar文件上传路径为：lkj_test/WordCount.jar；word.txt 文件上传路径为：lkj_test/input/word.txt。创建一个数据开发模块空作业，作业名称为“job_MRS_Flink”。图1 新建作业进入到作业开发页面，拖动“MRS Flink”节点到画布中并单击，配置节点的属性。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
新建整库迁移作业 - 数据治理中心 DataArts Studio

该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。 age > 18 and age <= 60 分区字段是否允许空值选择分区字段是否允许空值。是 Hive 数据库名称待迁移的数据库名称，源连接中配置的用户需要拥有读取该数据库的权限。 hivedb HBase CloudTable

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业
管理脱敏算法 - 数据治理中心 DataArts Studio

HBase场景。支持配置加密类型。新建脱敏算法如果内置算法不满足您的需求，您可以新建自定义脱敏算法，自定义脱敏算法支持掩码、截断、哈希、加密、置空、随机脱敏、字符替换、键值脱敏、数值区间变换、模糊脱敏等10余类算法类型。在DataArts Studio控制台首页，选择对应工作空间的“数据安全”模块，进入数据安全页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 静态脱敏任务
导入导出 - 数据治理中心 DataArts Studio

填写“Y”表示该字段为分区字段，填写“N”表示不是分区字段。是否主键填写“Y”表示该字段为主键，填写“N”表示不是主键。不为空填写“Y”表示该字段不为空，填写“N”表示字段允许为空。引用的数据标准编码填写需要引用的数据标准的编码。如果未创建数据标准，请参见新建数据标准进行创建。属性标签

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
EL表达式使用实例 - 数据治理中心 DataArts Studio

rt”。新建和开发作业。在数据开发模块控制台的左侧导航栏，进入“数据开发 > 作业开发”，选择“新建作业”，新建一个名称为“job”的空作业。进入作业开发页面，将DLI SQL节点拖至画布中，单击其图标并配置“节点属性”。图2 节点属性关键属性说明： SQL脚本：关联1

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
管理通知 - 数据治理中心 DataArts Studio

作业改动除了作业责任人外，其他人对作业进行改动（修改作业、删除作业、修改作业引用的脚本、删除作业引用的脚本）时，则发送通知。作业责任人为空时，作业改动也不会发送告警通知。资源繁忙：如果执行作业时，DLI资源队列繁忙时，会遇到作业执行时间过长或无法执行的情况，从而发出告警，则发送通知。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 通知管理
获取质量报告规则评分 - 数据治理中心 DataArts Studio

"1047298515736334336", "scoring_weight" : 5, "rule_type_name" : "数据表空值扫描", "dimension_name" : "完整性", "sub_rule_instance_id" : "1047298617787944960"

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 质量报告接口

总条数： 256

上一页
1
...
8
9
10
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置DWS源端参数 - 数据治理中心 DataArts Studio

配置Kafka源端参数 - 数据治理中心 DataArts Studio

创建连接（待下线） - 数据治理中心 DataArts Studio

查看数据质量报告 - 数据治理中心 DataArts Studio

配置PostgreSQL/SQL Server源端参数 - 数据治理中心 DataArts Studio

发布任务包 - 数据治理中心 DataArts Studio

新建数据标准 - 数据治理中心 DataArts Studio

溯源数据水印 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

GBASE连接参数说明 - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

配置HTTP源端参数 - 数据治理中心 DataArts Studio

Sub Job - 数据治理中心 DataArts Studio

开发一个MRS Flink作业 - 数据治理中心 DataArts Studio

新建整库迁移作业 - 数据治理中心 DataArts Studio

管理脱敏算法 - 数据治理中心 DataArts Studio

导入导出 - 数据治理中心 DataArts Studio

EL表达式使用实例 - 数据治理中心 DataArts Studio

管理通知 - 数据治理中心 DataArts Studio

获取质量报告规则评分 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线