搜索_华为云

新建数据质量规则 - 数据治理中心 DataArts Studio

单击“导出”，弹出“导出规则模板”对话框。单击“导出”，切换到“导出记录”页签。在导出文件列表中，单击最新导出文件对应的“下载”，可将规则模板的Excel表格下载到本地。导入规则模板系统支持将自定义的规则模板批量导入，一次最大可导入4MB数据的文件。选择“数据质量监控 > 规则模板”，单击“导入”，弹出“导入规则模板”对话框。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
是否支持字段转换？ - 数据治理中心 DataArts Studio

isNumeric(value) 获取字符串最左端的指定长度的字符，例如获取“abc”最左端的2位字符“ab”。表达式：StringUtils.left(value,2) 获取字符串最右端的指定长度的字符，例如获取“abc”最右端的2位字符“bc”。表达式：StringUtils

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
如何配置Hudi Compaction的Spark周期任务？ - 数据治理中心 DataArts Studio

创建Spark SQL单任务作业配置与Hudi相对应的Spark数据连接，并选中需要操作Hudi表对应的数据库。图3 配置连接与数据库根据实际情况配置compaction的调度周期。图4 配置调度周期填写Spark SQL的compaction语句，提交并运行作业。 set

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（实时作业）
DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

L查询。除了使用相同的统一存储平台之外，Impala还使用与Apache Hive相同的元数据，SQL语法（Hive SQL），ODBC驱动程序和用户界面（Hue中的Impala查询UI）。这为实时或面向批处理的查询提供了一个熟悉且统一的平台。作为查询大数据的工具的补充，Impa

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
Oracle数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

索服务的任务。图4 创建Oracle到云搜索服务的迁移任务作业名称：用户自定义便于记忆、区分的任务名称。源端作业配置源连接名称：选择创建Oracle连接中的“oracle_link”。模式或表空间：待迁移数据的数据库名称。表名：待迁移数据的表名。高级属性里的可选参数一般情况下保持默认即可。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

DataArts Studio采用基础包+增量包的计费模式。为了便于您便捷的下单购买，在控制台购买界面中系统会为您计算好所购买的套餐包的价格，您可一键完成整个配置的购买。计费方式计费说明 04 使用指导您快速构建从数据接入到数据分析的端到端智能数据系统，消除数据孤岛，统一数据标准，加快数据变现，实现数字化转型。

帮助中心 > 数据治理中心 DataArts Studio > 成长地图
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

过滤类型为通配符或正则表达式时支持此参数。用于过滤输入路径下的文件。通配符使用*csv 正则表达式使用.*\.csv 时间过滤用于过滤满足时间范围的文件。文件的修改时间晚于输入的起始时间或早于输入的终止时间才会被传输。同时输入起始时间和终止时间，文件的修改时间在这个区间内才会被传输。否起始时间

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
实例ID和工作空间ID - 数据治理中心 DataArts Studio

Studio实例ID和工作空间ID DataArts Studio的实例ID和工作空间ID可以从DataArts Studio控制台的URI链接中获取。在DataArts Studio控制台首页，选择对应工作空间，并单击任一模块，如“管理中心”。进入管理中心页面后，从浏览器地址

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 使用前必读
创建资源 - 数据治理中心 DataArts Studio

String 资源文件所在OBS路径，当类型为jar时，location为主Jar包所在路径。最多1023个字符。示例：obs://myBucket/test.jar dependFiles 否 List<String> 主Jar包所依赖的JAR包、properties文件。总的长度不能超过10240个字符。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 资源管理API
数据开发 - 数据治理中心 DataArts Studio

数据开发数据开发可以创建多少个作业，作业中的节点数是否有限制？ DataArts Studio支持自定义的Python脚本吗？作业关联的CDM集群删除后，如何快速修复？作业的计划时间和开始时间相差大，是什么原因？相互依赖的几个作业，调度过程中某个作业执行失败，是否会影响后续作业？这时该如何处理？

帮助中心 > 数据治理中心 DataArts Studio > 常见问题
新建DataArts Studio与DWS数据湖的连接 - 数据治理中心 DataArts Studio

适用组件勾选数据集成后，呈现此参数。指定每次请求获取的行数，根据数据源端和作业数据规模的大小配置该参数。如果配置过大或过小，可能影响作业的时长。连接属性否适用组件勾选数据集成后，呈现此参数。可选参数，单击“添加”可增加多个指定数据源的JDBC连接器的属性，参考对应数据库的JDBC连接器说明文档进行配置。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

的端所使用的数据库账号需要满足以下权限要求，才能启动实时同步任务。不同类型的同步任务，需要的账号权限也不同，详细可参考下表进行赋权。表2 数据库账号权限类型名称权限要求源数据库连接账号数据库的CONNECT权限，模式的USAGE权限，表的SELECT权限，序列的SELE

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
查看作业实例 - 数据治理中心 DataArts Studio

操作人展示实例的操作人。创建时间展示实例的创建时间。开始时间展示实例开始运行的时间。开始时间支持按照升序和降序进行排序。运行时间展示实例的运行时长。结束时间展示实例结束运行的时间。结束时间支持按照升序和降序进行排序。处理人展示实例的处理人。重跑再次运行规则实例。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
源端为HTTP/HTTPS - 数据治理中心 DataArts Studio

fromCompression 否枚举选择对应压缩格式的源文件进行迁移： NONE：表示传输所有格式的文件。 GZIP：表示只传输GZIP格式的文件。 ZIP：表示只传输ZIP格式的文件。 TAR.GZ：表示只传输TAR.GZ格式的文件。 fromJobConfig.compressedFileSuffix

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
新建数据对账作业 - 数据治理中心 DataArts Studio

对账作业”，选择要导出的对账作业。单击“导出”，弹出“导出对账作业”对话框。单击“导出”，切换到“导出记录”页签。在导出文件列表中，单击最新导出文件对应的“下载”，可将对账作业的Excel表格下载到本地。导入对账作业系统支持批量导入对账作业，一次最大可导入4M数据的文件。导入作业时

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
配置OBS源端参数 - 数据治理中心 DataArts Studio

GBK 压缩格式选择对应压缩格式的源文件：无：表示传输所有格式的文件。 GZIP：表示只传输GZIP格式的文件。 ZIP：表示只传输ZIP格式的文件。 TAR.GZ：表示只传输TAR.GZ格式的文件。无压缩文件后缀需要解压缩的文件后缀名。当一批文件中以该值为后缀时，才会执行解

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
导入模型，关系建模，维度建模，码表，业务指标以及流程架构 - 数据治理中心 DataArts Studio

File 导入用的excel文件，大小必须小于4MB，且行数小于3000行。响应参数状态码： 200 表5 响应Body参数参数参数类型描述 data data object 返回的数据信息。表6 data 参数参数类型描述 uuid String 导入接口返回的唯一标识。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 导入导出接口
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

| 标识文件名选择开启作业标识文件的功能时，需要指定启动作业的标识文件名。指定文件后，只有在源端路径下存在该文件的情况下才会运行任务。该文件本身不会被迁移。 ok.txt 等待时间选择开启作业标识文件的功能时，如果源路径下不存在启动作业的标识文件，作业挂机等待的时长，当超时后任务会失败。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
获取导入导出的任务状态 - 数据治理中心 DataArts Studio

String 导入body体，默认为空。 file_status String 文件进度状态，PREPARING表示准备中，GENERATED表示文件已就绪，DELETED表示文件已删除，FAILED表示上传或生成文件失败。状态码： 500 表4 响应Body参数参数参数类型描述 error_code

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 导入导出接口
步骤3：数据开发处理 - 数据治理中心 DataArts Studio

本步骤通过电影信息和评分信息的原始数据，分析评分最高的Top10电影和最活跃的Top10电影，然后通过作业定期调度执行并将结果每日导出到表中，以支撑信息分析。创建DWS SQL脚本top_rating_movie（用于存放评分最高的Top10电影）评分最高Top10电影的计算方法是：先计

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程

总条数： 1434

上一页
1
...
16
17
18
...
72
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建数据质量规则 - 数据治理中心 DataArts Studio

是否支持字段转换？ - 数据治理中心 DataArts Studio

如何配置Hudi Compaction的Spark周期任务？ - 数据治理中心 DataArts Studio

DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

Oracle数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

实例ID和工作空间ID - 数据治理中心 DataArts Studio

创建资源 - 数据治理中心 DataArts Studio

数据开发 - 数据治理中心 DataArts Studio

新建DataArts Studio与DWS数据湖的连接 - 数据治理中心 DataArts Studio

PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

查看作业实例 - 数据治理中心 DataArts Studio

源端为HTTP/HTTPS - 数据治理中心 DataArts Studio

新建数据对账作业 - 数据治理中心 DataArts Studio

配置OBS源端参数 - 数据治理中心 DataArts Studio

导入模型，关系建模，维度建模，码表，业务指标以及流程架构 - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

获取导入导出的任务状态 - 数据治理中心 DataArts Studio

步骤3：数据开发处理 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线