搜索_华为云

配置入口API算子 - 数据治理中心 DataArts Studio

入口API访问路径即API工作流访问路径，例如：/getUserInfo。请求Path即完整的URL中，域名之后、查询参数之前的部分，如图1中的“/blogs/xxxx”。图1 统一资源定位符URL说明在请求Path中，可以使用大括号{}标识路径中的参数作为通配符。如“/blogs/{blog_id}”表示/

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
权限列表 - 数据治理中心 DataArts Studio

删除通用配置（指已发布状态的逻辑实体或表，对其在编辑并保存后产生的草稿的删除操作） Y Y N N 操作通用配置（指逻辑实体或表的导入、导出、发布、下线、同步、逆向等操作） Y Y Y N 查询通用配置（指已发布状态的逻辑实体或表，对其在编辑并保存后产生的草稿的查询操作） Y Y Y

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
实时集成作业监控 - 数据治理中心 DataArts Studio

实时集成作业监控提供了对实时处理集成作业的状态进行监控的能力。实时处理集成作业处理实时的连续数据，主要用于实时性要求高的场景。实时作业是由一个或多个节点组成的流水线，每个节点配置独立的、节点级别的调度策略，而且节点启动的任务可以永不下线。在实时作业里，带箭头的连线仅代表业务上的关系，而非任务执行流程，更不是数据流。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 作业监控
Shell/Python节点执行失败，后台报错session is down - 数据治理中心 DataArts Studio

请求消息的时间间隔，默认是0，不发送请求。然而ClientAliveInterval 300表示五分钟发送一次，然后客户端响应，这样就保持长连接了。ClientAliveCountMax的默认值3。ClientAliveCountMax表示服务器发出请求后客户端没有响应的次数达到

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
新增字段操作指导 - 数据治理中心 DataArts Studio

确保导入到目的端数据的完整性。图1 字段映射目前支持以下类型自定义字段：常量常量参数即参数值是固定的参数，不需要重新配置值。例如“lable”=“friends”用来标识常量值。变量您可以使用时间宏、表名宏、版本宏等变量来标记数据库来源信息。变量的语法：${varia

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
新增字段操作指导 - 数据治理中心 DataArts Studio

确保导入到目的端数据的完整性。图1 字段映射目前支持以下类型自定义字段：常量常量参数即参数值是固定的参数，不需要重新配置值。例如“lable”=“friends”用来标识常量值。变量您可以使用时间宏、表名宏、版本宏等变量来标记数据库来源信息。变量的语法：${varia

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
新增字段操作指导 - 数据治理中心 DataArts Studio

确保导入到目的端数据的完整性。图1 字段映射目前支持以下类型自定义字段：常量常量参数即参数值是固定的参数，不需要重新配置值。例如“lable”=“friends”用来标识常量值。变量您可以使用时间宏、表名宏、版本宏等变量来标记数据库来源信息。变量的语法：${varia

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
查看作业实例 - 数据治理中心 DataArts Studio

作业实例的数据保留最近90天的结果。界面说明介绍“数据质量监控 > 运维管理”页面中的区域和按键功能。图1 页面区域说明表1 运维管理页面序号区域描述 1 导航栏左侧导航栏，包括数据质量规则的存储目录。用户可以根据实际需要对规则进行分目录存放，每级目录旁边的数字代表属于该级目录的规则实例的个数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

系统，且“文件格式”必须选择“CSV格式”。图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用正则表达式分隔字段，并按照解析后的结果写入目的端。正则表达式语法请参考对应的相关资料，这里举例下面几种日志文件的正则表达式的写法： Log4J日志 Log4J审计日志 Tomcat日志

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

系统，且“文件格式”必须选择“CSV格式”。图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用正则表达式分隔字段，并按照解析后的结果写入目的端。正则表达式语法请参考对应的相关资料，这里举例下面几种日志文件的正则表达式的写法： Log4J日志 Log4J审计日志 Tomcat日志

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属性全局配置”或在映射后的单表“表属性编辑”中，添加优化参数。图1 添加自定义属性

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
PostgreSQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属性全局配置”或在映射后的单表“表属性编辑”中，添加优化参数。图1 添加自定义属性

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
审批中心 - 数据治理中心 DataArts Studio

选择“审批作业”页签，单击“添加”，进入“从基线添加要审批的作业”界面，选择基线任务的优先级作业，所选基线对应的作业，将被指定为需要审批的作业，单击“确定”。基线任务上游的作业也需要审批。选择“审批脚本”页签，选择了基线对应的作业，作业关联的脚本会同步显示在该页面。在“审批人信息”，当前工作空间管理员或者拥有DAYU

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
终端节点Endpoint - 数据治理中心 DataArts Studio

终端节点Endpoint 获取终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同。数据治理中心的终端节点Endpoint构造规则如下，请您根据业务需要选择对应区域的终端节点。 CDM数据集成接口：cdm.{region_id}.myhuaweicloud

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 使用前必读
CDM作业配置管理 - 数据治理中心 DataArts Studio

数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。不同源端数据源的作业分片维度有所不同，因此某些作业可能出现未严格按作业“抽取并发数”参数分片的情况。 CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
配置条件分支算子 - 数据治理中心 DataArts Studio

条件分支算子通过获取上游算子的请求参数或结果集进行条件判断，根据定义的表达式来确定下一步执行的分支。注意，多个分支满足条件时仅执行第一个满足条件的分支。表1 条件分支算子参数说明分支1 条件类型选择条件类型。满足当前条件时：表示传入“条件分支”的数据满足指定的表达式时，将执行该分支。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
创建DataArts Studio数据连接 - 数据治理中心 DataArts Studio

Python脚本等任务的同时运行上限为200，超出的任务将排队等待。建议您按照业务量情况规划多个Agent分担压力。前提条件在创建数据连接前，请确保您已创建所要连接的数据湖（如DataArts Studio所支持的数据库、云服务等）。在创建DWS类型的数据连接前，您需要先在

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
基线管理 - 数据治理中心 DataArts Studio

说明：定义基线的优先级，数值越大基线优先级越高，基线上任务的优先级也会越高。优先级高的任务，在调度资源紧张的情况下，将优先获得调度资源。配置优先级后将会在第二天生成的周期实例中生效。在MRS集群场景中，优先级配置只支持使用MRS API模式的数据连接类型，不支持代理模式的数据连接。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 基线运维
查看事实表详情 - 数据治理中心 DataArts Studio

参数类型描述 data data object data，统一的返回结果的最外层数据结构。表5 data 参数参数类型描述 value FactLogicTableVO object value，统一的返回结果的外层数据结构。表6 FactLogicTableVO 参数参数类型

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 事实表接口
更新维度 - 数据治理中心 DataArts Studio

src_model_id 否 String 来源表在关系建模中的模型ID，ID字符串。 src_model_name 否 String 来源模型名称。 view_text 否 String 采集的视图来源，dws视图逆向使用。 target_table_name 否 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 维度接口

总条数： 871

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置入口API算子 - 数据治理中心 DataArts Studio

权限列表 - 数据治理中心 DataArts Studio

实时集成作业监控 - 数据治理中心 DataArts Studio

Shell/Python节点执行失败，后台报错session is down - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

查看作业实例 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

PostgreSQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

审批中心 - 数据治理中心 DataArts Studio

终端节点Endpoint - 数据治理中心 DataArts Studio

CDM作业配置管理 - 数据治理中心 DataArts Studio

配置条件分支算子 - 数据治理中心 DataArts Studio

创建DataArts Studio数据连接 - 数据治理中心 DataArts Studio

基线管理 - 数据治理中心 DataArts Studio

查看事实表详情 - 数据治理中心 DataArts Studio

更新维度 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线