搜索_华为云

MRS Hive SQL - 数据治理中心 DataArts Studio

若关联的SQL脚本，脚本参数发生变化，可单击刷新按钮同步。运行程序参数否为本次执行的作业配置相关优化参数（例如线程、内存、CPU核数等），用于优化资源使用效率，提升作业的执行性能。说明：若集群为MRS 1.8.7版本或MRS 2.0.1之后版本，需要配置此参数。 MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
MRS Spark Python - 数据治理中心 DataArts Studio

框配置参数值。运行程序参数否仅“脚本类型”配置为“在线脚本”时可以配置。为本次执行的作业配置相关优化参数（例如线程、内存、CPU核数等），用于优化资源使用效率，提升作业的执行性能。说明：若集群为MRS 1.8.7版本或MRS 2.0.1之后版本，需要配置此参数。 MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
注册API - 数据治理中心 DataArts Studio

d。参数位置选择PATH。类型设置为STRING。选择性配置示例值和描述。配置好API基本信息后，单击“下一步”，即可进入API取数逻辑页面。配置API参数配置API基本信息后，即可配置API参数。这里将配置API的后端服务和请求参数。表2 API参数配置说明配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 创建API
转换逻辑模型为物理模型 - 数据治理中心 DataArts Studio

Array of strings 需要物化的逻辑实体的ID列表，ID字符串。 dw_type 是 String 数据连接类型，对应表所在的数仓类型，取值可以为DWS、MRS_HIVE、POSTGRESQL、MRS_SPARK、CLICKHOUSE、MYSQL、ORACLE和DORIS等。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 关系建模接口
数据开发API（V2）概览 - 数据治理中心 DataArts Studio

数据开发API（V2）概览表1 数据开发API（V2）类型类型说明作业开发作业开发类型接口。作业开发表2 作业开发 API 说明 API流量限制（次/s）用户流量限制（次/s）创建补数据实例创建一个补数据实例。 100 10 查询补数据实例查询补数据实例列表，支持分页查询。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > API概览
作业开发API - 数据治理中心 DataArts Studio

作业开发API 创建补数据实例查询补数据实例停止补数据实例修改作业名称查询发布包列表查询指定发布包详情设置作业标签查询告警通知记录发布任务包撤销任务包查询实例运行状态查询任务完成情况查询指定作业的实例列表重跑作业实例父主题：数据开发API（V2）

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2）
开发Python脚本 - 数据治理中心 DataArts Studio

参数说明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
获取数据库列表 - 数据治理中心 DataArts Studio

数据所在空间的id值。响应参数状态码： 200 表4 响应Body参数参数参数类型描述 total_count Integer 当前数据连接数据库记录数。 dw_id String 数据连接id。 databases Array of DatabasesList objects 数据库列表。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 管理中心API > 数据源元数据获取
获取质量作业详情 - 数据治理中心 DataArts Studio

alue Boolean 异常表是否包含空值。 abnormal_table_out_data_number Integer 异常表输出行数，0代表全量输出。 score_switch Boolean 是否开启质量评分。 score_schema String 质量评分表所在schema。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 质量作业接口
新建事实表 - 数据治理中心 DataArts Studio

REPLICATION：在每一个DN节点上存储一份全量表数据。这种存储方式的优点是每个DN上都有此表的全量数据，在join操作中可以避免数据重分布操作，从而减小网络开销；缺点是每个DN都保留了表的完整数据，造成数据的冗余。一般情况下只有较小的维度表才会定义为Replication表。 HASH：采用这

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
数据集市 - 数据治理中心 DataArts Studio

REPLICATION方式：在每一个DN节点上存储一份全量表数据。这种存储方式的优点是每个DN上都有此表的全量数据，在join操作中可以避免数据重分布操作，从而减小网络开销；缺点是每个DN都保留了表的完整数据，造成数据的冗余。一般情况下只有较小的维度表才会定义为Replication表。 HASH方式：采

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计
开发Shell脚本 - 数据治理中心 DataArts Studio

参数说明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业在本章节您可以学习到数据开发模块资源管理、作业编辑等功能。场景说明用户在使用DLI服务时，大部分时间会使用SQL对数据进行分析处理，有时候处理的逻辑特别复杂，无法通过SQL处理，那么可以通过Spark作业进行分析处理。本章节通过一个例子演示如何

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
查询数据连接列表 - 数据治理中心 DataArts Studio

获取方法请参见实例ID和工作空间ID。响应参数状态码： 200 表4 响应Body参数参数参数类型描述 count Integer 当前分页返回数据连接记录数。 max_records Integer 返回记录总数，一个工作空间最多只能创建的数据连接条数。 data_connection_lists

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 管理中心API > 数据连接管理
开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

业管理下，在操作的“更多 > 查看详情”里面可以查看该作业的详细信息。说明：为本次执行的作业配置相关优化参数（例如线程、内存、CPU核数等），用于优化资源使用效率，提升作业的执行性能。Spark代理连接不支持该配置。在MRS API连接模式下，单算子作业Spark SQL支持程序运行参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
查询作业详情 - 数据治理中心 DataArts Studio

执行失败处理策略: SUSPEND ：挂起 IGNORE：忽略失败，读取下一事件默认值 : SUSPEND concurrent 否 int 调度并发数取值范围：1~128 默认值：1 readPolicy 否 String 读取策略: LAST ：从上次位置读取 NEW- 从最新位置读取

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
修改作业 - 数据治理中心 DataArts Studio

执行失败处理策略： SUSPEND ：挂起 IGNORE：忽略失败，读取下一事件。默认值：SUSPEND concurrent 否 int 调度并发数。取值范围：1~128 默认值：1 readPolicy 否 String 读取策略： LAST ：从上次位置读取 NEW- 从最新位置读取

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
企业模式业务流程 - 数据治理中心 DataArts Studio

企业模式业务流程当前DataArts Studio企业模式，主要涉及管理中心和数据开发组件，业务流程由管理员、开发者、部署者、运维者等角色共同完成。图1 企业模式架构管理员：管理员需要进行准备数据湖、配置数据连接和环境隔离、数据的导入导出、配置项目用户权限等操作。开发者：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间 > 企业模式角色操作
导入主题 - 数据治理中心 DataArts Studio

表4 FormData参数参数是否必选参数类型描述 file 是 File 导入主题用的excel文件，大小必须小于4MB，且行数小于3000行。响应参数状态码：200 表5 响应Body参数参数参数类型描述 data data object 返回的数据信息。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 导入导出接口
获取schemas - 数据治理中心 DataArts Studio

响应参数状态码： 200 表4 响应Body参数参数参数类型描述 total_count Integer 当前数据连接schema记录数。 dw_id String 数据连接id。 database String 数据库名称。 schemas Array of SchemasList

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 管理中心API > 数据源元数据获取

总条数： 477

上一页
1
...
18
19
20
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS Hive SQL - 数据治理中心 DataArts Studio

MRS Spark Python - 数据治理中心 DataArts Studio

注册API - 数据治理中心 DataArts Studio

转换逻辑模型为物理模型 - 数据治理中心 DataArts Studio

数据开发API（V2）概览 - 数据治理中心 DataArts Studio

作业开发API - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

获取数据库列表 - 数据治理中心 DataArts Studio

获取质量作业详情 - 数据治理中心 DataArts Studio

新建事实表 - 数据治理中心 DataArts Studio

数据集市 - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

查询数据连接列表 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

查询作业详情 - 数据治理中心 DataArts Studio

修改作业 - 数据治理中心 DataArts Studio

企业模式业务流程 - 数据治理中心 DataArts Studio

导入主题 - 数据治理中心 DataArts Studio

获取schemas - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线