搜索_华为云

查询作业模板列表 - 数据湖探索 DLI

me”参数两者不能同时存在。 args Array of Strings 传入主类的参数，即应用程序参数。 sc_type String 计算资源类型，目前可接受参数A, B, C。如果不指定，则按最小类型创建。具体资源类型请参见表3。 jars Array of Strings

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
了解数据目录、数据库和表 - 数据湖探索 DLI

创建并使用Lakeformation元数据请参考创建并使用LakeFormation元数据。数据库数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。数据库通常用于存储、检索和管理结构化数据，由多个数据表组成，这些数据表通过键和索引相互关联。表表是数据库最重要的组

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

开发流程说明序号阶段操作界面说明 1 创建DLI通用队列 DLI控制台创建作业运行的DLI队列。 2 上传数据到OBS桶 OBS控制台将测试数据上传到OBS桶下。 3 新建Maven工程，配置pom文件 IntelliJ IDEA 参考样例代码说明，编写程序代码读取OBS数据。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

湖探索用户指南》。创建队列。在“资源管理 > 队列管理”下，单击右上角“购买队列”，进入购买队列页面选择“通用队列”，即Spark作业的计算资源。如果创建队列的用户不是管理员用户，在创建队列后，需要管理员用户赋权后才可使用。关于赋权的具体操作请参考《数据湖探索用户指南》。 DLI

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
提交SQL作业（推荐） - 数据湖探索 DLI

说明：当前仅支持运行命令ANALYZE TABLE COMPUTE statistics noscan的配置单元元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

exec.UDAF和org.apache.hadoop.hive.ql.exec.UDAFEvaluator类。函数类需要继承UDAF类，计算类Evaluator实现UDAFEvaluator接口。 Evaluator需要实现UDAFEvaluator的init、iterate、

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
创建并提交SQL作业 - 数据湖探索 DLI

说明：当前仅支持运行命令ANALYZE TABLE COMPUTE statistics noscan的配置单元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

湖探索用户指南》。创建队列。在“资源管理 > 队列管理”下，单击右上角“购买队列”，进入购买队列页面选择“通用队列”，即Spark作业的计算资源。如果创建队列的用户不是管理员用户，在创建队列后，需要管理员用户赋权后才可使用。关于赋权的具体操作请参考《数据湖探索用户指南》。操作步骤

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

说明步骤1：上传数据至OBS 使用DLI查询数据前，需要将数据文件上传至OBS中。步骤2：创建弹性资源池并添加队列创建提交作业所需的计算资源。步骤3：创建数据库 DLI元数据是SQL作业开发的基础。在执行作业前您需要根据业务场景定义数据库和表。步骤4：创建表数据库创建

 帮助中心 > 数据湖探索 DLI > 快速入门
查看Flink作业详情 - 数据湖探索 DLI

业不支持停止。删除：删除作业。说明：作业删除后不可恢复，请谨慎操作。名称和描述修改：修改作业名称和描述。导入保存点：导入原实时流计算服务作业导出的数据。触发保存点：“运行中”的作业可以“触发保存点”，保存作业的状态信息。权限管理：查看作业对应的用户权限信息以及对其他用户授权。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

步骤1：上传数据至OBS 准备Spark Jar作业程序包并上传至OBS。步骤2：创建弹性资源池并添加队列创建提交Spark Jar作业所需的计算资源。步骤3：使用DEW管理访问凭证跨源分析场景中，使用DEW管理数据源的访问凭证，并创建允许DLI访问DEW的委托。步骤4：创建自定义委托允许DLI访问DEW读取凭证

 帮助中心 > 数据湖探索 DLI > 快速入门
日期、时间函数及运算符 - 数据湖探索 DLI

果date1比date2迟，结果就是正数，那么结果就是负数；如果两个日期的日数相同，那么结果就是整数，否则按照每月31天以及时分秒的差异来计算小数部分。date1和date2的类型可以是date，timestamp，也可以是“yyyy-MM-dd”或“yyyy-MM-dd HH:mm:ss”格式的字符串

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

服务授权”开启Tenant Adminstrator（全局服务）。写入数据到OBS的桶必须为主账号下所创建的OBS桶。使用Flink1.15版本的计算引擎时，需要用户自行配置委托，否则可能影响作业运行。详细操作请参考自定义DLI委托权限。 Java样例代码（Flink 1.15） pom文件配置

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

sql.aggregate.adaptivePartialAggregationInterval配置的间隔进行分析，当处理的行数到达间隔之后，再计算”已处理的group分组/已处理的行数”，如果比例大于配置的阈值，则认为预聚合效果不好，此时可以直接选择跳过。升级引擎版本后是否对作业有影响：

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比

总条数： 354

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询作业模板列表 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

日期、时间函数及运算符 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线