搜索_华为云

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

仅支持获取AK、SK、SecurityToken。获取到AK、SK、SecurityToken后，请参考如何使用凭据管理服务替换硬编码的数据库账号密码查询凭据。约束限制仅支持Spark3.3.1版本（Spark通用队列场景）使用委托授权访问临时凭证：在创建作业时，请配置作业使用Spark3

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

表2配置参数。JDBC配置对象，除了在url中以分号间隔设置配置项外，还可以通过Info对象动态设置属性项，具体属性项参见表3。表2 数据库连接参数参数描述 url url的格式如下。 jdbc:dli://<endPoint>/projectId? <key1>=<val1>;<key2>=<val2>…

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

写入具有分区提交功能的Hive表。 CREATE CATALOG myhive WITH ( 'type' = 'hive' , 'default-database' = 'demo', 'hive-conf-dir' = '/opt/flink/conf' ); USE CATALOG

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
创建DLI表关联CSS - 数据湖探索 DLI

IP2:PORT2"。 resource 指定在CSS关联的资源名，用"/index/type"指定资源位置（可简单理解index为database，type为table，但绝不等同）。说明： ES 6.X版本中，单个Index只支持唯一type，type名可以自定义。 ES 7

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
Hudi表模型设计规范 - 数据湖探索 DLI

precombine字段值可以保证数据的准确性，老数据不会覆盖新数据，也就是幂等写入能力。该字段可用选择的类型包括：业务表中更新时间戳、数据库的提交时间戳等。precombine字段不能有null值和空值，可以参考以下示例设置precombine字段： SparkSQL: //通

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

仅支持获取AK、SK、SecurityToken。获取到AK、SK、SecurityToken后，请参考如何使用凭据管理服务替换硬编码的数据库账号密码查询凭据。约束限制仅支持Flink1.15版本使用委托授权访问临时凭证：在创建作业时，请配置作业使用Flink1.15版本

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
SQL作业运行慢如何定位 - 数据湖探索 DLI

小文件过多：当一个表中的小文件过多时，可能会造成Driver内存FullGC。登录DLI控制台，选择SQL编辑器，在SQL编辑器页面选择问题作业的队列和数据库。执行以下语句，查看作业中表的文件数量。“表名”替换为具体问题作业中的表名称。 select count(distinct fn) FROM

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
创建并提交Flink作业 - 数据湖探索 DLI

0/{project_id}/streaming/flink-jobs {project_id}信息请从获取项目ID获取。请求参数说明详情，请参见创建数据库（废弃）。请求示例描述：在项目ID为48cc2c48765f481480c7db940d6409d1项目下，创建Flink自定义作业。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
pyspark样例代码 - 数据湖探索 DLI

com:9200" resource为指定在CSS关联的资源名。格式可以用"/index/type"指定资源位置（可简单理解index为database，type为table，但绝不等同）。 ES 6.X版本中，单个Index只支持唯一type，type名可以自定义。 ES 7.X版

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
创建并使用跨源链接 - 数据湖探索 DLI

connections/{connection_id} {project_id}信息请从获取项目ID获取。查询参数说明详情，请参见创建数据库（废弃）。请求示例描述：查询项目ID为48cc2c48765f481480c7db940d6409d1下连接ID为2a620c33-5

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

如下脚本中的加粗参数请根据实际环境修改。 CREATE CATALOG myhive WITH ( 'type' = 'hive' , 'default-database' = 'demo', 'hive-conf-dir' = '/opt/flink/conf' ); USE CATALOG

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Doris源表 - 数据湖探索 DLI
Doris源表 - 数据湖探索 DLI

'fenodes' = 'FE_IP:PORT,FE_IP:PORT,FE_IP:PORT', 'table.identifier' = 'database.table', 'username' = 'dorisUsername', 'password' = 'dorisPassword'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

hive_sync.table", tableName) .option("hoodie.datasource.hive_sync.database", databaseName) .mode(SaveMode.Overwrite) .save(basePath)

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

(val1 [, val2, ...]) 关键字表1 INSERT关键字说明参数描述 db_name 需要执行INSERT命令的表所在数据库的名称。 table_name 需要执行INSERT命令的表的名称。 part_spec 指定详细的分区信息。若分区字段为多个字段，需要包

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

hadoop.hive-ext.dlcatalog.metastore.session.client.class=com.huawei.cloud.dalf.lakecat.client.hiveclient.LakeCatMetaStoreClient spark.hadoop.lakecat

帮助中心 > 数据湖探索 DLI > 用户指南
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

Table Information Database: default

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

如下脚本中的加粗参数请根据实际环境修改。 CREATE CATALOG myhive WITH ( 'type' = 'hive' , 'default-database' = 'demo', 'hive-conf-dir' = '/opt/flink/conf' ); USE CATALOG

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

IP2:PORT2"。 resource 指定在CSS关联的资源名，用"/index/type"指定资源位置（可简单理解index为database，type为table，但绝不等同）。说明： ES 6.X版本中，单个Index只支持唯一type，type名可以自定义。 ES 7

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
DLI内置依赖包 - 数据湖探索 DLI

parquet-jackson-1.12.2.jar commons-text-1.10.0.jar jetty-io-9.4.41.v20210516.jar postgresql-42.3.5.jar commons-validator-1.7.jar jetty-rewrite-9.4.43.v20210629

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

如果您想通过Spark Jar作业访问其他数据源，请参考《使用Spark作业跨源访问数据源》。如果您想通过Spark Jar作业在DLI创建数据库和表，请参考《使用Spark作业访问DLI元数据》。完整样例代码参考认证用的access.key和secret.key硬编码到代码中或

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南

总条数： 620

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

创建并提交Flink作业 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

Doris源表 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线