搜索_华为云

创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

class_name [USING resource,...] resource: : JAR file_uri 注意事项如果在数据库中存在同名的函数，系统将会报错。只支持Hive语法创建函数。请注意避免该场景：如果创建的自定义函数F1指定类C1，程序包名JAR1，创

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
pyspark样例代码 - 数据湖探索 DLI

jdbcDF.show() 操作结果通过SQL API 访问创建DLI跨源访问rds的关联表，填写连接参数。 1 2 3 4 5 6 7 sparkSession.sql( "CREATE TABLE IF NOT EXISTS dli_to_rds USING JDBC OPTIONS

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

gine”的作业。用户名执行该作业的用户名。类型作业的类型，包括如下。 IMPORT：导入数据到DLI的作业。 EXPORT：从DLI导出数据的作业。 DCL：包括传统DCL，以及队列权限相关的操作。 DDL：与传统DDL操作一致，即创建和删除数据库，创建和删除表的作业。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

结果表统计用户在30秒内的订单数量，并根据窗口的订单id和窗口开启时间作为主键，将结果实时统计到JDBC中：根据MySQL和kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据MySQL和kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
Postgres CDC源表 - 数据湖探索 DLI

该示例是利用Postgres-CDC实时读取RDS PostgreSQL中的数据，并写入到Print结果表中，其具体步骤如下（当前示例使用的数据库引擎版本是RDS PostgreSQL 11.11）：参考增强型跨源连接，根据PostgreSQL所在的虚拟私有云和子网创建相应的增强型跨

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

SparkDemoObs，单击“执行”重新运行该作业即可。后续指引如果您想通过Spark Jar作业访问其他数据源，请参考《使用Spark作业跨源访问数据源》。如果您想通过Spark Jar作业在DLI创建数据库和表，请参考《使用Spark作业访问DLI元数据》。完整样例代码参考认证用的access

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
查看所有表 - 数据湖探索 DLI
查看所有表 - 数据湖探索 DLI

查看所有表功能描述查看当前数据库下所有的表。显示当前数据库下的所有表及视图。语法格式 1 SHOW TABLES [IN | FROM db_name] [LIKE regex_expression]; 关键字 FROM/IN：指定数据库名，显示特定数据库下的表及视图。参数说明

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
创建并提交SQL作业 - 数据湖探索 DLI

创建并提交SQL作业场景描述本章节指导用户通过API提交SQL作业创建数据库和表，并查询数据。涉及接口创建弹性资源池创建队列提交SQL作业（推荐）操作步骤创建弹性资源池elastic_pool_dli 接口相关信息 URI格式：POST /v3/{project_

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
创建OBS表时怎样指定OBS路径 - 数据湖探索 DLI

创建OBS表时怎样指定OBS路径场景概述创建OBS表时，OBS路径须指定到数据库下的具体表层路径。路径格式为：obs://xxx/数据库名/表名。创建OBS表更多语法介绍请参考《数据湖探索Spark SQL语法参考》。正确示例 CREATE TABLE `di_selle

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

DESCRIBE DATABASE| SCHEMA 语法 DESCRIBE DATABASE|SCHEMA [EXTENDED] schema_name 描述 DATABASE和SCHEMA在此处是等价的，可互换的，它们有这相同的含义。该语法用于显示SCHEMA的名称、注释、还有它在文件系统上的根路径。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
OBS表压缩率较高怎么办？ - 数据湖探索 DLI

OBS表压缩率较高怎么办？当您在提交导入数据到DLI表的作业时，如果遇到Parquet/Orc格式的OBS表对应的文件压缩率较高，超过了5倍的压缩率，您可以通过调整配置来优化作业的性能。具体方法：在submit-job请求体conf字段中配置“dli.sql.files.maxPartitionBytes=33554432”。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
为什么在DLI控制台中查询不到表？ - 数据湖探索 DLI

有对该表的查询和操作权限。解决措施联系创建该表的用户，让该用户给需要操作该表的其他用户赋予查询和操作的权限。赋权操作如下：使用创建表的用户账号登录到DLI管理控制台，选择“数据管理 > 库表管理”。单击对应的数据库名称，进入到表管理界面。在对应表的“操作”列，单击“权限管理”，进入到表权限管理界面。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
SQL作业访问外表报错：DLI.0001: org.apache.hadoop.security.AccessControlException: verifyBucketExists on {{桶名}}: status [403] - 数据湖探索 DLI

SQL作业访问外表报错：DLI.0001: org.apache.hadoop.security.AccessControlException: verifyBucketExists on {{桶名}}: status [403] 问题现象 SQL作业访问外表报错：DLI.0001:

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
pyspark样例代码 - 数据湖探索 DLI

password)\ .option("database",database)\ .option("collection",collection)\ .load() jdbcDF.show() 操作结果通过SQL API 访问创建DLI关联跨源访问 Mongo的关联表。 sparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ Spark中没有datetime数据类型，其使用的是TIMESTAMP类型。您可以通过函数进行转换。例如： select cast(create_date as string)

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
SQL作业执行完成后，修改表名导致datasize不正确怎么办？ - 数据湖探索 DLI

为了避免这种情况，建议在SQL作业执行完成后，等待5分钟后再修改表名。确保系统有足够的时间更新表的元数据，避免因修改表名而导致的数据大小统计不准确的问题。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

1”，可以将多个task生成的多个文件汇总为一个文件。操作步骤在管理控制台检查对应SQL作业详情中的“结果条数”是否正确。检查发现读取的数据量是正确的。图1 检查读取的数据量确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。通过文本编辑器打开数据文件，发现数据量缺失。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
创建跨源成功但测试网络连通性失败怎么办？ - 数据湖探索 DLI

名称，查看“连接信息”>“数据库端口”，获取RDS数据库实例端口。单击“连接信息”>“安全组”对应的安全组名称，跳转到RDS实例安全组管理界面。单击“入方向规则 > 添加规则”，优先级设置为“1”，协议选择“TCP”，端口选择RDS数据库实例端口，源地址填写DLI队列的网段。单击“确定”完成配置。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

海量日志分析游戏运营数据分析游戏公司不同部门日常通过游戏数据分析平台，分析每日新增日志获取所需指标，通过数据来辅助决策。例如：运营部门通过平台获取新增玩家、活跃玩家、留存率、流失率、付费率等，了解游戏当前状态及后续响应活动措施；投放部门通过平台获取新增玩家、活跃玩家的渠道来源，来决定下一周期重点投放哪些平台。

帮助中心 > 数据湖探索 DLI > 产品介绍
DLI常用跨源分析开发方式 - 数据湖探索 DLI

pyspark样例代码 java样例代码 - - RDS MySQL 创建RDS关联表插入数据查询数据 scala样例代码 pyspark样例代码 java样例代码 MySQL CDC源表 - RDS PostGre 创建RDS关联表插入数据查询数据 scala样例代码 pyspark样例代码

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）

总条数： 1006

上一页
1
...
5
6
7
...
51
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建函数 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

Postgres CDC源表 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

查看所有表 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

创建OBS表时怎样指定OBS路径 - 数据湖探索 DLI

DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

为什么在DLI控制台中查询不到表？ - 数据湖探索 DLI

SQL作业访问外表报错：DLI.0001: org.apache.hadoop.security.AccessControlException: verifyBucketExists on {{桶名}}: status [403] - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

SQL作业执行完成后，修改表名导致datasize不正确怎么办？ - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

创建跨源成功但测试网络连通性失败怎么办？ - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线