搜索_华为云

创建并提交SQL作业 - 数据湖探索 DLI

ce-pools {project_id}信息请从获取项目ID获取。请求参数说明详情，请参见创建弹性资源池。请求示例描述：在项目ID为48cc2c48765f481480c7db940d6409d1的项目下创建一个名称为elastic_pool_dli的弹性资源池。示例URL：POST

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

将原有跨源连接删除重新创建。再次创建时，必须确保所选“安全组”、“虚拟私有云”、“子网””和“目的地址”与RDS中的设置完全一致。请选择正确的“服务类型”，本示例中为“RDS”。图1 创建经典型跨源连接-RDS 检查安全组网络（vpc）配置。若按照步骤1重建跨源连接后还是报错“communication

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
Hudi数据表Compaction规范 - 数据湖探索 DLI

操作来产生新版本的Parquet文件，那旧版本的文件就不能被Clean清理，增加存储压力。提交Spark jar作业时，CPU与内存比例为1:4~1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

图6 新建Package和类文件 Package根据需要定义，本示例定义为：“com.huawei.demo”，完成后回车。图7 自定义Package 在包路径下新建Java Class文件，本示例定义为：UDTFSplit。图8 新建Java Class文件编写UDTF函数代码。完整样例代码请参考样例代码。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
跨源认证权限管理 - 数据湖探索 DLI

证的权限。修改当前用户的权限登录DLI管理控制台。单击“跨源管理 > 跨源认证”。选择要进行授权的跨源认证，单击操作列“权限管理”进入开源认证的用户权限信息页面。单击操作列的“权限设置”，修改当前用户的权限。详细权限描述如表1所示。当“权限设置”中的选项为灰色时，表示

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

Package”，新建Package和类文件。 Package根据需要定义，本示例定义为：“com.dli.demo” 图6 新建Package 在包路径下新建Java Class文件，本示例定义为：AvgFilterUDAFDemo。图7 创建类编写UDAF函数代码。UDAF函数实现，主要注意以下几点：

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
数据湖探索简介 - 数据湖探索 DLI

使用队列1中的资源，只能单独对队列1进行扩容。添加到同一个弹性资源池的多个队列，CU资源可以共享，达到资源的合理利用。配置跨源时，必须为每个队列分配不重合的网段，占用大量VPC网段。多队列通过弹性资源池统一进行网段划分，减少跨源配置的复杂度。资源调配多个队列同时扩容时不

 帮助中心 > 数据湖探索 DLI > 产品介绍
关系运算符 - 数据湖探索 DLI
关系运算符 - 数据湖探索 DLI

E，A与B其中一个为NULL则返回FALSE。 A <> B BOOLEAN 若A与B不相等，则返回TRUE，否则返回FALSE。若A或B为NULL，则返回NULL，该种运算符为标准SQL语法。 A != B BOOLEAN 与<>逻辑操作符相同，该种运算符为SQL Server语法。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 运算符
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

getResource("userData/fileName")加载该文件。 ClassName”为需要访问该文件的类名。 userData为固定文件路径名，不支持修改或自定义其他路径名。 fileName为需要访问的文件名。本节示例适用于Flink 1.12版本。Flink 1.15版本的Jar作业开发指导请参考Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

湖探索API参考》>《创建批处理作业》。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.redis。如果选择Spark版本为3.1.1时，无需选择Module模块，需在 'Spark参数（--conf)'

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
查询HBase表 - 数据湖探索 DLI
查询HBase表 - 数据湖探索 DLI

过滤条件场景过滤条件为>,<,>=,<=,=,!=,and,or 例如： 1 select * from tableName where (column1 >= value1 and column2<= value2) or column3 != value3 过滤条件为like 和 not

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 跨源连接HBase表
查询HBase表 - 数据湖探索 DLI
查询HBase表 - 数据湖探索 DLI

过滤条件场景过滤条件为>,<,>=,<=,=,!=,and,or 例如： 1 select * from tableName where (column1 >= value1 and column2<= value2) or column3 != value3 过滤条件为like 和 not

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
pyspark样例代码 - 数据湖探索 DLI

DTx3UPK.datasource.com:9200" resource为指定在CSS关联的资源名。格式可以用"/index/type"指定资源位置（可简单理解index为database，type为table，但绝不等同）。 ES 6.X版本中，单个Index只支持唯一type，type名可以自定义。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
pyspark样例代码 - 数据湖探索 DLI

column","name")”指定，name为列名如果需要保存嵌套的DataFrame，则通过“.option("model","binary")”进行保存如果需要指定数据过期时间：“.option("ttl",1000)”;秒为单位读取redis上的数据 1 sparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

湖探索API参考》>《创建批处理作业》。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.mongo。如果选择Spark版本为3.1.1时，无需选择Module模块，需在 'Spark参数（--conf)'

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

LI作业运行过程中产生的临时数据，例如：作业日志、作业结果。具体操作请参考：配置DLI作业桶。创建弹性资源池并添加SQL队列弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），用于灵活应对业务对计算资源变化的需求。创建弹性资源池后，您可以在弹性资源池中创建多个队列

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

QL编辑器页面。单击“设置”，在参数设置中选择“spark.sql.autoBroadcastJoinThreshold”参数，其值设置为“-1”。重新单击“执行”，运行该作业，观察作业运行结果。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
导出SQL作业结果 - 数据湖探索 DLI

那么导出的作业结果的路径为obs://bucket/src1/src2/test.csv 如果导出方式选择的是“覆盖指定路径” 在选择桶路径后，将作业结果导出至该路径下，如有重名文件将自动覆盖。例如选择存储路径obs://bucket/src1/ 那么导出的作业结果的路径为obs://bucket/src1/test

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询作业状态 - 数据湖探索 DLI

database_name String 记录其操作的表所在的数据库名称。类型为IMPORT、EXPORT和QUERY的作业才有“database_name”属性。 table_name String 记录其操作的表名称。类型为IMPORT、EXPORT和QUERY的作业才有“table_name”属性。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
数据库相关 - 数据湖探索 DLI
数据库相关 - 数据湖探索 DLI

DliException as e: print(e) return print(db) “default”为内置数据库，不能创建名为“default”的数据库。完整样例代码和依赖包说明请参考：Python SDK概述。删除数据库 DLI提供删除

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关

总条数： 911

上一页
1
...
36
37
38
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建并提交SQL作业 - 数据湖探索 DLI

新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

跨源认证权限管理 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

关系运算符 - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

查询HBase表 - 数据湖探索 DLI

查询HBase表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

查询作业状态 - 数据湖探索 DLI

数据库相关 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线