搜索_华为云

java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码开发说明 redis只支持增强型跨源。只能使用包年包月队列。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码开发说明前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖涉及到的mvn依赖库

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的OpenTSDB和MRS的OpenTSDB。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解 import相关依赖包

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Hudi数据表Clean规范 - 数据湖探索 DLI

入的周期。 COW表如果业务没有历史版本数据保留的特殊要求，保留版本数设置为1。 COW表的每个版本都是表的全量数据，保留几个版本就会冗余多少个版本。因此如果业务无历史数据回溯的需求，保留版本数设置为1，也就是保留当前最新版本 clean作业每天至少执行一次，可以2~4小时执行一次。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Over聚合 - 数据湖探索 DLI
Over聚合 - 数据湖探索 DLI

窗口可以定义在一个分区表上。PARTITION BY 子句代表着每行数据只在其所属的数据分区进行聚合。范围（RANGE）定义：范围（RANGE）定义指定了聚合中包含了多少行数据。范围通过 BETWEEN 子句定义上下边界，其内的所有行都会聚合。Flink 只支持 CURRENT ROW 作为上边界。有两种方法可以定义范围：ROWS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明 mongo只支持增强型跨源。只能使用包年包月队列。 DDS即文档数据库服务，兼容MongoDB协议。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明 redis只支持增强型跨源。只能使用包年包月队列。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码操作场景本例提供使用Spark作业访问DWS数据源的pyspark样例代码。在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
Hudi常见配置参数 - 数据湖探索 DLI

设置执行clustering时最多选择多少个FileGroup，该值越大并发度越大 30 hoodie.clustering.plan.strategy.max.bytes.per.group 设置执行clustering时每个FileGroup最多有多少数据参与clustering 2

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
原生数据类型 - 数据湖探索 DLI

DECIMAL(precision,scale) 10进制精确数字类型。固定有效位数和小数位数的数据类型，例如：3.5 precision：表示最多可以表示多少位的数字。 scale：表示小数部分的位数。 - 1<=precision<=38 0<=scale<=38 若不指定precision和

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用）非弹性资源池模式的队列是DLI的上一代计算资源管理方式，按使用需求购买和释放资源，需要预先估计资源使用需求再进行购买。优先推荐使用弹性资源池队列，提高资源使用的灵活性和资源利用效率。购买弹性资源池并在弹性资源池中添加队列请参考创建弹性资源池并添加队列。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
字符串函数概览 - 数据湖探索 DLI

char_matchcount char_matchcount(string <str1>, string <str2>) BIGINT 计算str1中有多少个字符出现在str2中。 encode encode(string <str>, string <charset>) BINARY 将str按照charset格式进行编码。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
OBS授权 - 数据湖探索 DLI
OBS授权 - 数据湖探索 DLI

OBS授权前提条件已参考Java SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化。样例代码用户可以使用OBS授权操作的接口，将OBS桶的操作权限授权给DLI, 用于保存用户作业的数据和作业的运行日志等。示例代码如下： 1

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
使用DLI分析账单消费数据 - 数据湖探索 DLI

优化建议。通过以上分析，了解到sql和flink这两个队列几乎是在持续使用的，建议通过购买包周期队列来降低使用成本。另外，对于明确需要使用多少CU时的作业，也可以提前购买对应的CU时套餐包，来降低使用成本。企业中的业务模式较多且经常变化，成本管理员通常并不能全面及时了解花销较大

 帮助中心 > 数据湖探索 DLI > 最佳实践
repeat - 数据湖探索 DLI
repeat - 数据湖探索 DLI

repeat repeat函数用于返回将str重复n次后的字符串。命令格式 repeat(string <str>, bigint <n>) 参数说明表1 参数说明参数是否必选参数类型说明 str 是 STRING 如果输入为BIGINT、DOUBLE、DECIMAL

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
SparkSQL建表参数规范 - 数据湖探索 DLI

SparkSQL建表参数规范规则建表必须指定primaryKey和preCombineField。 Hudi表提供了数据更新的能力和幂等写入的能力，该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力，不指定preCombineField会导致主键重复。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
WHERE - 数据湖探索 DLI
WHERE - 数据湖探索 DLI

WHERE 功能描述在WHERE子句中嵌套子查询，利用子查询的结果作为过滤条件。语法格式 1 2 SELECT [ALL | DISTINCT] attr_expr_list FROM table_reference WHERE {col_name operator (sub_query)

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句

总条数： 412

上一页
1
2
3
4
5
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

java样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

Over聚合 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

原生数据类型 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

字符串函数概览 - 数据湖探索 DLI

OBS授权 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

repeat - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

WHERE - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线