搜索_华为云

Spark 2.4.5版本说明 - 数据湖探索 DLI

说明支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
将OBS数据导入至DLI - 数据湖探索 DLI

说明：路径同时支持文件和文件夹。 obs://DLI/sampledata.csv 表头:无/有当“文件格式”为“CSV”时该参数有效。设置导入数据源是否含表头。选中“高级选项”，勾选“表头:无”前的方框，“表头:无”显示为“表头:有”，表示有表头；取消勾选即为“表头:无”，表示无表头。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
pyspark样例代码 - 数据湖探索 DLI

StructField("value", DoubleType())]) 设置数据 1 dataList = sparkSession.sparkContext.parallelize([("aaa", "abc",

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
导出SQL作业结果 - 数据湖探索 DLI

业结果文件的场景，即不需要旧的作业结果的场景。结果条数否指定导出的结果条数。不填写数值或数值为“0”时，导出全部结果。表头否设置导出查询结果数据是否含表头。导出作业结果到本地异步DDL和QUERY语句支持将结果下载到本地。下载到本地默认仅支持下载1000条数据。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？ - 数据湖探索 DLI

TABLE_NAME CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci; 参考信息如何确保RDS for MySQL数据库字符集正确父主题：增强型跨源连接类

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加UDF声明语句，就可以像普通函数一样使用了。 1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

基于文件的权限管理。高性能性能基于软硬件一体化的深度垂直优化。大数据开源版本性能。跨源分析支持多种数据格式，云上多种数据源、ECS自建数据库以及线下数据库，数据无需搬迁，即可实现对云上多个数据源进行分析，构建企业的统一视图，帮助企业快速完成业务创新和数据价值探索。

帮助中心 > 数据湖探索 DLI > 产品介绍
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

登录DEW管理控制台选择“凭据管理”，进入“凭据管理”页面。单击“创建凭据”。配置凭据基本信息 DLI Spark jar作业编辑界面设置作业参数。 Spark参数： spark.hadoop.fs.obs.bucket.USER_BUCKET_NAME.dew.access

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加UDF声明语句，就可以像普通函数一样使用了。 1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加UDF声明语句，就可以像普通函数一样使用了。 1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
pyspark样例代码 - 数据湖探索 DLI

sparkSession = SparkSession.builder.appName("datasource-redis").getOrCreate() 设置连接参数 1 2 3 4 host = "192.168.4.199" port = "6379" table = "person" auth

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
Spark 3.3.1版本说明 - 数据湖探索 DLI

支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
更新SQL作业 - 数据湖探索 DLI
更新SQL作业 - 数据湖探索 DLI

cu_number 否 Integer 用户为作业选择的CU数量。默认值为“2”。 parallel_number 否 Integer 用户设置的作业并行数目。默认值为“1”。 checkpoint_enabled 否 Boolean 是否开启作业自动快照功能。开启：true 关闭：false

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

登录DLI管理控制台，在左侧导航栏单击“跨源管理”，在跨源管理界面，单击“增强型跨源”，单击“创建”。在增强型跨源创建界面，配置具体的跨源连接参数。具体参考如下。连接名称：设置具体的增强型跨源名称。本示例输入为：dli_kafka。弹性资源池：选择步骤1：创建队列中已经创建的队列。虚拟私有云：选择Kafka的虚拟私有云。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
percent - 数据湖探索 DLI
percent - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明返回DOUBLE类型的值。示例代码示例数据为便于理解函数的使用方法，本文为您提供源数据，基于源数据提供函数相关示

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

percentage)→array<[same as x]> 描述：按照百分比percentage，返回所有x输入值的近似百分位数。每一项的权重值为w且必须为正数。x设置有效的百分位。percentage的值必须在0到1之间，并且所有输入行必须为常量。 select approx_percentile(x,

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
创建CSS类型跨源认证 - 数据湖探索 DLI

在“集群管理”页面中，单击对应的集群名称，进入“基本信息”页面。单击“安全模式”后的下载证书，下载CSS安全集群的证书。将认证凭证上传到OBS桶。关于如何创建OBS桶并上传数据，请参考《对象存储服务快速入门》。创建跨源认证。登录DLI管理控制台。选择“跨源管理 > 跨源认证”。单击“创建”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
rank - 数据湖探索 DLI
rank - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明返回INT类型的值。 a为NULL，则返回NULL。示例代码为便于理解函数的使用方法，本文为您提供源数据，基于源数

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

建议为streaming-source.monitor-interval（最新分区作为临时表）或 lookup.join.cache.ttl（所有分区作为临时表）设置一个相对较大的值。否则，作业容易出现性能问题，避免表更新和重新加载过于频繁。缓存刷新需加载整个Hive表。无法区分新数据和旧数据。参数说明

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive

总条数： 540

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark 2.4.5版本说明 - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？ - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

更新SQL作业 - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

percent - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

创建CSS类型跨源认证 - 数据湖探索 DLI

rank - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线