搜索_华为云

Spark 3.1.1版本说明 - 数据湖探索 DLI

datasource表谓词下推。【SPARK-32346】：支持avro datasource表谓词下推。【SPARK-32461】：shuffle hash join优化。【SPARK-32272】：添加SQL标准命令SET TIME ZONE。【SPARK-21492】：修复排序合并加入中的内存泄漏。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
认证证书 - 数据湖探索 DLI
认证证书 - 数据湖探索 DLI

认证证书合规证书华为云服务及平台通过了多项国内外权威机构（ISO/SOC/PCI等）的安全合规认证，用户可自行申请下载合规资质证书。图1 合规证书下载资源中心华为云还提供以下资源来帮助用户满足合规性要求，具体请查看资源中心。图2 资源中心销售许可证&软件著作权证书

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
创建DLI表关联DCS - 数据湖探索 DLI

使用跨源密码认证时配置为“true”。 table 对应Redis中的Key或Hash Key。插入redis数据时必填。查询redis数据时与“keys.pattern”参数二选一。 keys.pattern 使用正则表达式匹配多个Key或Hash Key。该参数仅用于查询时使用。查询redis数据时与“table”参数二选一。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

类型。 Q：当data-type为hash时，schema-syntax为fields和map的区别是什么？ A：当使用fields时，会将flink中的字段名作为redis的hash数据类型的field，该字段对应的值作为redis的hash数据类型的value。而当使用map

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
函数概览 - 数据湖探索 DLI
函数概览 - 数据湖探索 DLI

参数的数据类型实现if-then-else分支选择的功能。 javahash javahash(string a) STRING 返回hash值。 max_pt max_pt(<table_full_name>) STRING 返回分区表的一级分区中有数据的分区的最大值，按字母排序，且读取该分区下对应的数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

delimiter 否 : String redis的key和namespace之间的分隔符。 data-type 否 hash String redis的数据类型，有下列选项 hash list set sorted-set string data-type取值约束详见data-type取值约束说明。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

delimiter 否 : String redis的key和namespace之间的分隔符。 data-type 否 hash String redis的数据类型，有下列选项 hash list set sorted-set string data-type取值约束详见data-type取值约束说明。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
字符串函数和运算符 - 数据湖探索 DLI

JARO_DISTANCE('hello', 'hell');-- 0.9333333333333332 FNV_HASH(type v) 描述：计算字符串的hash值。 select FNV_HASH('hello');-- -6615550055289275125 word_stem(word)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
数据保护技术 - 数据湖探索 DLI

enable 打开taskmanager之间通信的SSL开关。否 true security.ssl.algorithms 设置SSL加密的算法。否 TLS_DHE_RSA_WITH_AES_128_GCM_SHA256,TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
Hudi表分区设计规范 - 数据湖探索 DLI

近一个月的数据更新占比最大，可以按照月份创建分区；近一天内的数据更新占比大，可以按照天进行分区。采用Bucket索引，写入是通过主键Hash打散的，数据会均匀的写入到分区下每个桶。因为各个分区的数据量是会有波动的，分区下桶的个数设计一般会按照最大分区数据量计算，这样会出现越细粒度的分区，桶的个数会冗余越多。例如：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

Jar作业等操作不支持该操作修改了作业对资源的算法逻辑。例如原有的算法的语句是执行加减运算，当前需要恢复的状态将算法的语句修改成为乘除取余的运算，是无法从checkpoint直接恢复的。修改“静态流图” 不支持该操作修改了作业对资源的算法逻辑。修改“单TM所占CU数”参数支持

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

示例（适用于Kafka集群已开启SASL_SSL场景）示例1：DMS集群使用SASL_SSL认证方式。创建DMS的kafka集群，开启SASL_SSL，并下载SSL证书，将下载的证书client.jks上传到OBS桶中。 CREATE TABLE ordersSource ( order_id string

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
创建CSS类型跨源认证 - 数据湖探索 DLI

创建CSS类型跨源认证操作场景通过在DLI控制台创建的CSS类型的跨源认证，将CSS安全集群的认证信息存储到DLI，无需在SQL作业中配置账号密码，安全访问CSS安全集群。本节操作介绍在DLI控制台创建CSS安全集群的跨源认证的操作步骤。操作须知已创建CSS安全集群，且集群满足以下条件：

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索 DLI > 用户指南> 数据管理> 程序包管理> 内置依赖包”），这些常用算法库满足了大部分用户的使用场景。对于用户的PySpark程序依赖了内置算法库未提供的程序库该如何呢？其实PySpark本身

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Doris结果表 - 数据湖探索 DLI
Doris结果表 - 数据湖探索 DLI

`city` varchar(10), `age` int, `gender` int ) DISTRIBUTED BY HASH(`user_id`) BUCKETS 10 参考创建Flink OpenSource作业，创建flink opensource sq

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

示例（适用于Kafka集群已开启SASL_SSL场景）示例1：DMS集群使用SASL_SSL认证方式。创建DMS的kafka集群，开启SASL_SSL，并下载SSL证书，将下载的证书client.jks上传到OBS桶中。 CREATE TABLE ordersSource ( order_id string

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Doris维表 - 数据湖探索 DLI
Doris维表 - 数据湖探索 DLI

`city` varchar(10), `age` int, `gender` int ) DISTRIBUTED BY HASH(`user_id`) BUCKETS 10; INSERT INTO dorisdemo VALUES ('user1', 'city1'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
Doris源表 - 数据湖探索 DLI
Doris源表 - 数据湖探索 DLI

`city` varchar(10), `age` int, `gender` int ) DISTRIBUTED BY HASH(`user_id`) BUCKETS 10; INSERT INTO dorisdemo VALUES ('user1', 'city1'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
SHOW TBLPROPERTIES TABLE|VIEW - 数据湖探索 DLI

(1 row) --查看show_table1的压缩算法 SHOW TBLPROPERTIES show_table1('orc.compression.codec'); SHOW TBLPROPERTIES

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
CSS安全集群配置 - 数据湖探索 DLI

CSS安全集群配置准备工作当前CSS服务提供的Elasticsearch 6.5.4或以上集群版本为用户增加了安全模式功能，开启安全模式后，将会为用户提供身份验证、授权以及加密等功能。DLI服务对接CSS安全集群时，需要先进行以下准备工作。选择CSS Elasticsearch

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS

总条数： 86

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消