搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。通过DataFrame API 访问 import相关依赖 1 2 3 from __future__

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖。涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

DLI服务只支持UTF-8文本格式，因此在执行创建表和导入操作时，用户的数据需要以UTF-8编码。在将数据导入DLI之前，确保源数据文件（如CSV、JSON等）是以UTF-8编码保存的。如果数据源不是UTF-8编码，请在导入前提前转换为UTF-8编码。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
pyspark样例代码 - 数据湖探索 DLI

定包年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。通过DataFrame API 访问 import相关依赖 from __future__

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

Keytab的地址。 'principal' ='krbtest' 认证用户名。 krb5.conf和keytab文件获取请具体参考开启Kerberos认证时的相关配置文件操作说明。插入数据 1 sparkSession.sql("insert into testhbase values('95274'

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
DWS Connector概述 - 数据湖探索 DLI

DWS Connector概述数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DLI将Flink作业从数据仓库服务（DWS）中读取数据。DWS数据库内核兼容PostgreSQ

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
DWS源表（不推荐使用） - 数据湖探索 DLI

按照如下操作查看taskmanager.out文件中的数据结果。登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
CSS安全集群配置 - 数据湖探索 DLI

此处设置keystore.jks文件的位置以及进入这个文件的密钥。在准备工作中生成的keystore.jks文件需要先放到OBS桶中，然后填入ak和sk以及jks文件的具体位置。最后在“es.net.ssl.keystore.pass”填入进入文件的密钥。 .option("es

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
创建增强型跨源连接 - 数据湖探索 DLI

使用DLI增强型跨源时，弹性资源池/队列的网段与数据源网段不能重合。访问跨源表需要使用已经创建跨源连接的队列。跨源表不支持Preview预览功能。检测连通性要求检测跨源连接的连通性时对IP约束限制如下： IP必须为合法的IP地址，用“.”分隔的4个十进制数，范围是0-255。测试时IP地址后

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

按照如下操作查看taskmanager.out文件中的数据结果。登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Delta常见配置参数 - 数据湖探索 DLI

a.logRetentionDuration Delta log文件过期时间。每当Delta log进行checkpoint动作时，会检查是否有需要删除的过期文件，如果有，则删除这些过期文件以防Delta log文件无限增长。 30天

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

是否跳过，将jar包、Python程序文件、配置文件上传到OBS和加载到DLI服务端资源列表。当相关资源文件已经加载到DLI服务资源列表中，可以使用该参数跳过该步骤。不携带该参数时，默认会上传和加载命令中的所有资源文件到DLI服务中。 all：跳过所有资源文件的上传和加载 app：跳过Spark应用程序文件的上传和加载

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

OBS的使用涉及以下几项费用：存储费用：静态网站文件存储在OBS中产生的存储费用。请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。流量费用：用户使用自定义域名通过公网访问OBS时产生的流量费用。实际产生的费用与存储的文件大小、用户访问所产生的请求次数和流量大小有关，请根据自己的业务进行预估。

帮助中心 > 数据湖探索 DLI > 最佳实践
Spark 3.3.1版本说明 - 数据湖探索 DLI

committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

查询，生成了csv数据文件，文件内容为insert插入的数据内容。图4 查询结果指定的OBS数据目录包含数据文件。在OBS桶“dli-test-021”根目录下创建数据文件目录“data2”。创建如下内容的测试数据文件“test.csv”，并上传文件到“obs://dli-test-021/data2”目录下。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Hudi常见配置参数 - 数据湖探索 DLI

置为0，会关闭此功能。由于批处理中分区中插入记录的数量众多，总会出现小文件。Hudi提供了一个选项，可以通过将对该分区中的插入作为对现有小文件的更新来解决小文件的问题。此处的大小是被视为“小文件大小”的最小文件大小。 104857600 byte hoodie.copyonwrite

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
创建跨源认证（废弃） - 数据湖探索 DLI

径，cer类型文件。 datasource_type 是 String 数据源类型，目前支持CSS,KRB,passwd,Kafka_SSL。 krb5_conf 否 String krb5配置文件obs路径。 keytab 否 String keytab配置文件obs路径。 truststore_location

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 跨源认证相关API（废弃）
创建跨源认证 - 数据湖探索 DLI

径，cer类型文件。 datasource_type 是 String 数据源类型，目前支持CSS,KRB,passwd,Kafka_SSL。 krb5_conf 否 String krb5配置文件obs路径。 keytab 否 String keytab配置文件obs路径。 truststore_location

帮助中心 > 数据湖探索 DLI > API参考 > 跨源认证相关API
查询Spark作业日志 - 数据湖探索 DLI

Spark日志分割规则：按大小分割：默认情况下，每个日志文件最大为128MB。按时间分割：每过一小时自动创建新的日志文件。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业

总条数： 321

上一页
1
...
5
6
7
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

DWS源表（不推荐使用） - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

Delta常见配置参数 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

创建跨源认证（废弃） - 数据湖探索 DLI

创建跨源认证 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线