搜索_华为云

java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖。涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

Keytab的地址。 'principal' ='krbtest' 认证用户名。 krb5.conf和keytab文件获取请具体参考开启Kerberos认证时的相关配置文件操作说明。插入数据 1 sparkSession.sql("insert into testhbase values('95274'

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
CSS安全集群配置 - 数据湖探索 DLI

此处设置keystore.jks文件的位置以及进入这个文件的密钥。在准备工作中生成的keystore.jks文件需要先放到OBS桶中，然后填入ak和sk以及jks文件的具体位置。最后在“es.net.ssl.keystore.pass”填入进入文件的密钥。 .option("es

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

是否跳过，将jar包、Python程序文件、配置文件上传到OBS和加载到DLI服务端资源列表。当相关资源文件已经加载到DLI服务资源列表中，可以使用该参数跳过该步骤。不携带该参数时，默认会上传和加载命令中的所有资源文件到DLI服务中。 all：跳过所有资源文件的上传和加载 app：跳过Spark应用程序文件的上传和加载

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hudi常见配置参数 - 数据湖探索 DLI

置为0，会关闭此功能。由于批处理中分区中插入记录的数量众多，总会出现小文件。Hudi提供了一个选项，可以通过将对该分区中的插入作为对现有小文件的更新来解决小文件的问题。此处的大小是被视为“小文件大小”的最小文件大小。 104857600 byte hoodie.copyonwrite

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

自定义CSS数据源名称。例如当前配置为“source_css”。 Elasticsearch服务器列表单击输入框旁边的“选择”按钮，选择当前CSS集群即可自动关联出来Elasticsearch服务器列表。安全模式认证如果所需连接的CSS集群在创建时开启了“安全模式”，该参数需设置为“是”，否则设置为“否”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Spark 3.3.1版本说明 - 数据湖探索 DLI

committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

不同表类型表示不同的数据存储位置。 OBS表表示数据存储在OBS服务的桶中。 DLI表表示数据存储在本服务内部的表中。 CloudTable表表示数据储存在CloudTable服务的表中。可通过DLI创建表，与其他服务的数据进行关联，以此来实现不同数据源的联合查询分析。元数据元数据（M

帮助中心 > 数据湖探索 DLI > 产品介绍
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 Maven工程的pom.xml文件配置请参考JAVA样例代码中“pom文件配置”说明。 pom文件配置中依赖包 <dependency> <groupId>com.huaweicloud

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
Spark 2.4.5版本说明 - 数据湖探索 DLI

5。表1 Spark 2.4.5版本优势特性说明支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ DLI和MRS都支持Spark组件，但在服务模式、接口方式、应用场景和性能特性上存在一些差异。 DLI服务的Spark组件是全托管式服务，用户对Spark组件不感知，仅仅可以使用该服务，且接口为封装式接口。 DLI的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
导入Flink作业 - 数据湖探索 DLI
导入Flink作业 - 数据湖探索 DLI

参数名称是否必选参数类型说明 zip_file 是 String 从OBS上导入的作业zip文件路径，支持填写文件夹，导入文件夹下的所有zip文件。说明：文件夹中只能包含zip文件。 is_cover 否 Boolean 如果导入的作业与服务已有的作业同名，是否覆盖服务中已有的作业。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
导出SQL作业结果 - 数据湖探索 DLI

覆盖指定路径：当计划导出某一个结果时，您可以选择一个已有的文件路径作为输出目录，如果这个路径下已有同名文件，将会自动覆盖这个文件，即原有的作业结果会被新导出的作业结果文件所替代。覆盖指定路径方式适用于在同一个路径下保存唯一的作业结果文件的场景，即不需要旧的作业结果的场景。结果条数否

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询Spark作业日志 - 数据湖探索 DLI

Spark日志分割规则：按大小分割：默认情况下，每个日志文件最大为128MB。按时间分割：每过一小时自动创建新的日志文件。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
在Spark SQL作业中使用UDF - 数据湖探索 DLI

</dependency> </dependencies> 图5 pom文件中添加配置在工程路径的“src > main > java”文件夹上鼠标右键，选择“New > Package”，新建Package和类文件。图6 新建Package和类文件 Package根据需要定义，本示例定义为：“com

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

file_num 指定目录的文件数量 storage_size 该目录的Size（bytes） storage_size(unit) 该目录的Size（KB） storage_path 指定目录的完整FS绝对路径 space_consumed 返回文件/目录在集群中占用的实际空间，即它考虑了为集群设置的复制因子

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
查询Flink作业日志 - 数据湖探索 DLI

前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

导入OBS表时，创建OBS表时指定的路径必须是文件夹，若建表路径是文件将导致导入数据失败。仅支持导入位于OBS路径上的原始数据。不建议对同一张表并发导入数据，因为有一定概率发生并发冲突，导致导入失败。导入数据时只能指定一个路径，路径中不能包含逗号。当OBS桶目录下有文件夹和文件同名时，导入数据会优先指向该路径下的文件而非文件夹。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关

总条数： 834

上一页
1
...
7
8
9
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

java样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

导入Flink作业 - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线