搜索_华为云

Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch 引擎的索引中。 Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等。能为用户提供实时搜索、稳定可靠的服务。适用于日志分析、站内搜索等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

选择左侧导航栏的“总览”，单击页面右上角的“登录指令”，在弹出的页面中单击复制登录指令。在安装容器引擎的虚拟机中执行上一步复制的登录指令。创建容器镜像组织。如果已创建组织则本步骤可以忽略。登录SWR管理控制台。选择左侧导航栏的“组织管理”，单击页面右上角的“创建组织”。填写组织名称，单击“确定”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

前提条件已参考Python SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化。上传资源包您可以使用DLI提供的接口上传资源包，示例代码如下。完整样例代码和依赖包说明请参考：Python SDK概述。 1 2 3 4 5 6 def

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
数据库相关 - 数据湖探索 DLI
数据库相关 - 数据湖探索 DLI

return 含表的数据库不能直接删除，请先删除数据库的表再删除数据库。数据库删除后，将不可恢复，请谨慎操作。完整样例代码和依赖包说明请参考：Python SDK概述。查询所有数据库 DLI提供查询数据库列表接口。您可以使用该接口查询当前已创建的数据库列表。示例代码如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

使用须知要使用DLI Python SDK访问指定服务的 API ，您需要确认已在DLI管理控制台开通当前服务并完成服务授权。 Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
队列相关 - 数据湖探索 DLI
队列相关 - 数据湖探索 DLI

队列相关约束限制当前使用SDK创建的作业不支持在default队列上运行。查询所有队列 DLI提供查询队列列表接口，您可以使用该接口并选择相应的队列来执行作业。示例代码如下： 1 2 3 4 5 6 7 8 9 def list_all_queues(dli_client):

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
find - 数据湖探索 DLI
find - 数据湖探索 DLI

STRING 以逗号（,）分隔的字符串。返回值说明返回BIGINT类型的值。当str2中无法匹配到str1或str1中包含逗号（,）时，返回0。当str1或str2值为NULL时，返回NULL。示例代码查找字符串ab在字符串abc,123,ab,c中的位置。命令示例如下。返回3。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
表相关 - 数据湖探索 DLI
表相关 - 数据湖探索 DLI

Column c1 = new Column("c1", DataType.STRING, "desc for c1"); Column c2 = new Column("c2", DataType.INT, "desc for c2"); Column c3 = new

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
userDefined结果表 - 数据湖探索 DLI

只能为user-defined，表示使用自定义的sink。 connector.class-name 是 sink函数的全限定类名。sink类的具体实现可以参考前提条件说明。 connector.class-parameter 否 sink函数其构造函数的参数，只支持一个String类型的参数。注意事项 connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
ClickHouse结果表 - 数据湖探索 DLI

e和Kafka集群所在的虚拟私有云和子网分别创建跨源连接，并绑定所要使用的Flink作业队列。设置ClickHouse和Kafka集群安全组的入向规则，使其对当前将要使用的Flink作业队列网段放通。参考测试地址连通性根据ClickHouse和Kafka的地址测试队列连通性。若

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

建议排查代码，确认是否有内存泄漏。图2 Full GC 处理步骤如果频繁Full GC, 建议排查代码，是否有内存泄漏。增加单TM所占的资源。联系技术支持，修改集群心跳配置参数。父主题： Flink作业性能调优类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
查询指定资源实例的标签信息 - 数据湖探索 DLI

弹性资源池ID：通过调用查询所有弹性资源池获弹性资源池ID。响应中的resource_id为弹性资源池ID。增强型跨源连接ID：在DLI管理控制台的“增强型跨源连接”列表页获取“连接ID”即为增强型跨源连接ID。数据库ID：添加标签时候传入的数据库ID即数据库名。您可以在DLI控制台的“库表管理”页面查看数据库名称。

帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

置导入数据的类型，例如将data_type设置为csv。csv数据的具体格式通可过options参数设置，例如：csv的分隔符，转义符等。当OBS桶目录下有文件夹和文件同名时，加载数据会优先指向该路径下的文件而非文件夹。建议创建OBS对象时，在同一级中不要出现同名的文件和文件夹。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
Flink作业模板相关 - 数据湖探索 DLI

前提条件已参考Java SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化。新建作业模板 DLI提供新建Flink作业模板的接口。您可以使用该接口新建一个Flink作业模板。示例代码如下： 1 2 3 4 5 6 public static

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码操作场景本例提供使用Spark作业访问DWS数据源的java样例代码。在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
查询指定资源类型的标签信息 - 数据湖探索 DLI

查询指定资源类型的标签信息功能介绍该接口用于查询指定资源类型的标签信息，即指定项目中资源类型的所有资源标签集合。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET

帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

DLI提供了一个通用接口，可用于获取用户在启动Flink作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。本操作介绍获取Flink作业委托临时凭证的操作方法。 Spark作业场景 Spark

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表4 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
pyspark样例代码 - 数据湖探索 DLI

南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码通过DataFrame API访问认证用的password硬编码到代码中或者明文存储都有很大的安全风

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
Hudi数据表Archive规范 - 数据湖探索 DLI

Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。对于Hudi的MOR类型和COW类型的表，都需要开启Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范

总条数： 452

上一页
1
2
3
4
5
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Elasticsearch - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

数据库相关 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

队列相关 - 数据湖探索 DLI

find - 数据湖探索 DLI

表相关 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

查询指定资源实例的标签信息 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

Flink作业模板相关 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

查询指定资源类型的标签信息 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线