搜索_华为云

scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
CLEAN_FILE - 数据湖探索 DLI
CLEAN_FILE - 数据湖探索 DLI

需要清理无效数据文件的Hudi表的表名，必选。 op_type 命令运行模式，可选，默认值为dry_run，取值：dry_run、repair、undo、query。 dry_run：显示需要清理的无效数据文件。 repair：显示并清理无效的数据文件。 undo：恢复已清理的数据文件 q

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

LITERAL 的时候，指定字符串常量替换 Map 中的空 key 值。支持的Connector Kafka 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
在DLI控制台修改数据库所有者 - 数据湖探索 DLI

作”栏中的“更多 > 修改数据库”。在弹出的对话框中，输入新的所有者用户名（已存在的用户名），单击“确定”。在“SQL编辑器”页面修改数据库所有者。在管理控制台左侧，单击“SQL编辑器”。在左侧导航栏单击选择“数据库”页签，鼠标左键单击对应数据库右侧的，在列表菜单中选择“修改数据库”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

可以通过如下操作查看。登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
窗口Top-N - 数据湖探索 DLI
窗口Top-N - 数据湖探索 DLI

窗口Top-N 功能描述窗口 Top-N 是特殊的 Top-N，它返回每个分区键的每个窗口的N个最小或最大值。与普通Top-N不同，窗口Top-N只在窗口最后返回汇总的Top-N数据，不会产生中间结果。窗口 Top-N 会在窗口结束后清除不需要的中间状态。窗口 Top-N 适用于用户

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

1996; 96 M 月份 July; Jul; 07 w 年中的周数 27(该年的第27周) W 月中的周数 2(该月的第2周) D 年中的天数 189(该年的第189天) d 月中的天数 10(该月的第10天) u 星期中的天数 1 = 星期一, ..., 7 = 星期日 a am/pm

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
Json函数和运算符 - 数据湖探索 DLI

SQL中的行，位置比名称更重要。支持从BOOLEAN、TINYINT、SMALLINT、INTEGER、BIGINT、REAL、DOUBLE或VARCHAR进行转换。当数组的元素类型为支持的类型之一、Map的键类型是VARCHAR且Map的值类型是支持的类型之一或行的每个字段类

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

（不使用Catalog的场景）：这里的sink表通过创建临时表指向Hudi表路径来写入数据，同时在表参数中配置hive_sync相关参数，实时同步元数据至由DLI提供的元数据服务。（具体参数详见Flink参数一节）请将作业中sink表的path参数修改为希望保存hudi表的obs路径。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

表1 参数描述参数描述 tableIdentifier Hudi表的名称。 tablelocation Hudi表的存储路径。 hoodie.archive.file.cleaner.policy 清理归档文件的策略：目前仅支持KEEP_ARCHIVED_FILES_BY_SIZ

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
regexp_replace1 - 数据湖探索 DLI
regexp_replace1 - 数据湖探索 DLI

STRING 待替换的字符 pattern 是 STRING STRING类型常量或正则表达式。待匹配的模型。更多正则表达式编写规范，请参见正则表达式规范。pattern为空串时返回报错。 replace_string 是 STRING 将匹配pattern的字符串替换后的字符串。 occurrence

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。 Hive 方言支持的 DDL 语句，Flink 1.15 当前仅支持使用Hive语法创建OBS表和使用hive语法的DLI Lakehouse表。使用Hive语法创建OBS表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
OBS授权给DLI服务 - 数据湖探索 DLI

OBS授权给DLI服务功能介绍用户主动授权OBS桶的操作权限给DLI服务，用于保存用户作业的checkpoint、作业的运行日志等。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式 POST /v1.0/{project

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > Flink作业相关API（废弃）
流生态作业开发指引 - 数据湖探索 DLI

通过对等连接建立与其他VPC的网络连接后，用户可以在DLI的租户独享集群中访问所有Flink和Spark支持的数据源与输出源，如Kafka、Hbase、ElasticSearch等。自拓展生态用户可通过编写代码实现从想要的云生态或者开源生态获取数据，作为Flink作业的输入数据。 DLI

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
RENAME COLUMN - 数据湖探索 DLI
RENAME COLUMN - 数据湖探索 DLI

表示嵌套列全路径，嵌套列具体规则见ADD COLUMNS。修改列名后自动同步到列comment中，comment的形式为：rename oldName to newName。系统响应通过运行DESCRIBE命令查看表列修改。父主题： Schema演进语法说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
DROP COLUMN - 数据湖探索 DLI
DROP COLUMN - 数据湖探索 DLI

a.b.c, x, y a.b.c 表示嵌套列全路径，嵌套列具体规则见ADD COLUMNS。系统响应通过运行DESCRIBE命令，可查看删除列。父主题： Schema演进语法说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
BlackHole结果表 - 数据湖探索 DLI

Connector允许接收所有输入记录，常用于高性能测试和UDF 输出，其不是实质性Sink。Blackhole结果表是系统内置的Connector。例如，如果您在注册其他类型的Connector结果表时报错，但您不确定是系统问题还是结果表WITH参数错误，您可以将WITH参数修改为'connector'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
FileSystem结果表 - 数据湖探索 DLI

考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subta

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
FileSystem源表 - 数据湖探索 DLI
FileSystem源表 - 数据湖探索 DLI

SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。语法格式 1 2 3 4 5 6 7 create table dataGenSource(

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表

总条数： 995

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

scala样例代码 - 数据湖探索 DLI

CLEAN_FILE - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

在DLI控制台修改数据库所有者 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

窗口Top-N - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

Json函数和运算符 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

regexp_replace1 - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

OBS授权给DLI服务 - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

RENAME COLUMN - 数据湖探索 DLI

DROP COLUMN - 数据湖探索 DLI

BlackHole结果表 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

FileSystem源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线