搜索_华为云

去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

me。升序（ ASC ）排列指只保留第一行，而降序排列（ DESC ）则只保留最后一行。 WHERE rownum = 1: Flink 需要 rownum = 1 以确定该查询是否为去重查询。注意事项无示例根据order_id对数据进行去重，其中proctime为事件时间属性列

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
迁移数据场景概述 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI 数据迁移数据类型映射将其他云服务或业务平台数据迁移到DLI ，或者将DLI数据迁移到其他云服务或业务平台时，涉及到源和目的端数据类型的转换和映射，根据表2可以获取到源和目的端的数据类型映射关系。表2 数据类型映射表 MySQL Hive DWS Oracle PostgreSQL

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
添加Flink作业标签 - 数据湖探索 DLI

本节介绍如何为作业添加标签、修改标签和删除标签。在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Flink作业”，进入Flink作业管理页面。单击需要查看的作业名称，进入“作业详情”页面。单击“标签”页签，显示当前作业的标签信息。图1 管理作业标签单击“添加/编辑标签”，弹出“添加/编辑标签”对话框。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
CLEANING - 数据湖探索 DLI
CLEANING - 数据湖探索 DLI

file_versions_retained=> '[file_versions_retained]'); 参数描述表1 参数描述参数描述是否必填 table 需要查询表的表名，支持database.tablename格式是 clean_policy 清理老版本数据文件的策略，默认KEEP_LATEST_COMMITS

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

Spark作业未开启高级配置时默认按A类型资源规格配置。 Spark作业中显示计算资源规格的单位为CPU单位，1CU包含1CPU和4GB内存。上述公式中x1代表CPU单位转换为CU单位。请分别使用内存和CPU核数计算所需的CUs，取两者中的最大值作为Executor 或driver所需的CU数。图2 查看Spark作业所需CUs数

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
next - 数据湖探索 DLI
next - 数据湖探索 DLI

day_of_week) 参数说明表1 参数说明参数是否必选参数类型说明 start_date 是 DATE 或 STRING 代表需要处理的日期。 start_date取值为STRING类型格式时，至少要包含yyyy-mm-dd且不含多余的字符串。格式为： yyyy-mm-dd

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_extract('basketball', 'bas(.*?)(ball)',0); 返回99。在DLI上提交正则计算的SQL，需要使用两个"\"作为转义字符。 select regexp_extract('8d99d8', '8d(\\d+)d8'); 返回【你好】。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

DCS，文档数据库服务DDS，数据仓库服务GaussDB（DWS），MapReduce服务MRS，云数据库RDS等。使用DLI的跨源能力，需要先创建跨源连接。管理控制台界面具体操作请参考《数据湖探索用户指南》。使用Spark作业跨源访问数据源支持使用scala，pyspark和java三种语言进行开发。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
SHOW_LOG_FILE - 数据湖探索 DLI
SHOW_LOG_FILE - 数据湖探索 DLI

merge => '[merge]', limit => [limit]) 参数描述表1 参数描述参数描述是否必填 table 需要查询表的表名，支持database.tablename格式是 log_file_path_pattern log file的路径，支持正则匹配

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
SHOW_COMMIT_FILES - 数据湖探索 DLI
SHOW_COMMIT_FILES - 数据湖探索 DLI

instant_time=>'[instant_time]', limit=>[limit]); 参数描述表1 参数描述参数描述是否必填 table 需要查询表的表名，支持database.tablename格式是 instant_time 某次commit对应的时间戳是 limit 限制返回结果的条数

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

provided </scope> </dependency> 或使用exclusions标签将其排除关联。若使用到hdfs的配置文件，则需要将core-site.xml、hdfs-site.xml、yarn-site.xml 修改为mrs-core-site.xml、mrs-hdfs-site

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
创建Kerberos跨源认证 - 数据湖探索 DLI

ros类型的认证。建表时通过krb_auth_name关联跨源认证。 MRS Kafka开启Kerberos认证，同时开启了SSL认证时，需要同时创建Kerberos和Kafka_SSL类型的认证。建表时分别通过krb_auth_name和ssl_auth_name关联跨源认证。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
创建DWS维表 - 数据湖探索 DLI
创建DWS维表 - 数据湖探索 DLI

postgresql.Driver。 connector.username 否数据库认证用户名，需要和'connector.password'一起配置 connector.password 否数据库认证密码，需要和'connector.username'一起配置 connector.read.partition

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
使用Hive语法创建DLI表 - 数据湖探索 DLI

DLI表不支持在建表时指定多字符的分隔符。关于分区表的使用说明：创建分区表时，PARTITONED BY中指定分区列必须是不在表中的列，且需要指定数据类型。分区列支持string, boolean, tinyint, smallint, short, int, bigint, long

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
（推荐）DLI SDK V3 - 数据湖探索 DLI

表，您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。在线生成SDK代码【样例】 API Explorer能根据需要动态生成SDK代码功能，降低您使用SDK的难度，推荐使用。您可以在API Explorer中具体API页面的“代码示例”页签查看对应编程语言类型的SDK代码。

帮助中心 > 数据湖探索 DLI > SDK参考
插入数据至Oracle表 - 数据湖探索 DLI

已创建跨源连接的DLI表名称。 DLI_TEST 为包含待查询数据的表。 field1,field2...，field 表“DLI_TEST”中的列值，需要匹配表“DLI_TABLE”的列值和类型。 where_condition 查询过滤条件。 num 对查询结果进行限制，num参数仅支持INT类型。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接Oracle表
datetrunc - 数据湖探索 DLI
datetrunc - 数据湖探索 DLI

yyyy-mm-dd yyyy-mm-dd hh:mi:ss yyyy-mm-dd hh:mi:ss.ff3 datepart 是 STRING 代表需要返回的时间单位。参数datepart支持扩展的日期格式：年-year、月-month或-mon、日-day和小时-hour。 yyyy代表年份。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
解绑队列 - 数据湖探索 DLI
解绑队列 - 数据湖探索 DLI

连接ID，用于标识跨源连接的UUID。请求消息表2 请求参数参数名称是否必选参数类型说明 queues 否 Array of String 需要使用跨源的队列名列表。 elastic_resource_pools 否 Array of Strings 将这些弹性资源池解绑定增强跨源。

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

', is_sub=>'[is_sub]', sort=>'[sort]'); 参数描述表1 参数描述参数描述是否必填 path 需要查询的FS的路径是 is_sub 默认false，false表示统计指定目录的信息，true表示统计指定目录的子目录的信息否 sort

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
弹性资源池关联队列 - 数据湖探索 DLI

资源池。弹性资源池Flink版本只支持1.10及其以上版本，如果准备分配到弹性资源池的作业使用Flink1.7版本可能会出现兼容性问题，需要提前做好Flink版本适配。约束与限制弹性资源池和队列均是可用状态。队列是按需专属队列。队列和弹性资源池状态正常，资源未被冻结。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池

总条数： 774

上一页
1
...
34
35
36
...
39
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

去重 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

添加Flink作业标签 - 数据湖探索 DLI

CLEANING - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

next - 数据湖探索 DLI

regexp - 数据湖探索 DLI

概述 - 数据湖探索 DLI

SHOW_LOG_FILE - 数据湖探索 DLI

SHOW_COMMIT_FILES - 数据湖探索 DLI

Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

创建Kerberos跨源认证 - 数据湖探索 DLI

创建DWS维表 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

（推荐）DLI SDK V3 - 数据湖探索 DLI

插入数据至Oracle表 - 数据湖探索 DLI

datetrunc - 数据湖探索 DLI

解绑队列 - 数据湖探索 DLI

SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

弹性资源池关联队列 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线