搜索_华为云

Hudi数据表Clean规范 - 数据湖探索 DLI

具体可以按照下面的计算公式来保留2个小时的历史版本数据：版本数设置为3600*2/版本interval时间，版本interval时间来自于flink作业的checkpoint周期，或者上游批量写入的周期。 COW表如果业务没有历史版本数据保留的特殊要求，保留版本数设置为1。 COW表的每个版本都是表的全量数据

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
查询经典型跨源连接列表 - 数据湖探索 DLI

String 连接ID，用于标识跨源连接的UUID。 destination 否 String 创建连接时，用户填写的队列的访问地址。 state 否 String 连接状态，具体状态请参见表4。 process 否 Double 正在创建的跨源连接进度，显示0.0至1.0代表0%至100%。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 经典型跨源连接相关API（废弃）
创建Hbase维表 - 数据湖探索 DLI
创建Hbase维表 - 数据湖探索 DLI

若使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。语法格式 create table hbaseSource ( attr_name attr_type (',' attr_name

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
创建DLI表关联DCS - 数据湖探索 DLI

非必填。用于指定schema中的某个字段作为Redis中key的标识。在插入数据时与参数“table”配合使用。 partitions.number 读取数据时，并发task数。 scan.count 每批次读取的数据记录数，默认为100。如果在读取过程中，redis集群中的CPU使用率还有提升空间，可以调大该参数。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
分配弹性资源池至项目 - 数据湖探索 DLI

修改弹性资源池的企业项目，会同时修改弹性资源池下的队列资源的企业项目。即弹性资源池下仅支持添加同一企业项目的队列资源。前提条件在绑定企业项目前，您已在“企业项目管理控制台”创建创建企业项目。绑定企业项目在创建弹性资源池资源时，可以在“企业项目”绑定已创建的企业项目。您

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（例如Spark初始化完成后，Flink消费Kafka时过滤掉2小时之前的数据），如果无法对kafka消息进行过滤，则可以考虑先实时

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
下载并安装JDBC驱动包 - 数据湖探索 DLI

L作业。获取服务端连接地址连接DLI服务的地址格式为：jdbc:dli://<endPoint>/<projectId>。因此您需要获取对应的Endpoint和项目编号。在地区和终端节点获取DLI对应的Endpoint；在华为云页面上方菜单栏，单击用户名，然后在“我的凭证”页面获取项目编号。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
查询作业状态 - 数据湖探索 DLI

Insert作业执行过程中扫描到的错误记录数。 input_size Long 作业执行过程中扫描文件的大小，单位字节。 result_count Integer 当前作业返回的结果总条数或insert作业插入的总条数。 database_name String 记录其操作的表所在的数据库名称。类

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
查询作业详细信息 - 数据湖探索 DLI

String 提交作业的用户。 start_time 是 Long 作业开始的时间。是单位为“毫秒”的时间戳。 duration 是 Long 作业执行的时间间隔，单位毫秒。 export_mode 否 String 导出数据或保存查询结果时，指定的导出模式。范围为“Error

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

分组函数在流处理表中的 SQL 查询中，分组窗口函数的 time_attr 参数必须引用一个合法的时间属性，且该属性需要指定行的处理时间或事件时间。对于批处理的 SQL 查询，分组窗口函数的 time_attr 参数必须是一个 TIMESTAMP 类型的属性。表1 分组函数表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
创建DLI程序包 - 数据湖探索 DLI

选择“创建新分组”：可输入自定义的组名称。选择“不分组”：不需要选择或输入组名称。说明：如果选择分组，则对应的权限管理为对应程序包组的权限管理。如果选择不分组，则对应的权限管理为对应程序包的权限管理。程序包组和程序包权限管理请参考程序包权限管理。标签使用标签标识云资源。包括标签键和

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

该非主键字段需要为map类型，同时该字段map的value需要为double类型，表示score，该字段的map的key表示redis的set中的值。当data-type为sorted-set，且schema-syntax为array-scores时，除主键字段外，只能有两个非主键字段，且这两个字段的类型需要为array。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

该字段的map的value需要为double类型，表示score，该字段的map的key表示redis的set中的值。当data-type为sorted-set，且schema-syntax为array-scores时，除主键字段外，只能有两个非主键字段，且这两个字段的类型需要为array。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

projectId 是 - 用户访问的DLI服务使用的项目编号。 region 是 - 对接的DLI服务的Region。根据Spark应用程序的需要，修改“spark-defaults.conf”中的配置项，配置项兼容开源Spark配置项，参考开源Spark的配置项说明。使用Spark-submit提交Spark作业

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

String 在序列化地图数据的空键时指定处理模式。当前支持的值为“FAIL”、“DROP”和“LITERAL”：选项“FAIL”将在遇到带有空键的地图时抛出异常。选项“DROP”将删除地图数据的空键条目。选项“LITERAL”将替换空带字符串文字的键。字符串文字由 maxwell-json

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
数据湖探索简介 - 数据湖探索 DLI

时，队列2不能使用队列1中的资源，只能单独对队列1进行扩容。添加到同一个弹性资源池的多个队列，CU资源可以共享，达到资源的合理利用。配置跨源时，必须为每个队列分配不重合的网段，占用大量VPC网段。多队列通过弹性资源池统一进行网段划分，减少跨源配置的复杂度。资源调配多个队

 帮助中心 > 数据湖探索 DLI > 产品介绍
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

置导入数据的类型，例如将data_type设置为csv。csv数据的具体格式通可过options参数设置，例如：csv的分隔符，转义符等。当OBS桶目录下有文件夹和文件同名时，加载数据会优先指向该路径下的文件而非文件夹。建议创建OBS对象时，在同一级中不要出现同名的文件和文件夹。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
DLI计算引擎版本生命周期 - 数据湖探索 DLI

EOM：End of Marketing，停止该版本的销售。所有新购资源不再支持选择EOM的版本的引擎。 EOS：End of Service & support，停止该版本的服务，建议您在执行作业时选择最新版本的引擎。在该日期之后，不再提供该软件版本的任何技术服务支持。父主题：版本支持公告

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

在提交导入作业前，可选择设置导入数据的格式，如样例所示，调用ImportJob对象的setStorageType接口设置数据存储类型为csv，数据的具体格式通过调用ImportJob对象的setCsvFormatInfo接口进行设置。在提交导入作业前，可选择设置导入数据的分区并配置是否是ove

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
查询SQL作业日志 - 数据湖探索 DLI

DLI作业要由用户主账户统一设置及修改，子用户无权限。不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件配置前，请先购买OBS桶或并行文件系统

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业

总条数： 378

上一页
1
...
12
13
14
...
19
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi数据表Clean规范 - 数据湖探索 DLI

查询经典型跨源连接列表 - 数据湖探索 DLI

创建Hbase维表 - 数据湖探索 DLI

创建DLI表关联DCS - 数据湖探索 DLI

分配弹性资源池至项目 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

查询作业状态 - 数据湖探索 DLI

查询作业详细信息 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

创建DLI程序包 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

DLI计算引擎版本生命周期 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线