搜索_华为云

禁止或恢复表的生命周期 - 数据湖探索 DLI

即当使用禁止表或指定分区的生命周期功能时，设置待禁止或恢复生命周期的表的分区信息是无效的。禁止表的生命周期功能后，表的生命周期配置及其分区的enable和disable标记会被保留。禁止表的生命周期功能后，仍然可以修改表及分区表的生命周期配置。示例示例1：禁止表test_lifecycle的生命周期功能。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

Studio 图3 运营商大数据分析地理大数据分析地理大数据分析地理大数据具有大数据的相关特征，数据体量巨大，例如，全球卫星遥感影像数据量达到PB级。数据种类多，有结构化的遥感影像栅格数据、矢量数据，非结构化的空间位置数据、三维建模数据；在大体量的地理大数据中，通过高效的挖掘工具或

 帮助中心 > 数据湖探索 DLI > 产品介绍
Spark表数据维护规范 - 数据湖探索 DLI

Spark表数据维护规范禁止通过Alter命令修改表关键属性信息：type/primaryKey/preCombineField/hoodie.index.type 错误示例，执行如下语句修改表关键属性： alter table dsrTable set tblproperties('type'='xx');

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

写作业未停止情况下，禁止手动执行run schedule命令生成compaction计划。错误示例： run schedule on dsrTable 如果还有别的任务在写这张表，执行该操作会导致数据丢失。执行run compaction命令时，禁止将hoodie.run.compact

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
资产识别与管理 - 数据湖探索 DLI

可以通过标签实现资源的标识与管理。使用场景通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签，各服务的计费详单会体现这些资源实例设置的标签。如果您的业务系统是由多个不同的应用构成，为同一种应用拥有的资源实例设置统一的标签将很容易帮助您对不同的应用进行使用量分析和成本核算。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
Hudi表索引设计规范 - 数据湖探索 DLI

基于简化使用的角度，针对大数据量的表，可以通过采用Bucket索引来避免状态后端的复杂调优。如果Bucket索引+分区表的模式无法平衡Bueckt桶过大的问题，还是可以继续采用Flink状态索引，按照规范去优化对应的配置参数即可。建议基于Flink的流式写入的表，在数据量超

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

里直接继承了该Logging，且编译时使用的是低版本的Spark，那么应用程序在Spark 2.3的环境中运行将会报java.lang.AbstractMethodError。解决措施有如下两种方案：基于Spark 2.3重新编译应用使用sl4j+log4j来实现日志功能，

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

基准测试的度量单位是每小时执行的查询数( QphH@size)，其中“H”表示每小时系统执行复杂查询的平均次数，“size”表示数据库规模的大小，能够反映出系统在处理查询时的能力。TPC-H 是根据真实的生产运行环境来建模的,这使得它可以评估一些其他测试所不能评估的关键性能参数。总而言之，TPC组织颁布的TPC-H

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

具体请参考《数据湖探索用户指南》。 MRS服务Spark组件的是建立在客户的购买MRS服务所分配的虚机上，用户可以根据实际需求调整及优化Spark服务，支持各种接口调用。 MRS的这种模式提供了更高的自由度和定制性，适合有大数据处理经验的用户使用。具体请参考《MapReduce服务开发指南》。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新建集群环境均已默认为Python3环境。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
创建Flink Jar作业 - 数据湖探索 DLI

用户调用的方法，DLI只对这些方法的兼容性做出产品保证。配置计算资源规格参数。图3 配置参数表3 参数说明名称描述 CU数量一个CU为1核4G的资源量。CU数量范围为2~10000个。管理单元设置管理单元的CU数。并行数作业的并行数是指作业中各个算子的并行执行

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
levenshtein - 数据湖探索 DLI
levenshtein - 数据湖探索 DLI

levenshtein函数用于返回两个字符串之间的Levenshtein距离，如levenshtein('kitten','sitting') =3。 Levenshtein距离，是编辑距离的一种。指两个字串之间，由一个转成另一个所需的最少编辑操作次数。命令格式 levenshtein(string

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
SDK的获取与安装 - 数据湖探索 DLI

发环境的项目。具体操作请参考方法二：通过在Eclipse中导入JAR文件安装SDK。获取DLI SDK 在“DLI SDK DOWNLOAD”页面，单击选择所需的SDK链接，即可获取对应的SDK安装包。表1 目录结构名称说明 jars SDK及其依赖的jar包。 maven-install

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
Flink作业性能调优 - 数据湖探索 DLI

出，说明的是该消费组当前待消费的数据总量。如果Flink作业对接的是kafka专享版，则可通过云监控服务(CES)进行查看。具体可选择“云服务监控 > 分布式消息服务 > kafka专享版” ，单击“kafka实例名称 > 消费组” ，选择具体的消费组名称，查看消费组的指标信息。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
与其他云服务的关系 - 数据湖探索 DLI

与云审计服务（CTS）的关系云审计服务（Cloud Trace Service）为DLI提供对应用户的操作审计。云审计服务支持的DLI操作请参考《云审计服务支持的DLI操作列表说明》。与云监控服务（CES）的关系云监控（Cloud Eye）为DLI提供监控数据，监控作业中的多项指标，从而集中高效地呈现状态信息。

帮助中心 > 数据湖探索 DLI > 产品介绍
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

REPLACE，或者替换所有作业中的函数F1为F2。需要重启Spark SQL队列后新创建的自定义函数F2生效需要重启Spark SQL队列，影响当前运行的作业。重启队列后，影响F1原有功能，F1的功能变为和F2一样。场景二在原有程序包类的基础上新增了类，新创建的函数指定为新增的类，包名不变。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

检查该OBS桶是否被设置为了DLI日志桶。在DLI管理控制台的“全局配置 > 作业配置” 页查看对应OBS桶是否被设置为了DLI日志桶，日志桶不能用于DLI的其他业务功能中。确认桶是否应用于其他业务功能。如果是，您可以在DLI管理控制台页面更改作业配置，选择其他未被占用的OBS桶用于DLI日志存储。父主题：

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

返回DOUBLE类型或ARRAY类型的值。列名不存在时，返回报错。 p为NULL或在[0,1]之外时，返回报错。示例代码假设列int_test中的元素为1、2、3、4，类型为INT类型。返回3。 select percentile_approx(int_test,0.7) FROM

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

DWS结果表功能描述 DLI将Flink作业的输出数据输出到数据仓库服务（DWS）中。DWS数据库内核兼容PostgreSQL，PostgreSQL数据库可存储更加复杂类型的数据，支持空间信息服务、多版本并发控制（MVCC）、高并发，适用场景包括位置应用、金融保险、互联网电商等。数据仓库服务（Data

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

参考增强型跨源连接，在DLI上根据DWS和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置DWS和Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性分别根据DWS和Kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功，否则表示未成功。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表

总条数： 341

上一页
1
2
3
4
5
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

禁止或恢复表的生命周期 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

Spark表数据维护规范 - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

levenshtein - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

与其他云服务的关系 - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线