搜索_华为云

作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

print(job_id) print(status) 在提交导出作业前，可选设置数据格式、压缩类型、导出模式等，导出格式只支持csv格式。当OBS桶目录下有文件夹和文件同名时，加载数据会优先指向该路径下的文件而非文件夹。建议创建OBS对象时，在同一级中不要出现同名的文件和文件夹。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
Hudi表分区设计规范 - 数据湖探索 DLI

月份创建分区；近一天内的数据更新占比大，可以按照天进行分区。采用Bucket索引，写入是通过主键Hash打散的，数据会均匀的写入到分区下每个桶。因为各个分区的数据量是会有波动的，分区下桶的个数设计一般会按照最大分区数据量计算，这样会出现越细粒度的分区，桶的个数会冗余越多。例如：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
使用DataSource语法创建OBS表 - 数据湖探索 DLI

AS：使用CTAS创建表。参数说明表1 参数说明参数是否必选描述 db_name 否 Database名称。由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 是 Database中的待创建的表名。由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。匹配规则为：^(

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
UPDATE - 数据湖探索 DLI
UPDATE - 数据湖探索 DLI

boolExpression] 参数描述表1 UPDATE参数参数描述 database_name Database名称，由字母、数字和下划线（_）组成。 table_name Database中的表名，由字母、数字和下划线（_）组成。 bucket_name obs桶名称。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
ADD COLUMNS - 数据湖探索 DLI
ADD COLUMNS - 数据湖探索 DLI

表名。 col_spec 可由[col_name][col_type][nullable][comment][col_position]五部分组成。 col_name：新增列名，必须指定。给嵌套列添加新的子列需要指定子列的全名称：添加新列col1到STURCT类型嵌套列users

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
数组函数和运算符 - 数据湖探索 DLI

S, inputFunction(S, T, S), outputFunction(S, R)) 返回从数组减少的单个值。将按顺序为数组中的每个元素调用inputFunction。除了获取元素之外，inputFunction还获取当前状态，最初为initialState，然后返回新

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
DELETE - 数据湖探索 DLI
DELETE - 数据湖探索 DLI

from [database_name.]table_name|DELTA.`obs://bucket_name/tbl_path` [ WHERE boolExpression] 参数描述表1 DELETE参数参数描述 database_name Database名称，由字母、数字和下划线（_）组成。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

Jar作业等操作不支持该操作修改了作业对资源的算法逻辑。例如原有的算法的语句是执行加减运算，当前需要恢复的状态将算法的语句修改成为乘除取余的运算，是无法从checkpoint直接恢复的。修改“静态流图” 不支持该操作修改了作业对资源的算法逻辑。修改“单TM所占CU数”参数

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
DIS结果表 - 数据湖探索 DLI
DIS结果表 - 数据湖探索 DLI

属性分隔符，仅当编码格式为csv时，用户可以自定义属性分隔符，默认为“,”英文逗号。 connector.partition-key 否数据输出分组主键，多个主键用逗号分隔。当该参数没有配置的时候则随机派发。注意事项无示例将流disSink的数据输出到DIS中。 1 2 3

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

hive_sync.table", tableName) .option("hoodie.datasource.hive_sync.database", databaseName) .mode(SaveMode.Overwrite) .save(basePath)

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
设置SQL作业优先级 - 数据湖探索 DLI

常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个SQL设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。使用须知对于每个作业都允许设置优先级，其取值为1-10，数值越大表示优先级越高。优先满足高优先级作业的计算

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码开发说明本样例只适用于MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Hudi - 数据湖探索 DLI
Hudi - 数据湖探索 DLI

系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。表1 支持类别类别详情支持Flink表类型源表、结果表支持hudi表类型 MOR表，COW表支持读写类型批量读，批量写，流式读，流式写

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
SHOW VIEWS - 数据湖探索 DLI
SHOW VIEWS - 数据湖探索 DLI

SHOW VIEWS 语法 SHOW VIEWS [IN/FROM database_name] [ LIKE pattern [ESCAPE escapeChar] ] 描述列举指定Schema中所有满足条件的视图。默认使用当前Schema，也可以通过in/from子句来指定Schema。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
userDefined结果表 - 数据湖探索 DLI

sink函数的全限定类名。sink类的具体实现可以参考前提条件说明。 connector.class-parameter 否 sink函数其构造函数的参数，只支持一个String类型的参数。注意事项 connector.class-name需要为全限定类名。示例 create table userDefinedSink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

OBS，为了确保AKSK数据安全，您可以通过数据加密服务（Data Encryption Workshop，DEW）、云凭据管理服务（Cloud Secret Management Service，CSMS），对AKSK统一管理，有效避免程序硬编码或明文配置等问题导致的敏感信息泄露以及权限失控带来的业务风险。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

class-name 是 source函数的全限定类名。 connector.class-parameter 否 source函数其构造函数的参数，只支持一个String类型的参数。注意事项 connector.class-name需要为全限定类名。示例 create table userDefinedSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 <dependency> <groupId>org

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

Spark作业中显示计算资源规格的单位为CPU单位，1CU包含1CPU和4GB内存。上述公式中x1代表CPU单位转换为CU单位。请分别使用内存和CPU核数计算所需的CUs，取两者中的最大值作为Executor 或driver所需的CU数。图2 查看Spark作业所需CUs数父主题： DLI弹性资源池和队列类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

09:00:44’。 UNIX_TIMESTAMP() BIGINT 以秒为单位获取当前的 Unix 时间戳。此函数不是确定性的，这意味着将为每个记录重新计算该值。 UNIX_TIMESTAMP(string1[, string2]) BIGINT 使用表配置中指定的时区将格式为 string2

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数

总条数： 728

上一页
1
...
28
29
30
...
37
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

作业相关 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

UPDATE - 数据湖探索 DLI

ADD COLUMNS - 数据湖探索 DLI

数组函数和运算符 - 数据湖探索 DLI

DELETE - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

DIS结果表 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Hudi - 数据湖探索 DLI

SHOW VIEWS - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线