搜索_华为云

如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况查看Spark作业原始资源配置登录DLI 控制台，单击左侧“作业管理”>“Spark作业”，在作业列表中找到需要查看的Spark作业，单击“作业ID”前的，即可查看对应Spark作业的原始资源配置参数。在创建Spark作业时，

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

Flink作业”，在对应的Flink作业所在行，操作列下单击“编辑”。在“运行参数”下，查看“开启Checkpoint”参数是否开启。图1 开启Checkpoint 确认Flink结果表的表结构和DLI分区表的表结构是否保持一致。如问题描述中car_infos_sink和car_infos表的字段是否一致。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Spark jar 如何读取上传文件 - 数据湖探索 DLI

Spark jar 如何读取上传文件 Spark可以使用SparkFiles读取 –-file中提交上来的文件的本地路径，即：SparkFiles.get("上传的文件名")。 Driver中的文件路径与Executor中获取的路径位置是不一致的，所以不能将Driver中获取到的路径作为参数传给Executor去执行。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

二者生成的表信息写入Print结果表中。参考增强型跨源连接，根据RDS MySQL所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置RDS MySQL的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根RDS的地址测试

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

窗口去重功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

执行Checkpoint对业务性能的影响以及异常恢复的时长），同时勾选“异常自动重启”，并勾选“从Checkpoint恢复”。配置后，作业异常重启，会从最新成功的Checkpoint文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

Administrator权限的账号，登录DLI控制台。在“作业管理”>“Flink作业”页面找到对应的作业。在对应作业的“操作”栏中选择“更多”>“权限管理”。图1 Flink作业权限管理在“授权”页面输入需要授权的用户名，勾选需要的权限。确认后，被授权用户就可以查看该作业，并且执行对应操作。图2 授权 IAM授权管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
Flink作业运行异常，如何定位 - 数据湖探索 DLI

下载最新“jobmanager.log”文件，搜索“RUNNING to FAILED”关键字，通过上下文的错误栈，确认失败原因。如果“jobmanager.log”文件中的信息不足以定位，可以在运行日志中找到对应的“taskmanager.log”日志，搜索“RUNNING to FAILED”关键字，确认失败原因。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

park的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
如何调用API - 数据湖探索 DLI
如何调用API - 数据湖探索 DLI

如何调用API 构造请求认证鉴权返回结果

 帮助中心 > 数据湖探索 DLI > API参考
CREATE FUNCTION语句 - 数据湖探索 DLI

JAVA|SCALA Language tag 用于指定 Flink runtime 如何执行这个函数。目前，只支持 JAVA 和 SCALA，且函数的默认语言为 JAVA。示例创建一个名为STRINGBACK的函数 create function STRINGBACK as 'com.dli

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

该操作修改了作业对资源的算法逻辑。例如原有的算法的语句是执行加减运算，当前需要恢复的状态将算法的语句修改成为乘除取余的运算，是无法从checkpoint直接恢复的。修改“静态流图” 不支持该操作修改了作业对资源的算法逻辑。修改“单TM所占CU数”参数支持对计算资源的修改并没有影响到作业算法或算子的运行逻辑。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
使用Hive语法创建DLI表 - 数据湖探索 DLI

使用Hive语法创建DLI表。DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异，详细请参考语法格式和注意事项说明。注意事项 CTAS建表语句不能指定表的属性。 Hive DLI表不支持在建表时指定多字符的分隔符。关于分区表的使用说明：创建分区表时，PARTITONED

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
在Spark SQL作业中使用UDF - 数据湖探索 DLI

上传Jar包到OBS OBS控制台将生成的UDF函数Jar包文件上传到OBS目录下。 5 创建DLI的UDF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDF函数。 6 验证和使用DLI的UDF函数 DLI控制台在DLI作业中使用创建的UDF函数。操作步骤新建Ma

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在DLI控制台配置数据库权限 - 数据湖探索 DLI

赋权：用户可将数据库的权限赋予其他用户或项目。回收：用户可回收其他用户或项目具备的此数据库的权限，但是不能回收数据库所有者的权限。添加分区：在分区表中添加新的分区。删除分区：删除分区表中已有的分区。设置分区的路径：将分区表中的某个分区路径设置为用户指定的OBS路径。重命名表分区：对分区表中的分区重新命名。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
如何合并小文件 - 数据湖探索 DLI

如何合并小文件使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。推荐使用临时表进行数据中转自读自写在突发异常场景下存在数据丢失的风险执行SQL： INSERT OVERWRITE TABLE tablename select

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
如何获取项目ID？ - 数据湖探索 DLI

如何获取项目ID？项目ID是系统所在区域的ID。用户在调用API接口进行云资源管理（如创建集群）时，需要提供项目ID。查看项目ID步骤如下：注册并登录华为云管理控制台。将鼠标移动到右上角用户名上，在下拉列表中单击“我的凭证”。在“我的凭证”页面的项目列表中查看项目ID。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

SQL场景使用DEW管理和访问凭据的操作指导，将Flink作业的输出数据写入到Mysql或DWS时，在connector中设置账号、密码等属性。 Flink Jar 使用DEW获取访问凭证读写OBS 访问OBS的AKSK为例介绍Flink Jar使用DEW获取访问凭证读写OBS的操作指导。用户获取Flink作业委托临时凭证

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
CREATE FUNCTION语句 - 数据湖探索 DLI

如果您需要了解创建自定义函数的步骤请参考自定义函数。语法说明 IF NOT EXISTS 若该函数已经存在，则不会进行任何操作。 LANGUAGE JAVA|SCALA Language tag 用于指定 Flink runtime 如何执行这个函数。目前，只支持 JAVA 和 SCALA，且函数的默认语言为

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
SQL作业如何指定表的部分字段进行表数据的插入 - 数据湖探索 DLI

和类型与目标表的Schema信息匹配。即确保源表和目标表的数据类型和列字段个数相同，以避免插入失败。如果目标表中的某些字段在SELECT子句中没有被指定，那么这些字段也可能被插入默认值或置为空值（取决于该字段是否允许空值）。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类

总条数： 382

上一页
1
2
3
4
5
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

Spark jar 如何读取上传文件 - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

Flink作业运行异常，如何定位 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何调用API - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

在DLI控制台配置数据库权限 - 数据湖探索 DLI

如何合并小文件 - 数据湖探索 DLI

如何获取项目ID？ - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

SQL作业如何指定表的部分字段进行表数据的插入 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线