搜索_华为云

Hudi Clustering操作说明 - 数据湖探索 DLI

间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。为能

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Flink作业如何保存作业日志？ - 数据湖探索 DLI

Flink作业如何保存作业日志？在创建Flink SQL作业或者Flink Jar作业时，可以在作业编辑页面，勾选“保存作业日志”参数，将作业运行时的日志信息保存到OBS。勾选“保存作业日志”参数后，需配置“OBS桶”参数，选择OBS桶用于保存用户作业日志信息。如果选择的OB

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
Spark jar 如何读取上传文件 - 数据湖探索 DLI

Spark jar 如何读取上传文件 Spark可以使用SparkFiles读取 –-file中提交上来的文件的本地路径，即：SparkFiles.get("上传的文件名")。 Driver中的文件路径与Executor中获取的路径位置是不一致的，所以不能将Driver中获取到的

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Hudi Archive操作说明 - 数据湖探索 DLI

操作都会产生元数据文件，而元数据文件过多会导致性能问题，所以元数据文件数量最好控制在1000以内。如何执行Archive 写完数据后archive Spark SQL（set设置如下参数，写数据时触发） hoodie.archive.automatic=true hoodie.keep

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务功能描述 DLI提供了一个通用接口，可用于获取用户在启动Spark作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

际所需设置相应安全组规则。若使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DWS维表（不推荐使用） - 数据湖探索 DLI

WS）里创建了DWS集群。如何创建DWS集群，请参考《数据仓库服务管理指南》中“创建集群”章节。请确保已创建DWS数据库表。该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
Flink作业提交错误，如何定位 - 数据湖探索 DLI

Flink作业提交错误，如何定位在Flink作业管理页面，将鼠标悬停到提交失败的作业状态上，查看失败的简要信息。常见的失败原因可能包括： CU资源不足：需扩容队列。生成jar包失败：检查SQL语法及UDF等。如果信息不足以定位或者是调用栈错误，可以进一步单击作业名称，进入

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
SQL作业运行慢如何定位 - 数据湖探索 DLI

SQL作业运行慢如何定位作业运行慢可以通过以下步骤进行排查处理。可能原因1：FullGC原因导致作业运行慢判断当前作业运行慢是否是FullGC导致：登录DLI控制台，单击“作业管理 > SQL作业”。在SQL作业页面，在对应作业的“操作”列，单击“更多 > 归档日志”。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
count函数如何进行聚合 - 数据湖探索 DLI

count函数如何进行聚合使用count函数进行聚合的正确用法如下： SELECT http_method, count(http_method) FROM apigateway WHERE service_id = 'ecs' Group BY http_method

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

如何给子用户授权查看Flink作业？子用户使用DLI时，可以查看队列，但是不能查看Flink作业，可以通过在DLI中对子用户授权，或在IAM中对子用户授权： DLI授权管理使用租户账号，或者作业owner账号，或有DLI Service Administrator权限的账号，登录DLI控制台。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

全组的不同实例默认网络互通；如果同虚拟私有云但是子网或安全组不同，还需配置路由规则及安全组规则。配置路由规则请参见如何配置路由规则章节，配置安全组规则请参见如何配置安全组规则章节。 iii. 此外，您还必须确保该云服务的实例与CDM集群所属的企业项目必须相同，如果不同，需要修改工作空间的企业项目。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Flink作业运行异常，如何定位 - 数据湖探索 DLI

Flink作业运行异常，如何定位在“Flink作业”管理页面，对应作业“操作”列单击“编辑”按钮，在作业运行界面确认作业是否勾选“保存作业日志”参数。图1 保存作业日志是，则执行3。否，则运行日志不会转储OBS桶，需要先执行2保存作业运行日志。在作业运行界面勾选“保存作

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
DLI如何访问OBS桶中的数据 - 数据湖探索 DLI

DLI如何访问OBS桶中的数据创建OBS表。具体语法请参考《数据湖探索SQL语法参考》。添加分区。具体语法请参考《数据湖探索SQL语法参考》。往分区导入OBS桶中的数据。具体语法请参考《数据湖探索SQL语法参考》。查询数据。具体语法请参考《数据湖探索SQL语法参考》。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Hudi Compaction操作说明 - 数据湖探索 DLI

rge-On-Read表可减少数据摄入延迟，因而进行不阻塞摄入的异步Compaction很有意义。如何执行Compaction 仅执行Schedule Spark SQL（设置如下参数，写数据时触发） hoodie.compact.inline=true hoodie.schedule

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
API接口返回的中文字符为乱码，如何解决？ - 数据湖探索 DLI

API接口返回的中文字符为乱码，如何解决？当API接口返回的中文字符出现乱码时，通常是因为字符编码格式不匹配。 DLI接口返回的结果编码格式为“UTF-8”，在调用接口获取返回结果时需要对返回的信息编码转换为“UTF-8”。例如，参考如下实现对返回的response.cont

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务功能描述 DLI提供了一个通用接口，可用于获取用户在启动Flink作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
队列属性设置 - 数据湖探索 DLI

队列属性设置操作场景 DLI支持在队列创建完成后设置队列的属性。当前支持设置队列的Spark driver的相关参数：通过设置队列的Spark driver，以提升队列资源的调度效率。本节操作介绍在管理控制台设置队列属性的操作步骤。约束与限制仅Spark引擎的SQL队列支持配置队列属性。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

Flink Opensource SQL如何解析复杂嵌套 JSON？ kafka message { "id": 1234567890, "name": "swq", "date": "1997-04-25", "obj": { "time1": "12:12:12"

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
创建DLI表关联RDS - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表

总条数： 472

上一页
1
2
3
4
5
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Clustering操作说明 - 数据湖探索 DLI

Flink作业如何保存作业日志？ - 数据湖探索 DLI

Spark jar 如何读取上传文件 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

Flink作业提交错误，如何定位 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

count函数如何进行聚合 - 数据湖探索 DLI

如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

Flink作业运行异常，如何定位 - 数据湖探索 DLI

DLI如何访问OBS桶中的数据 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

API接口返回的中文字符为乱码，如何解决？ - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

队列属性设置 - 数据湖探索 DLI

Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

创建DLI表关联RDS - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线