搜索_华为云

分配弹性资源池至项目 - 数据湖探索 DLI

即弹性资源池下仅支持添加同一企业项目的队列资源。前提条件在绑定企业项目前，您已在“企业项目管理控制台”创建创建企业项目。绑定企业项目在创建弹性资源池资源时，可以在“企业项目”绑定已创建的企业项目。您还可以单击“新建企业项目”，前往企业项目管理控制台，新建企业项目和查看已有的企业项目。更多创建队列的操作步骤请参考创建弹性资源池并添加队列。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。若使用MRS HBase，请

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。如果使用MRS HBase，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
资产识别与管理 - 数据湖探索 DLI

通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签，各服务的计费详单会体现这些资源实例设置的标签。如果您的业务系统是由多个不同的应用构成，为同一种应用拥有的资源实例设置统一的标签将很容易帮助您对不同的应用进行使用量分析和成本核算。对DLI来说，

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
如何获取项目ID？ - 数据湖探索 DLI

项目ID是系统所在区域的ID。用户在调用API接口进行云资源管理（如创建集群）时，需要提供项目ID。查看项目ID步骤如下：注册并登录华为云管理控制台。将鼠标移动到右上角用户名上，在下拉列表中单击“我的凭证”。在“我的凭证”页面的项目列表中查看项目ID。例如project_id:"5

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
创建SQL作业模板 - 数据湖探索 DLI

需要保存为模板的SQL语句。描述该模板的相应描述。分组设置已有分组创建新分组不分组分组名称 “分组设置”选择“已有分组”或者“创建新分组”时，需要填写分组名称。单击“确定”，完成模板创建。在“SQL编辑器”页面创建模板。在管理控制台左侧，单击“SQL编辑器”。单击SQL作业

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

上传Jar包到OBS OBS控制台将生成的UDAF函数Jar包文件上传到OBS目录下。 5 创建DLI程序包 DLI控制台选择刚上传到OBS的UDAF函数的Jar文件，由DLI进行纳管。 6 创建DLI的UDAF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDAF函数。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

SQL读取Hudi表数据。更多具体使用可参考开源社区文档：Hudi。注意事项建议Hudi作为Source表时设置限流 Hudi表作为Source表时，为防止数据上限超过流量峰值导致作业出现异常，建议设置限流（read.rate.limit），限流上限应该为业务上线压测的峰值。及时对Hudi表进行Compaction，防止Hudi

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
DWS结果表（不推荐使用） - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
怎样排查DLI计费异常？ - 数据湖探索 DLI

有异常，可按照以下步骤进行排查：包周期资源与预付费资源，本节操作重点介绍怎样排查按需资源使用中的扣费异常。 SQL作业登录DLI管理控制台。进入“作业管理”>“SQL作业”页面。查看需要确认的作业详情，确认在扣费时间段内是否有以下操作：是否使用自建的队列。是否执行SQL作业。

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
删除增强型跨源连接的路由信息 - 数据湖探索 DLI

当自定义路由表被关联至子网时，则无法删除。请先通过更换子网关联的路由表将子网关联到其他的路由表，然后尝试删除。操作步骤登录DLI管理控制台。在左侧导航栏中，选择“跨源管理 > 增强型跨源 ”。选择待添加路由的增强型跨源连接，并删除路由。方法一：选择待删除的增强型跨源连接，单击操作列的“路由信息”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
创建并提交SQL作业 - 数据湖探索 DLI

fault”默认数据库。数据库创建操作详见在DLI控制台创建数据库和表。说明：如果SQL语句中指定了表所在的数据库，则此处选择的数据库无效。设置包括设置“参数设置”和“标签”。参数设置：以“key/value”的形式设置提交SQL作业的配置项。详细内容请参见《数据湖探索SQL语法参考》。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
数据保护技术 - 数据湖探索 DLI

该参数用于配置服务器端是否使用加密来与客户端通信。当设置为true时，服务器将要求所有客户端使用加密连接，这可以提高通信的安全性。 true spark.authenticate 该参数用于配置是否对Spark应用程序的组件进行身份验证。启用身份验证可以防止未授权的访问。这个参数可以设置为true来启用身份验证。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
在Spark SQL作业中使用UDF - 数据湖探索 DLI

调试，编译代码并导出Jar包 4 上传Jar包到OBS OBS控制台将生成的UDF函数Jar包文件上传到OBS目录下。 5 创建DLI的UDF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDF函数。 6 验证和使用DLI的UDF函数 DLI控制台在DLI作业中使用创建的UDF函数。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

要去掉该标识。设置spark.sql.autoBroadcastJoinThreshold=-1，具体操作如下：登录DLI管理控制台，单击“作业管理 > SQL作业”，在对应报错作业的“操作”列，单击“编辑”进入到SQL编辑器页面。单击“设置”，在参数设置中选择“spark

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle.partitions参数值来解决缓冲区不足问题。具体该参数设置步骤如下：登录DLI管理控制台，单击“作业管理 > SQL作业”，

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

上传Jar包到OBS和DLI OBS控制台 DLI控制台将生成的Spark Jar包文件上传到OBS目录下和DLI程序包中。 7 创建Spark Jar作业 DLI控制台在DLI控制台创建Spark Jar作业并提交运行作业。 8 查看作业运行结果 DLI控制台查看作业运行状态和作业运行日志。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
pyspark样例代码 - 数据湖探索 DLI

driver = "org.postgresql.Driver" 设置数据 1 dataList = sparkSession.sparkContext.parallelize([(1, "Katie", 19)]) 设置schema 1 2 3 schema = StructType([StructField("id"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS

总条数： 570

上一页
1
...
9
10
11
...
29
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

分配弹性资源池至项目 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

如何获取项目ID？ - 数据湖探索 DLI

创建SQL作业模板 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

DWS结果表（不推荐使用） - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

怎样排查DLI计费异常？ - 数据湖探索 DLI

删除增强型跨源连接的路由信息 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线