搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

SparkSession.builder.appName("datasource-hbase").getOrCreate() 通过SQL API访问创建DLI跨源访问HBase的关联表如果对接的HBase集群未开启Kerberos认证，样例代码参考如下。 sparkSession.sql(

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

fromRedisZSet(Array("zsetRDD")).collect().foreach{println} 通过SQL API 访问创建DLI关联跨源访问 Redis的关联表。 sparkSession.sql( "CREATE TEMPORARY VIEW person

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
创建Kerberos跨源认证 - 数据湖探索 DLI

表时通过ssl_auth_name关联跨源认证。 Kerberos类型跨源认证支持连接的数据源 Kerberos类型跨源认证支持连接的数据源如表1所示。表1 Kerberos类型跨源认证支持连接的数据源作业类型表类型数据源约束与限制 Flink OpenSource SQL

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
CSS安全集群配置 - 数据湖探索 DLI

option("es.net.ssl", "true") 如果CSS安全集群开启了HTTPS访问，此处需要设置为“true”，并且需要继续设置后面的安全证书、文件地址等参数。如果CSS安全集群未开启HTTPS访问，此处需要设置为“false”，则不需要设置后面安全证书、文件地址等参数。 .option("es

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
pyspark样例代码 - 数据湖探索 DLI

option("collection",collection)\ .load() jdbcDF.show() 操作结果通过SQL API 访问创建DLI关联跨源访问 Mongo的关联表。 sparkSession.sql( "create table test_dds(id string

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

SQLContext sqlContext = new SQLContext(javaSparkContext); 通过DataFrame API 访问读取json数据为DataFrame JavaRDD<String> javaRDD = javaSparkContext.parallelize(Arrays

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

在报错的Spark作业编辑页面，“依赖python文件”处选择已上传的egg程序包，重新运行Spark作业。 pyspark作业对接MySQL，需要创建跨源链接，打通DLI和RDS之间的网络。通过管理控制台创建跨源连接请参考《数据湖探索用户指南》。通过API创建跨源连接请参考《数据湖探索API参考》。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

故障处理运行Spark作业，作业运行失败，作业日志中提示No respond错误问题现象运行Spark作业，作业运行失败，作业日志中提示No respond错误解决方案重新创建Spark作业，创建作业时需要在“Spark参数（--conf）”中添加配置：“spark.sql

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
设置Spark作业优先级 - 数据湖探索 DLI

设置Spark作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Spark作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
跨源认证概述 - 数据湖探索 DLI

3.1及以上版本、Flink 1.15及以上版本的跨源访问场景推荐使用数据加密服务DEW来存储数据源的认证信息，为您解决数据安全、密钥安全、密钥管理复杂等问题。具体操作请参考使用DEW管理数据源访问凭证。跨源认证用于管理访问指定数据源的认证信息。配置跨源认证后，无需在作业中重复

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

Spark作业编辑页面支持执行Spark作业，为用户提供全托管式的Spark计算服务。在总览页面，单击Spark作业右上角的“创建作业”，或在Spark作业管理页面，单击右上角的“创建作业”，均可进入Spark作业编辑页面。进入Spark作业编辑页面，页面会提示系统将创建DL

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败问题描述使用Spark访问元数据时，DataSource语法创建avro类型的OBS表创建失败。图1 avro类型的OBS创建失败根因分析当前Spark2.3.x不支持创建avro类型的OBS表，Spark2

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
设置Flink作业优先级 - 数据湖探索 DLI

设置Flink作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Flink作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
设置SQL作业优先级 - 数据湖探索 DLI

设置SQL作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个SQL设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
更新管理 - 数据湖探索 DLI
更新管理 - 数据湖探索 DLI

n存在反序列化漏洞（CNVD-2022-40233）等。一旦发现服务模块涉及漏洞影响，会迅速通过官方解决方案升级现网更新漏洞。更新配置 DLI云服务通过版本更新升级更新配置，确保服务的安全性和稳定性。父主题：安全

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

当前线上购物无疑是最火热的购物方式，而电商平台则又可以以多种方式接入，例如通过web方式访问、通过app的方式访问、通过微信小程序的方式访问等等。而电商平台则需要每天统计各平台的实时访问数据量、订单数、访问人数等等指标，从而能在显示大屏上实时展示相关数据，方便及时了解数据变化，有针对性地

 帮助中心 > 数据湖探索 DLI > 最佳实践
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

在“Spark作业”页面，单击对应作业“操作”列中的“编辑”，跳转至“Spark作业编辑”页面，可根据需要修改参数，执行作业。查找作业在“Spark作业”页面，选择“状态”或“队列”。系统将根据设置的过滤条件，在作业列表显示符合对应条件的作业。终止作业在“Spark作业”页面，单击对

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
配置DLI云服务委托权限 - 数据湖探索 DLI

过大的风险，DLI升级了系统委托，做到更细粒度的委托权限控制，将原有的dli_admin_agency升级为dli_management_agency，新的委托包含获取IAM用户信息、跨源操作、消息通知所需的权限。有效避免DLI相关联服务权限不受控制的问题。升级后的DLI委托灵活

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

及云服务具有完全的访问权限，可以重置用户密码、分配用户权限等。由于账号是付费主体，为了确保账号安全，建议您不要直接使用账号进行日常管理工作，而是创建用户并使用他们进行日常管理工作。用户由账号在IAM中创建的用户，是云服务的使用人员，具有身份凭证（密码和访问密钥）。在我的凭证

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
DLI常用跨源分析开发方式 - 数据湖探索 DLI

DLI常用跨源分析开发方式跨源分析当DLI有访问外部数据源的业务需求时，首先需要通过建立增强型跨源连接，打通DLI与数据源之间的网络，再开发不同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和SMN数据源，无需创建跨源连接，可以直接访问。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）

总条数： 564

上一页
1
2
3
4
5
...
29
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

创建Kerberos跨源认证 - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

跨源认证概述 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

更新管理 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线