搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

option("driver", driver) \ .load() jdbcDF.show() 操作结果通过SQL API 访问创建DLI跨源访问rds的关联表，填写连接参数。 1 2 3 4 5 6 7 sparkSession.sql( "CREATE TABLE

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

appName("datasource-HBase-MRS").getOrCreate(); 通过SQL API 访问未开启Kerberos认证创建DLI跨源访问MRS HBase的关联表，填写连接参数。 1 sparkSession.sql("CREATE TABLE testhbase(id

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

需要连接的redis集群的IP。获取方式为：登录华为云官网，之后搜索redis，进入“分布式缓存服务”,接着选择“缓存管理”，根据主机名称需要的IP，可选择其中任意一个IP进行复制即可（其中也包含了port信息），请参考图1。 port 访问端口。 password 连接密码。无密码时可以不填写该参数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

获取ZK连接地址需要先创建跨源连接。具体操作请参考《数据湖探索用户指南》。访问CloudTable集群，填写ZK连接地址（内网）。访问MRS集群，填写ZK所在节点IP与ZK对外端口，格式为："ZK_IP1:ZK_PORT1,ZK_IP2:ZK_PORT2"。说明：访问MRS集群，只支持创建增强型跨源连接并且

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
pyspark样例代码 - 数据湖探索 DLI

option("collection",collection)\ .load() jdbcDF.show() 操作结果通过SQL API 访问创建DLI关联跨源访问 Mongo的关联表。 sparkSession.sql( "create table test_dds(id string

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
pyspark样例代码 - 数据湖探索 DLI

SparkSession.builder.appName("datasource-hbase").getOrCreate() 通过SQL API访问创建DLI跨源访问HBase的关联表如果对接的HBase集群未开启Kerberos认证，样例代码参考如下。 sparkSession.sql(

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

SQLContext sqlContext = new SQLContext(javaSparkContext); 通过DataFrame API 访问读取json数据为DataFrame 1 2 3 4 JavaRDD<String> javaRDD = javaSparkContext

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

新运行该作业即可。后续指引如果您想通过Spark Jar作业访问其他数据源，请参考《使用Spark作业跨源访问数据源》。如果您想通过Spark Jar作业在DLI创建数据库和表，请参考《使用Spark作业访问DLI元数据》。完整样例代码参考认证用的access.key和secret

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
创建Flink Jar作业 - 数据湖探索 DLI

Jar作业场景需要用户自行编写并构建应用Jar包，适用于对流计算处理复杂度要求较高的用户场景，且用户可以熟练掌握Flink二次开发能力。本节操作介绍在DLI管理控制台创建Flink Jar作业的操作步骤。前提条件创建Flink Jar作业，访问其他外部数据源时，如访问OpenTSDB、HBase、Ka

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_count regexp_count函数用于计算source中从start_position位置开始，匹配指定pattern的子串数。命令格式 regexp_count(string <source>, string <pattern>[, bigint <start_position>])

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 内置函数 > 字符串函数
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_count regexp_count函数用于计算source中从start_position位置开始，匹配指定pattern的子串数。命令格式 regexp_count(string <source>, string <pattern>[, bigint <start_position>])

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

SQLContext sqlContext = new SQLContext(javaSparkContext); 通过DataFrame API 访问读取json数据为DataFrame JavaRDD<String> javaRDD = javaSparkContext.parallelize(Arrays

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
产品规格 - 数据湖探索 DLI
产品规格 - 数据湖探索 DLI

弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存）。弹性资源池的单位为CU，1CU包含1CPU和4GB内存。您可以在弹性资源池中创建多个队列，队列之间的计算资源支持共享。通过合理设置队列的计算资源池分配策略，提高计算资源利用率。 DLI提供以下规格的计算资源，如表1所示。表1

帮助中心 > 数据湖探索 DLI > 产品介绍
CSS安全集群配置 - 数据湖探索 DLI

option("es.net.ssl", "true") 如果CSS安全集群开启了HTTPS访问，此处需要设置为“true”，并且需要继续设置后面的安全证书、文件地址等参数。如果CSS安全集群未开启HTTPS访问，此处需要设置为“false”，则不需要设置后面安全证书、文件地址等参数。 .option("es

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_substr regexp_substr函数用于计算从start_position位置开始，source中第occurrence次匹配指定pattern的子串。命令格式 regexp_substr(string <source>, string <pattern>[

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_substr regexp_substr函数用于计算从start_position位置开始，source中第occurrence次匹配指定pattern的子串。命令格式 regexp_substr(string <source>, string <pattern>[

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 内置函数 > 字符串函数
迁移Hive数据至DLI - 数据湖探索 DLI

考创建CDM集群。如果目标数据源为云下的数据库，则需要通过公网或者专线打通网络。通过公网互通时，需确保CDM集群已绑定EIP、CDM云上安全组出方向放通云下数据源所在的主机、数据源所在的主机可以访问公网且防火墙规则已开放连接端口。数据源为云上的MRS、DWS等服务时，网络互通需满足如下条件：

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据迁移
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_instr regexp_instr函数用于计算字符串source从start_position开始，与pattern第occurrence次匹配的子串的起始或结束位置。命令格式 regexp_instr(string <source>, string <pattern>[

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 内置函数 > 字符串函数
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_instr regexp_instr函数用于计算字符串source从start_position开始，与pattern第occurrence次匹配的子串的起始或结束位置。命令格式 regexp_instr(string <source>, string <pattern>[

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

步骤1：创建VPC 登录虚拟私有云控制台，创建虚拟私有云。创建的VPC供NAT访问公网使用。创建VPC的具体操作请参考创建虚拟私有云。图2 创建VPC 步骤2：创建弹性资源池和队列登录DLI管理控制台。在左侧导航栏单击“资源管理 > 弹性资源池”，可进入弹性资源池管理页面。在弹性

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据

总条数： 568

上一页
1
2
3
4
5
...
29
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

regexp - 数据湖探索 DLI

regexp - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

产品规格 - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

regexp - 数据湖探索 DLI

regexp - 数据湖探索 DLI

迁移Hive数据至DLI - 数据湖探索 DLI

regexp - 数据湖探索 DLI

regexp - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线