MAPREDUCE服务 MRS-URL函数:提取函数

时间:2024-11-28 20:08:14

提取函数

描述:提取函数用于从HTTP URL(或任何符合RFC 2396标准的URL)中提取内容。

[protocol:][//host[:port]][path][?query][#fragment]

提取的内容不会包含URI的语法分隔符,比如“:”或“?”。

  • url_extract_fragment(url) → varchar

    描述:返回url的片段标识符,即#后面的字符串。

    select url_extract_fragment('http://www.example.com:80/stu/index.html?name=xxx&age=25#teacher');--teacher
  • url_extract_host(url)→ varchar

    描述:返回url中的主机 域名

     select url_extract_host('http://www.example.com:80/stu/index.html?name=xxx&age=25#teacher');-- www.example.com
  • url_extract_parameter(url, name)→ varchar

    描述:返回url中参数名为name的参数。

    select url_extract_parameter('http://www.example.com:80/stu/index.html?name=xxx&age=25#teacher','age');-- 25
  • url_extract_path(url)→ varchar

    描述:提取url中的路径。

     select url_extract_path('http://www.example.com:80/stu/index.html?name=xxx&age=25#teacher');-- /stu/index.html
  • url_extract_port(url)→ bigint

    描述:提取url中的端口。

    select url_extract_port('http://www.example.com:80/stu/index.html?name=xxx&age=25#teacher');-- 80
  • url_extract_protocol(url)→ varchar

    描述:提取url中的协议。

    select url_extract_protocol('http://www.example.com:80/stu/index.html?name=xxx&age=25#teacher'); --  http
  • url_extract_query(url)→ varchar

    描述:提取url中的查询字符串。

    select url_extract_query('http://www.example.com:80/stu/index.html?name=xxx&age=25#teacher'); -- name=xxx&age=25 
support.huaweicloud.com/cmpntguide-lts-mrs/mrs_01_300209.html