MAPREDUCE服务 MRS-Flink SQL逻辑开发建议:慎用正则表达式函数REGEXP

时间:2024-09-06 10:03:29

慎用正则表达式函数REGEXP

正则表达式是非常耗时的操作,对比加减乘除通常有百倍的性能开销,而且正则表达式在某些极端情况下可能会进入无限循环,导致作业阻塞。推荐首先使用LIKE。正则函数包括:

  • REGEXP
  • REGEXP_EXTRACT
  • REGEXP_REPLACE

【示例】

  • 使用正则表达式:
    SELECT
     *
    FROM
     table
    WHERE username NOT REGEXP "test|ceshi|tester'
  • 使用like模糊查询:
    SELECT
     *
    FROM
     table
    WHERE username NOT LIKE '%test%'
     AND username NOT LIKE '%ceshi%'
     AND username NOT LIKE '%tester%'
support.huaweicloud.com/devg-rule-mrs/mrs_07_450170.html