某字段内字符串去重

  • Post author:
  • Post category:其他


与传统的数据去重不同,这是一个字段内的字符串有大量重复内容,需要去重

比如字段内容为:aa,bb,cc,dd,ab,aa,cc,dd

去重后的结果为:aa,bb,cc,dd,ab

回复于 2018-07-25 15:55:26 #5 得分:100

模拟SQL:


  1. SELECT 唯一字段,

  2. LISTAGG(COLUMN_DISTINCT, ‘,’) WITHIN GROUP(ORDER BY COLUMN_DISTINCT) AS 去重字段

  3. FROM (SELECT DISTINCT 唯一字段, COLUMN_DISTINCT

  4. FROM (SELECT 唯一字段,

  5. REGEXP_SUBSTR(去重字段, ‘[^,]+’, 1, lv) COLUMN_DISTINCT

  6. FROM table,

  7. (SELECT LEVEL lv FROM dual CONNECT BY LEVEL < 10) b

  8. WHERE b.lv <= REGEXP_COUNT(去重字段, ‘\,’) + 1

  9. ORDER BY 唯一字段))

  10. GROUP BY 唯一字段;



版权声明:本文为yaiger原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。