博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
REGEXP 正则的实现两个字符串组的匹配。(regexp)
阅读量:7080 次
发布时间:2019-06-28

本文共 2832 字,大约阅读时间需要 9 分钟。

主要懂3个mysql的方法:replace【替换】   regexp【正则匹配】    concat【连接】
 
由于某些原因,有时候我们没有按照范式的设计准则而把一些属性放到同一个字符串字段中。比如个人兴趣,有时候我们设计表为
create table members (uid int primary key,uname varchar(20),hobby varchar(100));
表中内容如下
mysql> select * from members;
+-----+-------+---------------------------------+
| uid | uname | hobby                           |
+-----+-------+---------------------------------+
|   1 | AAAA  | 音乐,电影,网络,篮球,阅读,乒乓球 |
|   2 | BBBB  | 音乐,阅读,乒乓球,发呆,围棋,参禅 |
|   3 | CCCC  | 交友,乒乓球                     |
|   4 | DDDD  | 台球,网络,看书,旅游             |
|   5 | EEEE  | 音乐,发呆,下围棋,参禅           |
+-----+-------+---------------------------------+
4 rows in set (0.00 sec)
 
如果我们现在想查找一个与某个用户X (阅读,交友,围棋,足球,滑雪)有着相同爱好的会员记录 如果来操作呢?
在其它数据库中,我们能只通过程序来或者存储过程来分解这个 "阅读,交友,围棋,足球,滑雪" 字符串为单独的爱好项目,然后一个一个进行 like '%xxxx%' 来查询。 但在MySQL中我们可以直接利用这个regexp正规表达式 来构造SQL语句来实现。
 
首先我们把 '阅读,交友,围棋,足球,滑雪' 转换成为正则式 为 '阅读|交友|围棋|足球|滑雪' ,  | 在正则表达式中为 '或' 的意思
mysql> select replace('阅读,交友,围棋,足球,滑雪',',','|');
+---------------------------------------------+
| replace('阅读,交友,围棋,足球,滑雪',',','|') |
+---------------------------------------------+
| 阅读|交友|围棋|足球|滑雪                    |
+---------------------------------------------+
1 row in set (0.00 sec)
 
这样我们可以用SQL语句如下。
mysql> select * from members where hobby regexp replace('阅读,交友,围棋,足球,滑雪',',','|');
+-----+-------+---------------------------------+
| uid | uname | hobby                           |
+-----+-------+---------------------------------+
|   1 | AAAA  | 音乐,电影,网络,篮球,阅读,乒乓球 |
|   2 | BBBB  | 音乐,阅读,乒乓球,发呆,围棋,参禅 |
|   3 | CCCC  | 交友,乒乓球                     |
|   5 | EEEE  | 音乐,发呆,下围棋,参禅           |
+-----+-------+---------------------------------+
3 rows in set (0.00 sec)
 
如上语句我们可以通过一句SQL得到所有hobby包含 '阅读,交友,围棋,足球,滑雪' 任一项的记录。
但上述的语句中还有一点小的缺陷,那就是把 '下围棋' 这一条也选择了出来,如果精确匹配的话这条记录不应该被选中。为了避免这种情况,我们对SQL语句做如下改进。
 
把正则式改为 ',(阅读|交友|围棋|足球|滑雪),'  也就是要求匹配项前后必须有一个界定符","
 
mysql> select concat(',(',replace('阅读,交友,围棋,足球,滑雪',',','|'),'),');
+---------------------------------------------------------------+
| concat(',(',replace('阅读,交友,围棋,足球,滑雪',',','|'),'),') |
+---------------------------------------------------------------+
| ,(阅读|交友|围棋|足球|滑雪),                                  |
+---------------------------------------------------------------+
1 row in set (0.00 sec)
 
mysql> select * from members
    -> where concat(',',hobby,',') regexp
    ->   concat(',(',replace('阅读,交友,围棋,足球,滑雪',',','|'),'),');
+-----+-------+---------------------------------+
| uid | uname | hobby                           |
+-----+-------+---------------------------------+
|   1 | AAAA  | 音乐,电影,网络,篮球,阅读,乒乓球 |
|   2 | BBBB  | 音乐,阅读,乒乓球,发呆,围棋,参禅 |
|   3 | CCCC  | 交友,乒乓球                     |
+-----+-------+---------------------------------+
3 rows in set (0.00 sec)
这样避免了第5条记录被选中。
 
当然也可以利用这种正则式 ',阅读,|,交友,|,围棋,|,足球,|,滑雪,', 但效率显然不如 ',(阅读|交友|围棋|足球|滑雪),' 这种了。
 
参考文档:
 
MySQL 5.1参考手册 - 12.3.1. 字符串比较函数 - REGEXP (RLIKE)
http://dev.mysql.com/doc/refman/5.1/zh/functions.html#string-comparison-functions
 
MySQL 5.1参考手册 - 附录G:MySQL正则表达式
http://dev.mysql.com/doc/refman/5.1/zh/regexp.html

转载于:https://www.cnblogs.com/hfdp/p/6026548.html

你可能感兴趣的文章
D-Bus Tutorial
查看>>
Spring中的事务控制
查看>>
Promise的简单实现
查看>>
我的豆瓣短评爬虫的多线程改写
查看>>
netfilter 结构整理
查看>>
Golang TcpProxy和Nodejs TcpProxy
查看>>
『总结』jQuery常用函数方法
查看>>
Zsh 开发指南(第三篇 字符串处理之转义字符和格式化输出)
查看>>
shell终端常用快捷键和小技巧
查看>>
【教程】Edraw Max(亿图图示):怎么插入图片到思维导图中?
查看>>
【EASYDOM系列教程】之替换节点
查看>>
后端开发者从零做一个移动应用(后端篇)
查看>>
svg齿轮小案例
查看>>
【144天】尚学堂高淇Java300集视频精华笔记(99-100)
查看>>
使用iscroll4可能会遇到的问题(转:记录)
查看>>
js 的全局对象、函数等
查看>>
前端周刊第53期:React 社区的撕逼
查看>>
SVG之ViewBox
查看>>
linux下的进程(1)
查看>>
Laravel核心——服务容器的细节特性
查看>>