MongoDB正则表达式

 
在编程语言中,正则表达式可以使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。MongoDB 可以使用 $regex 操作符来设置匹配字符串的正则表达式,MongoDB 使用 PCRE(Perl 兼容的正则表达式)作为正则表达式语言。

与文本搜索不同,您不需要执行任何配置或命令就可以直接使用正则表达式。假设我们已经在名为 posts 的集合中插入了一个文档,如下所示:
> db.posts.insert(
... {
...    "post_text": "enjoy the mongodb articles on bianchengbang",
...    "tags": ["mongodb", "bianchengbang"]
... }
... )

使用正则表达式

下面的 regex 查询将搜索 post_text 字段中包含字符串“bianchengbang”的所有文档:
> db.posts.find({post_text:{$regex:"bianchengbang"}}).pretty()
{
        "_id" : ObjectId("6041dfc3835e4aa734b591df"),
        "post_text" : "enjoy the mongodb articles on bianchengbang",
        "tags" : [
                "mongodb",
                "bianchengbang"
        ]
}
上面的查询也可以写成如下所示的样子:
> db.posts.find({post_text:/bianchengbang/}).pretty()
{
        "_id" : ObjectId("6041dfc3835e4aa734b591df"),
        "post_text" : "enjoy the mongodb articles on bianchengbang",
        "tags" : [
                "mongodb",
                "bianchengbang"
        ]
}

在不区分大小写的情况下使用正则表达式

若要在查询时不区分大小写,我们可以将 $options 参数的值设置为 $i,下面的命令可以查询 post_text 字段中包含“bianchengbang”的文档,且不区分大小写。
> db.posts.find({post_text:{$regex:"BianChengBang",$options:"$i"}}).pretty()
{
        "_id" : ObjectId("6041dfc3835e4aa734b591df"),
        "post_text" : "enjoy the mongodb articles on bianchengbang",
        "tags" : [
                "mongodb",
                "bianchengbang"
        ]
}

对数组元素使用正则表达式

我们还可以在数组字段上使用正则表达式来查找内容,这在实现标签时非常有用。假如要搜索所有以 b 开头的字段(例如 bian、biancheng、bianchengbang 等),可以使用如下所示的代码:
> db.posts.find({tags:{$regex:"b"}}).pretty()
{
        "_id" : ObjectId("6041dfc3835e4aa734b591df"),
        "post_text" : "enjoy the mongodb articles on bianchengbang",
        "tags" : [
                "mongodb",
                "bianchengbang"
        ]
}

优化正则表达式查询

如果文档字段已建立索引,那么查询将使用索引值来匹配正则表达式,与使用正则表达式扫描整个集合相比,使用索引来查询数据的速度会更快。

如果正则表达式是前缀表达式,则所有匹配项均应以某个字符串字符开头。例如,如果正则表达式为 ^tut,则查询仅需要搜索以 tut 开头的那些字符串。