正则表达式之最短匹配模式

当我们用正则表达式去匹配一个标签的首尾的时候,比如匹配 <h1>hello world</h1> 中的 h1 的开始和闭合标签

可能很多人会这样写

/<.*h1>/g

但是这样真的可以吗?

因为 * 匹配符是匹配前面一个字符的零到多个,而且它是贪婪匹配的
所以你得到的就会是下面的结果了。

image.png

显然这并不是我们想要的,那么怎么把贪婪匹配换成最小匹配呢,

/<.*?h1>/g

上面的写法就可以了,如下图:

image.png

其实原理应该很简单,因为 ? 也是贪婪匹配,并且只能匹配0到1个,
所以它会匹配到第一个的时候就结束了,从而阻止了 * 的匹配多个的贪婪。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 初衷:看了很多视频、文章,最后却通通忘记了,别人的知识依旧是别人的,自己却什么都没获得。此系列文章旨在加深自己的印...
    DCbryant阅读 4,095评论 0 20
  • 1. 概述 正则表达式(regular expression)是一种表达文本模式(即字符串结构)的方法,有点像字符...
    JRG_Orange阅读 2,619评论 0 50
  • 正则表达式到底是什么东西?字符是计算机软件处理文字时最基本的单位,可能是字母,数字,标点符号,空格,换行符,汉字等...
    狮子挽歌阅读 2,193评论 0 9
  • 大家可能会觉得这个话题很Low,不就是做头脑风暴嘛有什么难的,有必要还要写一篇教程吗! 前段时间我进了个新项目,做...
    老夫的天阅读 1,355评论 1 3
  • “只要让你的女儿心甘情愿来我的古堡与我为伴,我就可以免你不死!” 坐在阴暗中的野兽俯视着跪在前方瑟瑟发抖的老头,淡...
    没落莫洛阅读 637评论 2 4