• 微信号
  • 微信号
您当前的位置:首页 > 学海无涯 > 茑语花香>正则表达式基本语法

正则表达式基本语法

孤峰 孤峰家 2023-06-11 151人阅读

正则表达式(regular expression)是一种字符串匹配模式或者规则,它可以用来检索、替换那些符合特定规则的文本。正则表达式几乎适用于所有编程语言,无论是前端语言 JavaScript,还是诸如许多后端语言,比如 Python、Java、C# 等,这些语言都提供了相应的函数、模块来支持正则表达式,比如 Python 的 re 模块就提供了正则表达式的常用方法。

在使用 Python 编写爬虫的过程中,re 模块通常做为一种解析方法来使用。通过审查网页元素来获取网页的大体结构,然后使用解析模块来提取你想要的网页信息,最终实现数据的抓取。本节对正则表达式基本语法做简单讲解。

注意:学习本节知识之前,您应该已经掌握了正则表达式的使用方法。

正则表达式元字符

下表列出了常用的正则表达式元字符:

2) 量词

[]表示,如下所示:

贪婪模式非贪婪模式

正则表达式默认为贪婪匹配,也就是尽可能多的向后匹配字符,比如 {n,m} 表示匹配前面的内容出现 n 到 m 次(n 小于 m),在贪婪模式下,首先以匹配 m 次为目标,而在非贪婪模式是尽可能少的向后匹配内容,也就是说匹配 n 次即可。

贪婪模式转换为非贪婪模式的方法很简单,在元字符后添加“?”即可实现,如下所示:

* + ? ^ $ [] () {} | \

转载:感谢您阅览,转载请注明文章出处“来源从小爱孤峰知识网:一个分享知识和生活随笔记录的知识小站”。

链接:正则表达式基本语法http://www.gufeng7.com/niaolang/323.html

联系:如果侵犯了你的权益请来信告知我们删除。邮箱:119882116@qq.com

标签: