学JS的心路历程-正规表达式Regular Expression

今天我们来看正规表达式，在谈到为什么需要多学这个之前，先来看个示例。

假设需要判断输入字串是否含有“apple”：

var text=“A apple a day keeps the doctor away”；

function hasApple（val）{

hasStr = val.indexOf（“apple”）；

if（hasStr === -1）return false；

return true；

}

hasApple（text）；//true

看起来很简单，对吧！但如果今天要判断的不只一个的话呢？

只能不段增加变数和判断式长度吗？这听起来就是个写“糙code”的开始。

（想知道什么是“糙code”可以参考这个系列喔可不可以不要写糙code）

那么该怎么作呢？很简单，JS有提供给我们正规表达式，可以这样写：

var text=“A apple a day keeps the doctor away”；

function hasApple（val）{

return /apple/.test（text）

}

hasApple（text）；//true

是不是比上面的例子干净许多了呢！

既然这样，话不多说我们赶紧来看到底怎么用吧。

在JS中我们有两种方式可以建立正规表达式：

透过正规表达式实值

建立一个RegExp实例

const pattern = /apple/；

const otherPattern = new RegExp（“test”）；

两种方式都能建立出相同的正规表达式，但如果在一开始就知道了正规表达式的内容，会一般会比较推荐用实值的方式建立，建构式方式比较用于程序执行阶段时，动态透过字串建立。

接下来会列出常见的语法以及与之相关的方法，可能会让你认为难以理解，但我会尽我所能的用示例讲解。

首先我们要知道正规表达式都会包含两个/，千万不要跟\搞混，他是有特殊用法的(hzbutik)！

一般字元：

语法说明

/apple/含有apple的字串

/./含有任意字元的字串

/apple./含有apple后面接任意字元的字串

示例：

var text =“A apple a day keeps the doctor away.I have pen，I have apple.Uh！ApplePen！！“；

/apple/.test（text）；//true

text.match（/./）；//[“A”，index: 0，input:“A apple a day keeps the doctor away.I have pen，I have apple.Uh！ApplePen！！“，groups: undefined]

text.replace（/./，“hi”）

//“hi apple a day keeps the doctor away.I have pen，I have apple.Uh！ApplePen！！“

这边我们可以看到

test是回传字串内“是否”含有正规表达式指定的字元。

match会根据正规表达式回传符合字串的数组。

replace会根据正规表达式取代符合字串。

旗标值

语法说明

/apple/i不区分英文大小写

/apple/g全局匹配，只要符合就会回传

m多行匹配

y进行黏性匹配（sticky matching），只会对最后一次符合处之后进行匹配，需要配合设定lastIndex

u对unicode数值作跳脱

示例：

var text =“A apple a day keeps the doctor away.I have pen，I have apple.Uh！ApplePen！！“；

/apple/.test（text）；//true

text.match（/apple/g）；//[“apple”，“apple”]

text.match（/apple/ig）；//[“apple”，“apple”，“Apple”]

text.replace（/apple/ig，“hi”）；//“A hi a day keeps the doctor away.I have pen，I have hi.Uh！hiPen！！“

y这边我特别拉出来说明，因为看了官网文件还是不太懂，搜寻很久才得到解答：

var str =“I have apple”；

//0123456789

var regx = /apple/y；

regx.lastIndex = 7；

regx.test（str）；//true

regx.test（str）；//false

y会根据你设置的lastIndex位置开始匹配，不匹配则回传否，不会在往下寻找，

且lastIndex重制为0。

通常使用于避免前缀字串影响正规表达式时。

符号

语法说明

^字串开头必须符合条件字元

$字串结尾必须符合条件字元

*字元可以出现0次以上

？字元可以出现1次或0次

+字元至少出现1次

{}指定字元重复出现次数

{1，}指定字元重复出现1次以上

{，3}指定字元重复出现3次以下

/^test/.test（“est test”）；//false

/test$/.test（“est test”）；//true

/t+est/.test（“est”）；//false

/t？est/.test（“est”）；//true

/t*est/.test（“ttttest”）；//true

/t{，3}est/.test（“ttttest”）；//false

比对多个字元

语法说明

[]字串若含有[xxx]里面字元则匹配

[^]字串若不含有[^xxx]里面字元则匹配

[0-9]字串若含有数字0到9字元则匹配

[a-z]字串若含有a到z字元则匹配

/^[a-z]/.test（“est test”）；//true

/[0-9]$/.test（“est test”）；//false

/^[^a-z]/.test（“est test”）；//false

/[0-9]/.test（“1est test”）；//true

特殊字元

我们前面有提到过\会有特殊用途，这边就是啰！

语法说明

d任何数字字元，等于[0-9]

D任何非数字字元，等于[^0-9]

w任何数字字元字母底线，等于[A-Za-z0-9_]

W任何非数字字元字母底线，等于[^A-Za-z0-9_]

//检查公元格式

/^\d{4}-\d{2}-\d{2}$/.test（“1992-12-22”）；//true

以上就是常见的正规别达式语法，老实说自己也很少用到这么多，多半是想到时候才去查一下用法(drivingLessonscork)。

这边跟各位分享一个横线区个的字串转为驼峰式的程序：

var text =“has-a-text”；

function upper（match，p1）{

return p1.toUpperCase（）

}

text = text.replace（/-（\w）/g，upper）；//“hasAText”