今天我们来看正规表达式,在谈到为什么需要多学这个之前,先来看个示例。
假设需要判断输入字串是否含有“apple”:
var text=“A apple a day keeps the doctor away”;
function hasApple(val){
hasStr = val.indexOf(“apple”);
if(hasStr === -1)return false;
return true;
}
hasApple(text);//true
看起来很简单,对吧!但如果今天要判断的不只一个的话呢?
只能不段增加变数和判断式长度吗?这听起来就是个写“糙code”的开始。
(想知道什么是“糙code”可以参考这个系列喔可不可以不要写糙code)
那么该怎么作呢?很简单,JS有提供给我们正规表达式,可以这样写:
var text=“A apple a day keeps the doctor away”;
function hasApple(val){
return /apple/.test(text)
}
hasApple(text);//true
是不是比上面的例子干净许多了呢!
既然这样,话不多说我们赶紧来看到底怎么用吧。
在JS中我们有两种方式可以建立正规表达式:
透过正规表达式实值
建立一个RegExp实例
const pattern = /apple/;
const otherPattern = new RegExp(“test”);
两种方式都能建立出相同的正规表达式,但如果在一开始就知道了正规表达式的内容,会一般会比较推荐用实值的方式建立,建构式方式比较用于程序执行阶段时,动态透过字串建立。
接下来会列出常见的语法以及与之相关的方法,可能会让你认为难以理解,但我会尽我所能的用示例讲解。
首先我们要知道正规表达式都会包含两个/,千万不要跟\搞混,他是有特殊用法的(hzbutik)!
一般字元:
语法说明
/apple/含有apple的字串
/./含有任意字元的字串
/apple./含有apple后面接任意字元的字串
示例:
var text =“A apple a day keeps the doctor away.I have pen,I have apple.Uh!ApplePen!!“;
/apple/.test(text);//true
text.match(/./);//[“A”,index: 0,input:“A apple a day keeps the doctor away.I have pen,I have apple.Uh!ApplePen!!“,groups: undefined]
text.replace(/./,“hi”)
//“hi apple a day keeps the doctor away.I have pen,I have apple.Uh!ApplePen!!“
这边我们可以看到
test是回传字串内“是否”含有正规表达式指定的字元。
match会根据正规表达式回传符合字串的数组。
replace会根据正规表达式取代符合字串。
旗标值
语法说明
/apple/i不区分英文大小写
/apple/g全局匹配,只要符合就会回传
m多行匹配
y进行黏性匹配(sticky matching),只会对最后一次符合处之后进行匹配,需要配合设定lastIndex
u对unicode数值作跳脱
示例:
var text =“A apple a day keeps the doctor away.I have pen,I have apple.Uh!ApplePen!!“;
/apple/.test(text);//true
text.match(/apple/g);//[“apple”,“apple”]
text.match(/apple/ig);//[“apple”,“apple”,“Apple”]
text.replace(/apple/ig,“hi”);//“A hi a day keeps the doctor away.I have pen,I have hi.Uh!hiPen!!“
y这边我特别拉出来说明,因为看了官网文件还是不太懂,搜寻很久才得到解答:
var str =“I have apple”;
//0123456789
var regx = /apple/y;
regx.lastIndex = 7;
regx.test(str);//true
regx.test(str);//false
y会根据你设置的lastIndex位置开始匹配,不匹配则回传否,不会在往下寻找,
且lastIndex重制为0。
通常使用于避免前缀字串影响正规表达式时。
符号
语法说明
^字串开头必须符合条件字元
$字串结尾必须符合条件字元
*字元可以出现0次以上
?字元可以出现1次或0次
+字元至少出现1次
{}指定字元重复出现次数
{1,}指定字元重复出现1次以上
{,3}指定字元重复出现3次以下
/^test/.test(“est test”);//false
/test$/.test(“est test”);//true
/t+est/.test(“est”);//false
/t?est/.test(“est”);//true
/t*est/.test(“ttttest”);//true
/t{,3}est/.test(“ttttest”);//false
比对多个字元
语法说明
[]字串若含有[xxx]里面字元则匹配
[^]字串若不含有[^xxx]里面字元则匹配
[0-9]字串若含有数字0到9字元则匹配
[a-z]字串若含有a到z字元则匹配
/^[a-z]/.test(“est test”);//true
/[0-9]$/.test(“est test”);//false
/^[^a-z]/.test(“est test”);//false
/[0-9]/.test(“1est test”);//true
特殊字元
我们前面有提到过\会有特殊用途,这边就是啰!
语法说明
d任何数字字元,等于[0-9]
D任何非数字字元,等于[^0-9]
w任何数字字元字母底线,等于[A-Za-z0-9_]
W任何非数字字元字母底线,等于[^A-Za-z0-9_]
s
S
//检查公元格式
/^\d{4}-\d{2}-\d{2}$/.test(“1992-12-22”);//true
以上就是常见的正规别达式语法,老实说自己也很少用到这么多,多半是想到时候才去查一下用法(drivingLessonscork)。
这边跟各位分享一个横线区个的字串转为驼峰式的程序:
var text =“has-a-text”;
function upper(match,p1){
return p1.toUpperCase()
}
text = text.replace(/-(\w)/g,upper);//“hasAText”