资讯专栏INFORMATION COLUMN

大话javascript 8期:正则表达式

LeviDing / 1894人阅读

摘要:许多程序设计语言都支持利用正则表达式进行字符串操作。为字符串定义规则,为输入内容定义规则正则表达式用于字符串处理表单验证等场合,实用高效。匹配检查字符串是否符合正则表达式中的规则,有一次不匹配,则返回。

一、正则表达式的定义
正则表达式(Regular Expression,在代码中常简写为regex、regexp或RE)是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。
在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。(为字符串定义规则,为输入内容定义规则!)

正则表达式用于字符串处理、表单验证等场合,实用高效。

二、正则表达式声明 1.通过构造函数定义
var 变量名= new RegExp(/表达式/);  
2.通过直接量定义 (较为常用)
var 变量名= /表达式/;
console.log(regexp1.test(345));
console.log(/d/.test(567));(直接使用)
3.test() 方法

正则对象方法,检测测试字符串是否符合该规则,返回true和false,参数(测试字符串)

使用语法:Boolean = 表达式.test("要验证的内容");  
console.log(/d/.test(567));
 验证  567 符不符合 d 的规范
三、正则五大内部类(帮我们写好的工具直接使用) 1.预定义类
 [^

]    除了换行和回车之外的任意字符(“”不行)
 d    [0-9]        数字字符
 D    [^0-9]       非数字字符

 s    [ 	
x0Bf
]     空白字符 
 S    [^ 	
x0Bf
]     非空白字符

 w    [a-zA-Z_0-9]         单词字符
 W    [^a-zA-Z_0-9]        非单词字符  

2.简单类(正则://中什么特殊符号都不写,和[]的加入) 1)/string/.test(“string”); 必须是完整的,只多不能少
/andy/.test(“andy”)                     // true
/andy/.test(“andylv”)                  // true
/andy/.test(“an”)                      // false
一句话,只要完整包含了andy 就可以了(有他就行)
2)/[string]/.test(“string”); 只要包含里面的任何一个就可以
   /[andy]/.test("andy");                  // true
   /[andy]/.test("an");                    // true
   /[andy]/.test("ady");                   // true
   /[andy]/.test("anll");                   // true
   /[andy]/.test("assd");               // true
   /[andy]/.test("ss");                   // false
   /[3aH8]/.test("ss");                   // false
3.负向类(不能是其中的整体或者一部分)

中括号内,前面加个元字符^进行取反,不是括号里面的字符(一部分也不行)。
(可以不够,但是不能多)(不够和正好,返回false;多了或者没有返回true)

 console.log(/[^abc]/.test("iiii"));//true
 console.log(/[^abc]/.test("aiiii"));//只有一部分睁一只眼闭一只眼true
 console.log(/[^abc]/.test("abc"));//刚好为false
 console.log(/[^abc]/.test("b"));//不够为false
 console.log(/[^abc]/.test("bcdef"));//只有一部分睁一只眼闭一只眼true
 console.log(/[^abc]/.test("abcdef"));//只有一部分睁一只眼闭一只眼true
注意:  这个符号 ^  一定是写到方括号里面
4.范围类

有时匹配的东西过多,而且类型又相同,全部输入太麻烦,我们可以在中间加了个横线

console.log(/[a-c]/.test("dghhj"));   //false
console.log(/[a-c]/.test("b"));       //true
5.组合类
用中括号匹配不同类型的单个字符。
console.log(/[a-m1-5]/.test("b"))//true

四、正则表达式的功能
正则表达式主要是针对字符串进行操作,可以简化对字符串的复杂操作,其主要功能有匹配切割替换获取
1、匹配

检查字符串是否符合正则表达式中的规则,有一次不匹配,则返回false。如:

String str="abc";
String reg="[a-zA-Z]d?";//次表达式表示字符串的第一位只能是字母,第二位只能是数字或没有
boolean flag=str.matches(reg);//返回结果为true
2、切割

所谓切割,即是按一定的规则将字符串分割成多个子字符串,如:

String str="zhangsan,lishi,wangwu";
String reg=",";//表示以逗号作为切割符
String[] arr=str.split(reg);//返回结果为{“zhangsan”,"lisi","wangwu}
3、替换

即将字符串中符合规则的字符替换成指定字符,如:

String str="sfhjhfh136hjasdf73466247fsjha8437482jfjsfh746376";
str.replaceAll("d{3,}","#");//表示将连续出现三个或三个以上的数字替换成“#”
4、获取

即获取与规格相符的字符串,其步骤为:
①将正则表达式封装成对象
②让正则表达式和要操作的字符串相关联,获得匹配器对象
③获取正则匹配引擎
④通过引擎对符合规则的子串进行操作:如

String str="ming tian jiu yao fang jia le";
String reg="[a-z]{3}";//"//b"表示单词边界
Pattern p=Pattern.compile(reg);
Matcher m=p.matcher(str);// 获得匹配器
m.find();
五、正则边界(重点)

^ 会匹配行或者字符串的起始位置
注:^在[]中才表示非!这里表示开始
$ 会匹配行或字符串的结尾位置
^$在一起 表示必须是这个(精确匹配)

// 边界可以精确说明要什么
console.log(/lily/.test("lilyname")); // true
console.log(/^lily$/.test("lily"));  // true
console.log(/^lily$/.test("ly"));   // false
console.log(/^andy$/.test("andy"));  // true
这个的最终意思就是 说, 必须是 andy 这四个字母
六、量词(重点)
(多个字母,重复最后一个)
 *   (贪婪)   重复零次或更多   (>=0)
 +   (懒惰)   重复一次或更多次  (>=1)
 ?    (占有)   重复零次或一次   (0||1)  要么有 要么没有
{}  重复多少次的意思   可以有多少个  
您的银行卡密码只能是 6位      {6}
{n}    n次    (x=n)  
{n,}    重复n次或更多  (x>=n)
{n,m} 重复出现的次数比n多但比m少 (n<=x<=m)
*        {0,}
+        {1,}
?        {0,1}
x|y    一个 |   x  或者 y(没有&,用的是,代替的)   
()提高权限,有限计算

七、replace 函数
replace() 方法用于在字符串中用一些字符替换另一些字符,或替换一个与正则表达式匹配的子串。 语法格式:(返回值是新字符串)
需要匹配的对象.replace(正则式/字符串,替换的目标字符)

正则表达式的匹配模式支持的2个标志
g:表示全局模式(global),即模式将被应用于所有字符串而非发现一个而停止
i:表示不区分大小写(ease-insensitive)模式,在确定匹配想时忽略模式与字符串的大小写

封装自己的trim 函数

function trim(str) {

       return str.replace(/(^s+)|(s+$)/g,"");  // 去掉前面和后面的空格
}
八、常用的正则表达式 1、校验数字的表达式
数字:^[0-9]*$
n位的数字:^d{n}$
至少n位的数字:^d{n,}$
m-n位的数字:^d{m,n}$
零和非零开头的数字:^(0|[1-9][0-9]*)$
非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
带1-2位小数的正数或负数:^(-)?d+(.d{1,2})?$
正数、负数、和小数:^(-|+)?d+(.d+)?$
有两位小数的正实数:^[0-9]+(.[0-9]{2})?$
有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
非零的正整数:^[1-9]d$ 或 ^([1-9][0-9]){1,3}$ 或 ^+?[1-9][0-9]*$
非零的负整数:^-[1-9][]0-9”$ 或 ^-[1-9]d$
非负整数:^d+$ 或 ^[1-9]d*|0$
非正整数:^-[1-9]d*|0$ 或 ^((-d+)|(0+))$
非负浮点数:^d+(.d+)?$ 或 ^[1-9]d.d|0.d[1-9]d|0?.0+|0$
非正浮点数:^((-d+(.d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]d.d|0.d[1-9]d))|0?.0+|0$
正浮点数:^[1-9]d.d|0.d[1-9]d$ 或 ^(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9]))$
负浮点数:^-([1-9]d.d|0.d[1-9]d)$ 或 ^(-(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9])))$
浮点数:^(-?d+)(.d+)?$ 或 ^-?([1-9]d.d|0.d[1-9]d|0?.0+|0)$
2、校验字符的表达式
汉字:^[u4e00-u9fa5]{0,}$
英文和数字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
长度为3-20的所有字符:^.{3,20}$
由26个英文字母组成的字符串:^[A-Za-z]+$
由26个大写英文字母组成的字符串:^[A-Z]+$
由26个小写英文字母组成的字符串:^[a-z]+$
由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$
由数字、26个英文字母或者下划线组成的字符串:^w+$ 或 ^w{3,20}$
中文、英文、数字包括下划线:^[u4E00-u9FA5A-Za-z0-9_]+$
中文、英文、数字但不包括下划线等符号:^[u4E00-u9FA5A-Za-z0-9]+$ 或 ^[u4E00-u9FA5A-Za-z0-9]{2,20}$
可以输入含有^%&’,;=?$”等字符:[^%&’,;=?$x22]+
禁止输入含有~的字符:[^~x22]+
3、特殊需求表达式
Email地址:^w+([-+.]w+)@w+([-.]w+).w+([-.]w+)*$
域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
InternetURL:[a-zA-z]+://[^s] 或 ^http://([w-]+.)+[w-]+(/[w-./?%&=])?$
手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])d{8}$
电话号码(“XXX-XXXXXXX”、”XXXX-XXXXXXXX”、”XXX-XXXXXXX”、”XXX-XXXXXXXX”、”XXXXXXX”和”XXXXXXXX):^((d{3,4}-)|d{3.4}-)?d{7,8}$
国内电话号码(0511-4405222、021-87888822):d{3}-d{8}|d{4}-d{7}
电话号码正则表达式(支持手机号码,3-4位区号,7-8位直播号码,1-4位分机号): ((d{11})|^((d{7,8})|(d{4}|d{3})-(d{7,8})|(d{4}|d{3})-(d{7,8})-(d{4}|d{3}|d{2}|d{1})|(d{7,8})-(d{4}|d{3}|d{2}|d{1}))$)
身份证号(15位、18位数字),最后一位是校验位,可能为数字或字符X:(^d{15}$)|(^d{18}$)|(^d{17}(d|X|x)$)
帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):^[a-zA-Z]w{5,17}$
强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):^(?=.d)(?=.[a-z])(?=.*[A-Z]).{8,10}$
日期格式:^d{4}-d{1,2}-d{1,2}
一年的12个月(01~09和1~12):^(0?[1-9]|1[0-2])$
一个月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
钱的输入格式:
有四种钱的表示形式我们可以接受:”10000.00” 和 “10,000.00”, 和没有 “分” 的 “10000” 和 “10,000”:^[1-9][0-9]*$
这表示任意一个不以0开头的数字,但是,这也意味着一个字符”0”不通过,所以我们采用下面的形式:^(0|[1-9][0-9]*)$
一个0或者一个不以0开头的数字.我们还可以允许开头有一个负号:^(0|-?[1-9][0-9]*)$
这表示一个0或者一个可能为负的开头不为0的数字.让用户以0开头好了.把负号的也去掉,因为钱总不能是负的吧。下面我们要加的是说明可能的小数部分:^[0-9]+(.[0-9]+)?$
必须说明的是,小数点后面至少应该有1位数,所以”10.”是不通过的,但是 “10” 和 “10.2” 是通过的:^[0-9]+(.[0-9]{2})?$
这样我们规定小数点后面必须有两位,如果你认为太苛刻了,可以这样:^[0-9]+(.[0-9]{1,2})?$
这样就允许用户只写一位小数.下面我们该考虑数字中的逗号了,我们可以这样:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
1到3个数字,后面跟着任意个 逗号+3个数字,逗号成为可选,而不是必须:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
备注:这就是最终结果了,别忘了”+”可以用”*”替代如果你觉得空字符串也可以接受的话(奇怪,为什么?)最后,别忘了在用函数时去掉去掉那个反斜杠,一般的错误都在这里
xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+.[x|X][m|M][l|L]$
中文字符的正则表达式:[u4e00-u9fa5]
双字节字符:[^x00-xff] (包括汉字在内,可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1))
空白行的正则表达式:
s*
 (可以用来删除空白行)
HTML标记的正则表达式:<(S?)[^>]>.?|<.? /> ( 首尾空白字符的正则表达式:^s|s$或(^s)|(s$) (可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式)
腾讯QQ号:[1-9][0-9]{4,} (腾讯QQ号从10000开始)
中国邮政编码:[1-9]d{5}(?!d) (中国邮政编码为6位数字)
IP地址:((?:(?:25[0-5]|2[0-4]d|[01]?d?d).){3}(?:25[0-5]|2[0-4]d|[01]?d?d))

如果你觉得这篇文章对你有所帮助,那就顺便点个赞吧,点赞收藏不迷路~

黑芝麻哇,白芝麻发,黑芝麻白芝麻哇发哈!

前端哇发哈

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/106848.html

相关文章

  • 大话javascript 2:执行上下文与执行上下文栈

    摘要:在中,通过栈的存取方式来管理执行上下文,我们可称其为执行栈,或函数调用栈。因为执行中最先进入全局环境,所以处于栈底的永远是全局环境的执行上下文。 一、什么是执行上下文? 执行上下文(Execution Context): 函数执行前进行的准备工作(也称执行上下文环境) JavaScript在执行一个代码段之前,即解析(预处理)阶段,会先进行一些准备工作,例如扫描JS中var定义的变量、...

    denson 评论0 收藏0
  • 大话javascript 6:this深度解析

    摘要:在这次执行期间,函数中的将指向。在刚刚的例子中,因为在调用构造函数的过程中,手动的设置了返回对象,与绑定的默认对象被丢弃了。在上面的例子中,一个赋值给了的函数称为匿名函数,返回了另一个箭头函数称为匿名函数。 一、引言 在执行上下文的创建阶段,会分别生成变量对象,建立作用域链,确定this指向。this的指向,是在函数被调用的时候确定的。也就是执行上下文被创建时确定的。因此,一个函数中的...

    lsxiao 评论0 收藏0
  • 大话javascript 3:闭包

    摘要:由此可知闭包是函数的执行环境以及执行环境中的函数组合而构成的。此时产生了闭包。二闭包的作用闭包的特点是读取函数内部局部变量,并将局部变量保存在内存,延长其生命周期。三闭包的问题使用闭包会将局部变量保持在内存中,所以会占用大量内存,影响性能。 一、什么是闭包 1.闭包的定义 闭包是一种特殊的对象。它由两部分构成:函数,以及创建该函数的环境(包含自由变量)。环境由闭包创建时在作用域中的任何...

    Freelander 评论0 收藏0
  • 大话javascript 4:事件循环(1)

    摘要:脚本执行,事件处理等。引擎线程,也称为内核,负责处理脚本程序,例如引擎。事件触发线程,用来控制事件循环可以理解为,引擎线程自己都忙不过来,需要浏览器另开线程协助。异步请求线程,也就是发出请求后,接收响应检测状态变更等都是这个线程管理的。 一、进程与线程 现代操作系统比如Mac OS X,UNIX,Linux,Windows等,都是支持多任务的操作系统。 什么叫多任务呢?简单地说,就是操...

    codergarden 评论0 收藏0
  • 大话javascript 1:作用域和作用域链

    摘要:全局作用域局部作用域局部作用域全局作用域局部作用域块语句没有块级作用域块级声明包括和,以及和循环,和函数不同,它们不会创建新的作用域。局部作用域只在该函数调用执行期间存在。 一、什么是作用域? 作用域是你的代码在运行时,各个变量、函数和对象的可访问性。(可产生作用的区域) 二、JavaScript中的作用域 在 JavaScript 中有两种作用域 全局作用域 局部作用域 当变量定...

    NicolasHe 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<