你的位置:首页 > Java教程

[Java教程][JS]笔记11之正则表达式


-->什么是正则表达式
-->定义正则
-->正则的索引
-->元字符
-->方括号、量词、其他符号
-->RegExp 对象的方法
-->String 对象方法

 

1、定义:

正则用于规定在文本中检索的内容,它是对字符串执行模式匹配的强大工具
RegExp(正则表达式) 对象的语法:
new RegExp(pattern, attributes);
pattern为一个字符串或匹配规则
attributes为可选字符串,包含属性g、i 和 m
g:代表全局匹配 (继续往下匹配)
i:代表不区分大小写匹配
m:代表多行匹配,只对^和$模式有用

 

2、定义正则表达式

定义正则表达式有两种形式:
构造函数方式: new RegExp(pattern, attributes);
例:var reg=new RegExp(“abc","g");
构造函数中的正则可以是常量字符串或一个js变量

普通方式:/pattern/attributes(/正则/属性)
例:var reg=/abc/g;
普通方式中的正则必须是一个常量字符串


3、正则的索引

每个正则表达式都有一个 lastIndex 属性,用于记录上一次匹配结束的位置(索引值)。
获取 reg.lastIndex
设置 reg.lastIndex=0;

 

4、元字符

\d : 匹配任意一个数字,0~9 中的任意一个
\s : 匹配任意一个空白字符
\b : 匹配一个单词边界,不匹配任何字符
\w : 匹配任意一个字符( 字母、 数字、下划线 )
. : 匹配任意一个字符,除了换行符( \n )
\n : 查找换行符
\u : 通常用来匹配汉字
表达式 "\d","\s","\b","\w",对应的大写字母表示相反的意义
如:\D 匹配所有的非数字字符


5、方括号

[abc] : 查找方括号之间的任何字符。
[^abc] : 查找任何不在方括号之间的字符。
[0-9] : 查找任何从 0 至 9 的数字。
[a-z] : 查找任何从小写 a 到小写 z 的字符。
[A-Z] : 查找任何从大写 A 到大写 Z的字符。

 

6、量词

n+ : 匹配任何包含至少一个 n 的字符串。
n? : 匹配任何包含零个或一个 n 的字符串。
n* : 匹配任何包含零个或多个 n 的字符串。
n{X} : 匹配包含 X 个 n 的序列的字符串。
n{X,Y} : 匹配包含 X 到Y 个 n 的序列的字符串。
^n : 匹配任何开头为 n 的字符串。
n$ : 匹配任何结尾为 n 的字符串。

 

7、其他

| : 匹配左边或者右边
\ : 转义符
特殊标点符号,在前面加 \ 后,就代表该符号本身
^ 要匹配 "^" 字符本身,请使用 \^
( ) 要匹配小括号本身,请使用 \( 和 \)
其他特殊标点符号 [ ] { } . ? + * |
Unicode编码16进制的utf-8汉字编码:
4e00最小中文字符 9fa5最大中文字符
/^[\u4e00-\u9fa5]+$/ //常用汉字编码范围

 

8、RegExp 对象的方法

test:检索字符串中指定的值 返回 true 或 false
reg.test(str);
exec: 检索字符串返回查找结果的第一个值
reg.exec(str);

compile: 该方法可以重编辑指定的正则表达式
var reg=new RegExp("13[4-9](\\d){8}","g");
//重新编辑正则表达式
reg.compile("13[0-3](\\d){8}","g");

 

9、String 对象方法

search:检索与正则表达式相匹配的值
用法:str.search(reg); (返回索引值,无-1)
match:返回所有正则表达式的匹配(加g)
用法:str.match(reg); (返回数组)
replace:替换与正则表达式匹配的子串
用法:str.replace(reg,"");
split:将字符串匹配的部分做分割(去除)
用法:str.split(reg); (返回数组)

 10、代码

  关于知识点练习:

 1 <!DOCTYPE html> 2 <html lang="en"> 3 <head> 4 <meta charset="UTF-8"> 5 <title>reg1</title> 6 </head> 7 <body> 8 <script> 9   var str1='1abc12Abc34abc56aBc78';10 /*定义正则表达式*/11   //构造函数方式12   var reg1=new RegExp('abc','gi');13   //普通方式14   var reg2=/^abc/g//^abc15 16 /*正则的索引*/17   var str='abcdeabfg';18   var reg=new RegExp('ab','g');19   console.log(reg.test(str));//true20   //获取索引21   console.log(reg.lastIndex);//2-上一次匹配结束的位置22 23 /*regexp对象de方法*/24   //test:检索字符串中指定值,返回true或false25   console.log(reg1.test(str1));//true26   //设置正则的索引27   reg1.lastIndex=11;//下次从11开始匹配28   //exec: 检索字符串返回查找结果的第一个值29   console.log(reg1.exec(str1));//["abc", index: 0, input: "abc12Abc34abc56aBc78"]30 31 /*string对象de方法*/32   //match:返回所有正则表达式的匹配(加g)33   console.log(str1.match(reg1));//["abc", "Abc", "abc", "aBc"]34   //search:检索与正则表达式相匹配的值35   console.log(str1.search(reg1));//0-字符串第0个就与reg匹配36 /*js的换行符:\n*/37   console.log('abc\n123');38   //replace:替换与正则表达式匹配的子串39   var str3=str1.replace(reg1,'***');40   document.write(str3);41   42   var str2='abc12Abc34\nabc56aBc78';43   var reg2=new RegExp('^abc','g');//^abc44   console.log(str2.match(reg2));//['abc']45   var reg3=new RegExp('^abc','gm');//mm:代表多行匹配,只对^和$模式有用46   console.log(str2.match(reg3));//['abc','abc']47 </script>48 </body>49 </html>

 

 练习2-和谐敏感字

 1 <!DOCTYPE html> 2 <html lang="en"> 3 <head> 4 <meta charset="UTF-8"> 5 <title>敏感字</title> 6 <style> 7 #con{ 8   font-size: 20px; 9   color:red;10   width:500px;11   background: #ccc;12 }13 #txt{14   font-size: 20px;15   color:blue;16   width:500px;17 }18 </style>19 </head>20 <body>21   <textarea id="txt" cols="50" rows="10">22   </textarea>23   <button id="btn">发布</button>24   <div id="con"></div>25 <script>26   var txt=document.getElementById('txt');27   var btn=document.getElementById('btn');28   var con=document.getElementById('con');29   var reg=/中国政府 |菲律宾|南海|泰国|中国人民解放军/g;30   btn.onclick=function(){31     var connet=txt.value.replace(reg,function(x){32       // alert(x);//每次匹配到的词33       var a='';34       for (var i = 0; i < x.length; i++) {35         a+='*';36       }37       return a;38     });39     con.innerHTML=connet;40   }41 </script>42 </body>43 </html>44 <!-- con可写入文字: -->45 <!-- 中国政府 可以把在仁爱礁的菲律宾军舰拖走,把菲律宾赶出仁爱礁。中国政府 可以在南海诸岛继续建设填海建岛。因为南海各国在经济上是比不了中国的,他们填1米海,中国政府能填100米,最后,仍然是中国占便宜。中国在南海加大巡逻力度,使中国人民解放军在南海占领常态化。每年都在南海举行以救援中国人民解放军救助、人道主义援助为目的军事演习,甚至可以邀请东盟各国(例如泰国、柬埔寨)参加,震慑周边诸国。通过政治、外交、文化交流、经济援助、赠送军舰等手段拉拢分裂东盟国家。(例如柬埔寨、泰国这样与中国政府 南海无利益纠纷的国家)继续加强海军建设,例如建造两栖攻击舰、船坞,中国人民解放军 -->

积累--正则集:

JS正则表达式验证数字js正则表达式 <script type="text/javascript">   function validate(){    var reg = new RegExp("^[0-9]*$");    var obj = document.getElementById("name");  if(!reg.test(obj.value)){    alert("请输入数字!");  }  if(!/^[0-9]*$/.test(obj.value)){    alert("请输入数字!");  } }</script>验证数字的正则表达式集 验证数字:^[0-9]*$ 验证n位的数字:^\d{n}$ 验证至少n位数字:^\d{n,}$ 验证m-n位的数字:^\d{m,n}$ 验证零和非零开头的数字:^(0|[1-9][0-9]*)$ 验证有两位小数的正实数:^[0-9]+(.[0-9]{2})?$ 验证有1-3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$ 验证非零的正整数:^\+?[1-9][0-9]*$ 验证非零的负整数:^\-[1-9][0-9]*$ 验证非负整数(正整数 + 0) ^\d+$ 验证非正整数(负整数 + 0) ^((-\d+)|(0+))$ 验证长度为3的字符:^.{3}$ 验证由26个英文字母组成的字符串:^[A-Za-z]+$ 验证由26个大写英文字母组成的字符串:^[A-Z]+$ 验证由26个小写英文字母组成的字符串:^[a-z]+$ 验证由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$ 验证由数字、26个英文字母或者下划线组成的字符串:^\w+$ 验证用户密码:^[a-zA-Z]\w{5,17}$ 正确格式为:以字母开头,长度在6-18之间,只能包含字符、数字和下划线。 验证是否含有 ^%&',;=?$\" 等字符:[^%&',;=?$\x22]+ 验证汉字:^[\u4e00-\u9fa5],{0,}$ 验证Email地址:^\w+[-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$ 验证InternetURL:^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$ ;^[a-zA-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$ 验证电话号码:^(\(\d{3,4}\)|\d{3,4}-)?\d{7,8}$:--正确格式为:XXXX-XXXXXXX,XXXX-XXXXXXXX,XXX-XXXXXXX,XXX-XXXXXXXX,XXXXXXX,XXXXXXXX。 验证身份证号(15位或18位数字):^\d{15}|\d{}18$ 验证一年的12个月:^(0?[1-9]|1[0-2])$ 正确格式为:“01”-“09”和“1”“12” 验证一个月的31天:^((0?[1-9])|((1|2)[0-9])|30|31)$ 正确格式为:01、09和1、31。 整数:^-?\d+$ 非负浮点数(正浮点数 + 0):^\d+(\.\d+)?$ 正浮点数 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$ 非正浮点数(负浮点数 + 0) ^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 负浮点数 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$ 浮点数 ^(-?\d+)(\.\d+)?$