Flex 中正则表达式的使用

  • Post author:
  • Post category:其他


1  Flex中使用正则表达式

RegExp 类允许使用正则表达式(即可用于在字符串中执行搜索和替换文本的模式)。

可以使用 new RegExp() 构造函数或将 RegExp 文本分配给一个变量,从而创建新的 RegExp 对象:

var pattern1:RegExp = new RegExp(“test-\\d”, “i”);

var pattern2:RegExp = /test-\d/i;

2  Flex正则表达式规则



1.1普通字符



字母、数字、汉字、下划线、以及后边章节中没有特殊定义的标点符号,都是”普通字符”。表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符。



举例1:表达式”c”,在匹配字符串”abcde”时,匹配结果是:成功;匹配到的内容是:”c”;匹配到的位置是:开始于2,结束于3。(注:下标从0开始还是从1开始,因当前编程语言的不同而可能不同)



举例2:表达式”bcd”,在匹配字符串”abcde”时,匹配结果是:成功;匹配到的内容是:”bcd”;匹配到的位置是:开始于1,结束于4。






1.2简单的转义字符



Flex正则表达式中一些不便书写的字符,采用在前面加””的方法。这些字符其实我们都已经熟知了。



表达式可匹配



\r,\n



代表回车和换行符



\t



制表符



\\



代表””本身






◆还有其他一些在后边章节中有特殊用处的标点符号,在前面加””后,就代表该符号本身。比如:^,$都有特殊意义,如果要想匹配字符串中”^”和”$”字符,则表达式就需要写成”\^”和”\$”。



表达式可匹配



\^



匹配^符号本身



\$



匹配$符号本身



\.



匹配小数点(.)本身






这些转义字符的匹配方法与”普通字符”是类似的。也是匹配与之相同的一个字符。



举例1:表达式”\$d”,在匹配字符串”abc$de”时,匹配结果是:成功;匹配到的内容是:”$d”;匹配到的位置是:开始于3,结束于5。



1.3能够与’多种字符’匹配的表达式



Flex正则表达式中的一些表示方法,可以匹配’多种字符’其中的任意一个字符。比如,表达式”\d”可以匹配任意一个数字。虽然可以匹配其中任意字符,但是只能是一个,不是多个。这就好比玩扑克牌时候,大小王可以代替任意一张牌,但是只能代替一张牌。



表达式可匹配



\d



任意一个数字,0~9中的任意一个



\w



任意一个字母或数字或下划线,也就是A~Z,a~z,0~9,_中任意一个



\s



包括空格、制表符、换页符等空白字符的其中任意一个



.



小数点可以匹配除了换行符(\n)以外的任意一个字符



举例1:表达式”\d\d”,在匹配”abc123″时,匹配的结果是:成功;匹配到的内容是:”12″;匹配到的位置是:开始于3,结束于5。



举例2:表达式”a.\d”,在匹配”aaa100″时,匹配的结果是:成功;匹配到的内容是:”aa1″;匹配到的位置是:开始于1,结束于4。






1.4自定义能够匹配’多种字符’的表达式



Flex正则表达式中使用方括号[]包含一系列字符,能够匹配其中任意一个字符。用[^]包含一系列字符,则能够匹配其中字符之外的任意一个字符。同样的道理,虽然可以匹配其中任意一个,但是只能是一个,不是多个。



表达式可匹配



[ab5@]



匹配”a”或”b”或”5″或”@”



[^abc]



匹配”a”,”b”,”c”之外的任意一个字符



[f-k]



匹配”f”~”k”之间的任意一个字母



[^A-F0-3]



匹配”A”~”F”,”0″~”3″之外的任意一个字符



举例1:表达式”[bcd][bcd]”匹配”abc123″时,匹配的结果是:成功;匹配到的内容是:”bc”;匹配到的位置是:开始于1,结束于3。



举例2:表达式”[^abc]”匹配”abc123″时,匹配的结果是:成功;匹配到的内容是:”1″;匹配到的位置是:开始于3,结束于4。



http://hi.baidu.com/fengpingfan123/blog/item/9a0ffdef3be51b2fadafd5cc.html



谈谈正则表达式,AS3.0中引进了正则表达式。正则表达式是用于验证文本值是否符合特定模式。



正则表达式有四个部分。1元子符。2元序列。3标志。4数量表达符。



可以这样看 pattern RegExp= /匹配字符串元字符元序列/标志当然顺序可能不完全是这样.别把他想的太复杂其实他就是个组合。



现在我们来看看元字符: ^ $ \ . * + ? ( ) [ ] { } |



前面说的是转义字符串的使用






元子符






1.^的用法:匹配字符串的开头



var pattern:RegExp=/^小虫/;



var str:String=”小虫是好人”;



trace(str, ” is valid:”, pattern.test(str));小虫是好人 is valid: true






2.$的用法:匹配字符串的结尾



var pattern:RegExp=/lizhen$/;



var str:String=”My name is lizhen”;



trace(str, ” is valid:”, pattern.test(str));小虫是好人 is valid: true



仔细看一下两个符号在匹配字符串中的位置,注意:如果同时使用^符号和$符号,将进行精确匹配。






3.\的用法:匹配字符串的结尾



如果匹配字符串中包含有”/”比如 1/2 的时候,使用如下定义



var pattern:RegExp = /1\/2/;



var str:String=”1/2是多少?”;



trace(str, ” is valid:”, pattern.test(str));1/2是多少? is valid: true



如果匹配字符串中包含有””比如 “lizhen” 的时候,使用如下定义



var pattern:RegExp=/”lizhen”/;



var str:String=”My name is “lizhen””;



trace(str, ” is valid:”, pattern.test(str));My name is “lizhen” is valid: true






4.*的用法:匹配0个或多个前面的字符.



var pattern:RegExp=/我的*/;



var str:String=”我的我的我的”;或者var str:String=”我的”



trace(str, ” is valid:”, pattern.test(str));我的我的… is valid: true






5.+的用法:匹配至少一个前面的字符



var pattern:RegExp=/我的+/;



var str:String=”我的ID是…”;或者var str:String=”我的”



trace(str, ” is valid:”, pattern.test(str));我的ID是… is valid: true



注意+和*的区别。如果var str:String=”我的”那就会显示false






6.?的用法:匹配0个或1个前面的字符



var pattern:RegExp=/天?/;



var str:String=”一天快乐”;或者var str:String=”天天快乐”;



trace(str, ” is valid:”, pattern.test(str));一天快乐 is valid: true






7..的用法:匹配任意单个字符



var pattern:RegExp=/天./;



var str:String=”一天快乐”;或者var str:String=”天天快乐”;



trace(str, ” is valid:”, pattern.test(str));一天快乐 is valid: true






8.[ ]的用法:匹配某一个范围而不局限于具体的单个字符



var pattern:RegExp=/[a-z]/



var str:String=”a”



trace(str, ” is valid:”, pattern.test(str));a is valid: true






9.( )的用法:这个就相当于是个集合。



var pattern:RegExp=/([a-z][A-Z][0-9])+/ 比如说这个就是定义了一个四个字符的字符串第一个字符是a到z之间的字符第二个是A到Z之间的字符第三个是0-9之间的字符,第四个重复前面的数字。



var str:String=”aD77aaaaaaaaaaaaaaaa”



trace(str, ” is valid:”, pattern.test(str));aD77aaaaaaaaaaaaaaaa is valid: true






10.|的用法:匹配左边或者右边的字符。



var pattern:RegExp=/小虫|lizhen/



var str:String=”小虫是好人”



trace(str, ” is valid:”, pattern.test(str));小虫是好人 is valid: true






元序列



元序列是在正则表达式模式中具有特殊含义的字符序列



{n} {n,} {n,m} \b \B \d \D \f \n \r \s \S \t \unnnn \v \w \w \W \xnn






1.{n}的用法:匹配恰好n个(n为非负整数)前面的字符。



var pattern:RegExp=/(小虫){2}/ 对象中连续出现2次小虫.注意下(),如果用var pattern:RegExp=/小虫{2}/ 那么就是var str:String=”小虫虫”



var str:String=”小虫小虫”



trace(str, ” is valid:”, pattern.test(str));小虫小虫 is valid: true.






2.{n,}的用法:匹配恰好n个(n为非负整数)或更多个前面的字符。






3.{n,m}的用法:匹配至少n个,至多m个前面的字符。






4.\b的用法:匹配单词字符和非单词字符之间的位置只能放在开头和结尾。



NN的,他不支持中文.用中文还是用^.



var pattern:RegExp=/\b小虫/



var pattern:RegExp=/.mp3\b/



var str:String=”小虫.mp3″可以判断是否是mp3格式。



trace(str,” is valid:”, pattern.test(str));小虫.mp3 is valid: true






5.\B的用法:匹配对象必须位于目标字符串的开头和结尾两个边界之内,



即匹配对象既不能作为目标字符串的开头,也不能作为目标字符串的结尾和\b相反。



var pattern:RegExp=/\B是/



var str:String=”我是虫子”



trace(str,” is valid:”, pattern.test(str));我是虫子 is valid: true






6.\d的用法:用于匹配从0到9的数字;



var pattern:RegExp=/\b\d/ 开头的第一字符必须为数字



var str:String=”900/元”



trace(str,” is valid:”, pattern.test(str)); 900/元 is valid: true






7.\D的用法:匹配除数字以外的任何字符



var pattern:RegExp=/\b\D/ 开头的第一字符必须不为数字



var str:String=”a900/元”



trace(str,” is valid:”, pattern.test(str)); a900/元 is valid: true






8.\f的用法:匹配换页符DOS操作时代的概念






9.\n的用法:匹配换行符



var pattern:RegExp=/\n/



var str:String=”欢迎来到虫子的空间!\n”



trace(str,” is valid:”, pattern.test(str));






10.\r的用法:匹配回车符



var pattern:RegExp=/\r/



var str:String=”欢迎来到虫子的空间!\r”



trace(str,” is valid:”, pattern.test(str));






11.\s的用法:匹配任何空白字符(空格、制表符、换行符或回车符)



var pattern:RegExp=/\s/



var str:String=”欢迎来到虫子的 空间!”



trace(str,” is valid:”, pattern.test(str)); 欢迎来到虫子的 空间! is valid: true






12.\S的用法:匹配除空白字符以外的任何字符



var pattern:RegExp=/\S/



var str:String=”欢迎来到虫子的空间!”



trace(str,” is valid:”, pattern.test(str)); 欢迎来到虫子的空间! is valid: true






13.\t的用法:匹配制表符DOS操作时代的概念






14.\unnnn用法:匹配字符代码由十六进制数字 nnnn 指定的 Unicode 字符。



例如,\u263a 是一个笑脸字符



var pattern:RegExp=/\u263a/



var str:String=”欢迎来到虫子的空间!\u263a”



trace(str,” is valid:”, pattern.test(str)); 欢迎来到虫子的空间!☺ is valid: true






15.\v 用法:匹配垂直换页符DOS操作时代的概念






16.\w用法:匹配单词字符(A-Z、a-z、0-9 或 _)。



请注意,\w不匹配非英文字符,如é、ñ 或 ç。他和[]是有区别的。



var pattern:RegExp=/^\w/



var str:String=”a虫子”



var str:String=”0虫子”



var str:String=”A虫子”



var str:String=”_虫子”



trace(str,” is valid:”, pattern.test(str));_虫子 is valid: true






17.\W用法:匹配除单词字符以外的任何字符。



var pattern:RegExp=/^\W/



var str:String=”虫子”



trace(str,” is valid:”, pattern.test(str));虫子 is valid: true






18.\xnn用法:匹配具有指定 ASCII 值(由十六进制数字 nn 定义)的字符。



var pattern:RegExp=/^\x41/;”A”



var str:String=”ABCD”;



trace(str,” is valid:”, pattern.test(str));ABCD is valid: true






标志:



标志可以作为正则表达式对象属性进行访问。






正则表达式有五个标志:g i m s x






1.g的用法:如果不指定g,那么在查找的时候只会返回一个。



如:



var str:String = “she sells seashells by the seashore.”;



var pattern:RegExp = /sh\w*/;



trace(str.match(pattern)) 输出:she



指定g后:



var str:String = “she sells seashells by the seashore.”;



var pattern:RegExp = /sh\w*/g;



trace(str.match(pattern)) 输出:she,shells,shore






2.i的用法:默认情况下,正则表达式匹配区分大小写。如果设置 i (ignoreCase) 标志,将忽略区分大小写。



var str:String = “She sells seaShells by the seaShore.”;



var pattern:RegExp = /sh\w*/gi;



trace(str.match(pattern)) 输出:She,Shells,Shore






3.m的用法:匹配”行”的开头和结尾.注意这里的行只有 \n 字符表示行的结束,其余的都不行。包括\r。比如:



var str:String = “She sells seaShells by the seaShore.\n”;



str+=”She’s your mother”



var pattern:RegExp = /^sh\w*/gim;



trace(str.match(pattern)) 输出:She,She



也可以在结尾使用.比如:



var str:String = “She sells seaShells by the seaShore.\n”;



str+=”She’s your mother.\n”



var pattern:RegExp = /\n\$\w*/gim;



trace(“=====”+str.match(pattern)) 输出:=====






4.s的用法:用点来匹配换行符



var str:String = “<p>Test\n”;



str += “Multiline</p>”;



var re:RegExp = /<p>.*?<\/p>/s;



trace(str.match(re));






5.x的用法:在正则表达式中使用 x (extended) 标志时,则会忽略在模式中键入的所有空格。



var str:String = “lizhen”;



var re:RegExp = /li zhen/x



trace(str.match(re));输出:lizhen






数量表示符






使用数量表示符指定字符或序列在模式中的重复次数,如下所示:



数量表示符元字符



描述






*(星号)



匹配前面重复零次或多次的项目。






+(加号)



匹配前面重复一次或多次的项目。






?(问号)



匹配前面重复零次或一次的项目。






{n}



{n,}







{n,n}



指定前一项目的数值数量或数量范围:



/A{27}/ 匹配重复 27 次的字符 A。



/A{3,}/ 匹配重复 3 次或更多次的字符 A。



/A{3,5}/ 匹配重复 3 到 5 次的字符 A。






您可以将数量表示符应用到单个字符、字符类或组:



/a+/ 匹配重复一次或多次的字符 a。



/\d+/ 匹配一个或多个数字。



/[abc]+/ 匹配重复的一个或多个字符,这些字符可能是 a、b 或 c 中的某个。



/(very, )*/ 匹配重复零次或多次的后跟逗号和空格的单词 very。



您可以在应用数量表示符的括号组内使用数量表示符。例如,下面的数量表示符匹配诸如 word 和 word-word-word 的字符串:



/\w+(-\w+)*/



默认情况下,正则表达式执行所谓的“无限匹配”。正则表达式中的任何子模式(如 .*)都会尝试在字符串中匹配尽可能多的字符,然后再执行正则表达式的下一部分。例如,使用以下正则表达式和字符串:



var pattern:RegExp = /<p>.*<\/p>/;



str:String = “<p>Paragraph 1</p> <p>Paragraph 2</p>”;



正则表达式匹配整个字符串:



<p>Paragraph 1</p> <p>Paragraph 2</p>



但是,假如您只想匹配一个 <p>…</p> 组。则可以通过以下操作实现:



<p>Paragraph 1</p>



在所有数量表示符后添加问号 (?) 以将其更改为所谓的“惰性数量表示符”。例如,下面的正则表达式使用惰性数量表示符 *? 匹配 <p> 后跟数量最少(惰性)的字符,再跟 </p> 的模式:



/<p>.*?<\/p>/



有关数量表示符,请牢记以下几点:



数量表示符 {0} 和 {0,0} 不会从匹配中排除项目。



不要结合使用多个数量表示符,例如 /abc+*/ 中。



在除非设置 s (dotall) 标志,否则不会跨越多行,即使后跟 * 数量表示符。例如,请考虑使用以下代码:



var str:String = “<p>Test\n”;



str += “Multiline</p>”;



var re:RegExp = /<p>.*<\/p>/;



trace(str.match(re)); // null;






re = /<p>.*<\/p>/s;



trace(str.match(re));



// output: <p>Test



//                    Multiline</p>










常用的正则表达式语句



^\d+$  //匹配非负整数(正整数 + 0)



^[0-9]*[1-9][0-9]*$  //匹配正整数



^((-\d+)|(0+))$  //匹配非正整数(负整数 + 0)



^-[0-9]*[1-9][0-9]*$  //匹配负整数



^-?\d+$    //匹配整数



^\d+(\.\d+)?$  //匹配非负浮点数(正浮点数 + 0)



^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$  //匹配正浮点数



^((-\d+(\.\d+)?)|(0+(\.0+)?))$  //匹配非正浮点数(负浮点数 + 0)



^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$ //匹配负浮点数



^(-?\d+)(\.\d+)?$  //匹配浮点数



^[A-Za-z]+$  //匹配由26个英文字母组成的字符串



^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串



^[a-z]+$  //匹配由26个英文字母的小写组成的字符串



^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串



^\w+$  //匹配由数字、26个英文字母或者下划线组成的字符串



^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$    //匹配email地址



^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$  //匹配url



匹配中文字符的正则表达式: [\u4e00-\u9fa5]



匹配双字节字符(包括汉字在内):[^\x00-\xff]



匹配空行的正则表达式:\n[\s| ]*\r



匹配HTML标记的正则表达式:/<(.*)>.*<\/>|<(.*) \/>/



匹配首尾空格的正则表达式:(^\s*)|(\s*$)



匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*



匹配网址URL的正则表达式:^[a-zA-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$



匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$



匹配国内电话号码:(\d{3}-|\d{4}-)?(\d{8}|\d{7})?



匹配腾讯QQ号:^[1-9]*[1-9][0-9]*$






下表是元字符及其在正则表达式上下文中的行为的一个完整列表:



\ 将下一个字符标记为一个特殊字符、或一个原义字符、或一个后向引用、或一个八进制转义符。



^ 匹配输入字符串的开始位置。如果设置了 RegExp 对象的Multiline 属性,^ 也匹配 ’\n’ 或 ’\r’ 之后的位置。



$ 匹配输入字符串的结束位置。如果设置了 RegExp 对象的Multiline 属性,$ 也匹配 ’\n’ 或 ’\r’ 之前的位置。



* 匹配前面的子表达式零次或多次。



+ 匹配前面的子表达式一次或多次。+ 等价于 {1,}。



? 匹配前面的子表达式零次或一次。? 等价于 {0,1}。



{n} n 是一个非负整数,匹配确定的n 次。



{n,} n 是一个非负整数,至少匹配n 次。



{n,m} m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。在逗号和两个数之间不能有空格。



? 当该字符紧跟在任何一个其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面时,匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串,而默认的贪婪模式则尽可能多的匹配所搜索的字符串。



. 匹配除 “\n” 之外的任何单个字符。要匹配包括 ’\n’ 在内的任何字符,请使用象 ’[.\n]’ 的模式。



(pattern) 匹配pattern 并获取这一匹配。



(?:pattern) 匹配pattern 但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。



(?=pattern) 正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。



(?!pattern) 负向预查,与(?=pattern)作用相反



x|y 匹配 x 或 y。



[xyz] 字符集合。



[^xyz] 负值字符集合。



[a-z] 字符范围,匹配指定范围内的任意字符。



[^a-z] 负值字符范围,匹配任何不在指定范围内的任意字符。



\b 匹配一个单词边界,也就是指单词和空格间的位置。



\B 匹配非单词边界。



\cx 匹配由x指明的控制字符。



\d 匹配一个数字字符。等价于 [0-9]。



\D 匹配一个非数字字符。等价于 [^0-9]。



\f 匹配一个换页符。等价于 \x0c 和 \cL。



\n 匹配一个换行符。等价于 \x0a 和 \cJ。



\r 匹配一个回车符。等价于 \x0d 和 \cM。



\s 匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。



\S 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。



\t 匹配一个制表符。等价于 \x09 和 \cI。



\v 匹配一个垂直制表符。等价于 \x0b 和 \cK。



\w 匹配包括下划线的任何单词字符。等价于’[A-Za-z0-9_]’。



\W 匹配任何非单词字符。等价于 ’[^A-Za-z0-9_]’。



\xn 匹配 n,其中 n 为十六进制转义值。十六进制转义值必须为确定的两个数字长。



\num 匹配 num,其中num是一个正整数。对所获取的匹配的引用。



\n 标识一个八进制转义值或一个后向引用。如果 \n 之前至少 n 个获取的子表达式,则 n 为后向引用。否则,如果 n 为八进制数字 (0-7),则 n 为一个八进制转义值。



\nm 标识一个八进制转义值或一个后向引用。如果 \nm 之前至少有is preceded by at least nm 个获取得子表达式,则 nm 为后向引用。如果 \nm 之前至少有 n 个获取,则 n 为一个后跟文字 m 的后向引用。如果前面的条件都不满足,若 n 和 m 均为八进制数字 (0-7),则 \nm 将匹配八进制转义值 nm。



\nml 如果 n 为八进制数字 (0-3),且 m 和 l 均为八进制数字 (0-7),则匹配八



版权声明:本文为qxlisiwei008原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。