当前位置:编程学习 > asp >>

收集和分享一些常用的正则表达式

正则表达式怎么匹配非汉字非字母非数字之外的字符?

怎么匹配非汉字非字母非数字之外的字符
例如:ぴ●ОⅤ┏┓の等等这些乱七八的符号

汉字的表示和正则表达式引擎相关,不同引擎的写法不同,下面的写法适用于java引擎,或者一切以unicode来表示字符的引擎。
1、基本规格——针对汉字的一般集合(cp936,约等于GBK,共计20000多汉字)
[^\dA-Za-z\u3007\u4E00-\u9FCB\uE815-\uE864]
2、扩充规格——针对多一些的汉字(支持CJK ExtA,共计接近30000汉字)
[^\dA-Za-z\u3007\u3400-\u4DB5\u4E00-\u9FCB\uE815-\uE864]
3、豪华规格——针对更多的汉字(支持CJK ExtB、C、......,共计75000多汉字)
(?![\dA-Za-z\u3007\u3400-\u4DB5\u4E00-\u9FCB\uE815-\uE864]|[\uD840-\uD87F][\uDC00-\uDFFF])

----------------------------------------
正则表达式[\u4e00-\u9fa5]表示匹配中文,则正则表达式[^\u4e00-\u9fa5]匹配非中文。用Replace方法将匹配的非中文替换为空字符串,也就是去除了文本中的非中文字符。

正则表达式:2-7个汉字,或4-14个字符(数字、字母和“_”)


2010-06-25 16:44提问者采纳
([\u4e00-\u9fa5]{2,7})|([A-Za-z0-9 ]{4,14})
其中([\u4e00-\u9fa5]{2,7})匹配2-7个汉字
([A-Za-z0-9 ]{4,14})匹配4-14个字符

---------------------------------------------------
求正则表达式:要求匹配:字母,数字,下划线,汉字和双字节字符

如题。要求匹配:字母,数字,下划线,汉字和双字节字符,并且下划线不能在第一位和最后一位
不对。双字节有问题


让我好找啊,特别是汉字匹配,给你了:

^[^_][a-zA-Z0-9_\u4e00-\u9fa5][^_]$

如果是任意多个字符可在外面加限定符,如:

^[^_][a-zA-Z0-9_\u4e00-\u9fa5]*[^_]$


=====================================================

求验证字母、数字、汉字、邮箱字符的正则表达式

我知道下面这个是验证字母、数字、邮箱的
pattern = /^[A-Za-z0-9_@.-]{4,20}$/;
查出验证汉字是 \u4e00-\u9fa5  ,怎样加加进去呢?

我自己找到答案了
我这样写/^[A-Za-z0-9_@.\u4e00-\u9fa5]{4,20}$/

<script type="text/javascript">
    var pattern = /^[A-Za-z0-9_@.-]{4,20}$/;
    alert(pattern .test('test@zhaoxi.net'));
 //汉字同理
  </script>

CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,