登录注册写文章

Unicode编码及在正则表达式中的使用

Unicode编码及在正则表达式中的使用

原文 http://www.zuojj.com/archives/1074.html

今天日文版本项目中用户名校验有一个这样的需求：“匹配1-15位的半角英文字母和数字，连字符，下划线与全角日语”。看到这个需求时感觉还真是变态哈，全角、半角的看着很不适应，无奈在google、baidu上来查找。

一、解决问题

首先来看看半角英文字母和数字的Unicode编码范围：

0-9：\u0030-\u0039

A-Z：\u0041-\u005a

a-z ：\u0061-\u007a

连字符和下划线不用多说“-_”
全角日语

这个比较搞人，首先日语中包含部分汉字、日文平假名、日文片假名。

全部汉字：\u4E00 – \u9FBF

全角平仮名：\u3040 – \u309F

全角片仮名：\u30A0 – \u30FF

但是这个汉字的Unicode编码还是不太准确的。

综上，可以写出正则表达式来判断：

var pattern = /^[\u0030-\u0039\u0041-\u005a\u0061-\u007a\u3040-\u309F\u30A0-\u30FF\u4E00-\u9FBF\-_]{1,15}$/,
 result  = pattern.test(value);

二、字符范围

半角字符：

半角拉丁字符u0000 – u00FF

半角日语字符uFF61 – uFF9F

半角其他字符uFFE8 – uFFEE

全角字符：

全角数字(0-9) uFF10 – uFF19

全角大英字(A-Z): uFF21 – uFF3A

全角小英字(a-z): uFF41 – uFF5A

全角平仮名：u3040 – u309F全角片仮名：u30A0 – u30FF

全角Latin: uFF01 – uFF5E全角Symbol: uFFE0 – uFFE5

最后编辑于：2017.12.04 05:50:13

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

iOS中的正则表达式简单使用
最近手上要求匹配日语各种片假名平假名的半角全角，第一次弄这个，各种尴尬，在网上查阅了很多资料，不忙了总结一下，还望...
小小小小小小米阅读 4,408评论 0赞 1
ASCII、Unicode、GBK和UTF-8字符编码的那些事
0x01 首先了解一下ASCII、GBK 和Unicode、UTF-8字符编码的那些事 ( 摘自网络流传甚广的一个...
法加尔阅读 3,964评论 0赞 12

20170330
时间一天天过去，来这之前想的事情一家都没办，今晚去买酒，看到有快递包我就问这能收到快递吗？他们说能，回来下琢磨...
烟花雨下的诺言阅读 1,085评论 0赞 0
05.ASDK整理：ASViewController使用注意
不能直接需要初始化指定一个DisplayNode，所以创建一个控制器继承 ASViewController，然后...
黄x黄阅读 4,155评论 0赞 0
红色血液里的倔强
小时候看着身边的叔叔们 ...
卢以祥阅读 1,924评论 0赞 0

1赞2赞

赞赏

手机看全文