【摘要】
多个市场要求无线4g网管全面支持ipv6,在开发过程中,遇到大量需要做ipv6校验的地方,本文通过正则表达式解决ipv6校验的问题,来介绍正则表达式最基本的用法,帮助大家入门,打消对正则表达式的心理恐惧。
【关键词】
ipv6,正则表达式
1背景
在学习正则表达式时,有一个美式笑话:
“some people, when confronted with a problem, think“i know, i’ll use regular expressions.”now they have two problems.”
当你意识到一个问题可以用正则表达式来解决时,你就有两个问题了,因为正则表达式本身就是一个big problem。2012年6月6日,全球范围内的ipv6网络正式启动,ipv6的应用已经是大势所趋。本文通过正则表达式解决ipv6校验的问题,来介绍正则表达式最基本的用法,帮助大家入门。
正则表达式(regular expressions)本质上是一个微小的且高度专业化的编程语言,它被嵌入到高级语言中供程序员使用。正则表达式通过指定一些规则来描述那些你希望匹配的字符串集合,比如email地址,ip地址。正则表达式的强大之处在于一些特殊符号的应用,特殊符号定义了字符集合、子组匹配、模式重复次数。如果没有这些特殊字符,正则表达式就和大多数文本编辑器中的ctrl+f一样平庸,仅仅只是匹配纯字符而已。
2实践情况
2.1正则表达式特殊字符说明
正则字符包括保留字(. ^ $ * + ? { } [ ] ( ) \ |)和其它字符,下面列出最常用的正则表达式特殊字符的详细含义:
下边列举了由字符'\'和另一个字符组成的特殊含义。注意,'\' +元字符的组合可以解除元字符的特殊功能
2.2正则表达式特殊字符的4个角色
为方便记忆,可以按字符的功能,分为4个角色:
2.3常用正则表达式
2.4正则表达式在高级语言中的应用
以python中的re模块和java中的java.util.regex为例,做一个对比,展示正则表达式在高级语言中的一些常用用法。
2.5ipv4表示法
ip地址的长度为32b(bit),分为4段,每段8位,用十进制数字表示,每段数字范围为0~255,段与段之间用英文句点“.”隔开。例如:某台计算机ip地址为111.22.33.4。
分析ip地址的组成特点:250-255、200-249、0-199。这三种情况可以分开考虑:
250-255:三位数,百位是2,十位是5,个位是0~5,用正则表达式可以写成:25[0-5]
200-249:三位数,百位是2,十位是0~4,个位是0~9,用正则表达式可以写成:2[0-4]\d
0-199:这个可以继续分拆:
l0-9: 一位数,个位是0~9,用正则表达式可以写成:\d
l10-99:二位数,十位是1~9,个位是0~9,用正则表达式可以写成:[1-9]\d
l100-199:三位数,百位是1,十位是0~9,个位是0~9,用正则表达式可以写成:1\d{2}
于是0-99的正则表达式可以合写为[1-9]?\d,那么0-199用正则表达式就可以写成(1\d{2})|([1-9]?\d),这样0~255的正则表达式就可以写成(25[0-5]|2[0-4]\d|((1\d{2})|([1-9]?\d)))
最后,后面3段加上句点.可以使用{3}重复得到,得到ip地址的正则表达式,可以写成如下形式,2种均可:
2.6ipv6表示法
ipv6的地址长度为128b(bit),是ipv4地址长度的4倍。采用十六进制表示。ipv6有3种表示方法:
分析ipv6地址的特点,可以归纳如下:
标准十六进制表示法(包括前导0省略)
纯数字格式:
([0-9a-fa-f]{1,4}:){7}([0-9a-fa-f]{1,4}|:)
2001:0008:0009:0023:0008:0800:8888:9999
纯字母格式:
abcd:abcd:abcd:abcd:abcd:abcd:abcd:abcd
数字和字母混合格式:
abcd:ef01:2345:6789:abcd:ef01:2345:6789
格式中前面带0:
2001:0db8:0000:0023:0008:0800:200c:417a
格式中前面每一位为0:
0001:0db8:0000:0023:0008:0800:000c:017a
全0:
0000:0000:0000:0000:0000:0000:0000:0000
多位0在中间:如fec0:1:0:0:0:0:0:1234
多位0在前面:如0:0:0:0:0:1234:fec0:1
多位0在最后:如1234:fec0:1:0:0:0:0:0
全0:0:0:0:0:0:0:0:0
全0:0:000:0:0:0:0:0:0
全0:0:00:0:0:0:0:0:0
全0:0:0000:0:0:0:0:0:0
前导0省略位置遍历
1个位置前导0省略:
abcd:ef01:2345:6789:abcd:ef01:2345:1
abcd:ef01:2345:6789:abcd:ef01:2:9999
abcd:ef01:2345:6789:abcd:2:ef01:9999
abcd:ef01:2345:6789:2:abcd:ef01:9999
abcd:ef01:2345:2:6789:abcd:ef01:9999
abcd:ef01:2:2345:6789:abcd:ef01:9999
abcd:2:ef01:2345:6789:abcd:ef01:9999
2:abcd:ef01:2345:6789:abcd:ef01:9999
其他前导0省略情况:
89:db8:0:23:8:800:c:417
89:db8:0:23:8:800:0c:417
89:db8:0:23:8:800:00c:417
89:db8:0:23:8:800:000c:417
2001:db8:0:23:8:800:000c:417a
0位压缩表示法
abcd:ef01:2345:6789:abcd:ef01:8.8.8.9
(([0-9a-fa-f]{1,4}:){6}(((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|:[0-9a-fa-f]{1,4}|:))
(左起有6个位置用标准16进制表示)
abcd:ef01:2345:6789:abcd:ef01::ef01
abcd:ef01:2345:6789:abcd:ef01::
0位压缩表示法
abcd:ef01:2345:6789:abcd::8.8.8.9
(([0-9a-fa-f]{1,4}:){5}(:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|((:[0-9a-fa-f]{1,4}){1,2})|:))
(左起有5个位置用标准16进制表示)
abcd:ef01:2345:6789:abcd::ef01
abcd:ef01:2345:6789:abcd::ef01:ef01
abcd:ef01:2345:6789:abcd::
0位压缩表示法
abcd:ef01:2345:6789::ef01:8.8.8.9
(([0-9a-fa-f]{1,4}:){4}(((:[0-9a-fa-f]{1,4})?:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|((:[0-9a-fa-f]{1,4}){1,3})|:))
(左起有4个位置用标准16进制表示)
abcd:ef01:2345:6789::8.8.8.9
abcd:ef01:2345:6789::ef01
abcd:ef01:2345:6789::ef01:ef01
abcd:ef01:2345:6789::ef01:ef01:ef01
abcd:ef01:2345:6789::
0位压缩表示法
abcd:ef01:2345::8.8.8.9
(([0-9a-fa-f]{1,4}:){3}(((:[0-9a-fa-f]{1,4}){0,2}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|((:[0-9a-fa-f]{1,4}){1,4})|:))
(左起有3个位置用标准16进制表示)
abcd:ef01:2345::ef01:8.8.8.9
abcd:ef01:2345::ef01:ef01:8.8.8.9
abcd:ef01:2345::ef01
abcd:ef01:2345::ef01:ef01
abcd:ef01:2345::ef01:ef01:ef01
abcd:ef01:2345::ef01:ef01:ef01:ef01
abcd:ef01:2345::
0位压缩表示法
abcd:ef01::8.8.8.9
(([0-9a-fa-f]{1,4}:){2}(((:[0-9a-fa-f]{1,4}){0,3}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|((:[0-9a-fa-f]{1,4}){1,5})|:))
(左起有2个位置用标准16进制表示)
abcd:ef01::ef01:8.8.8.9
abcd:ef01::ef01:ef01:8.8.8.9
abcd:ef01::ef01:ef01:ef01:8.8.8.9
abcd:ef01::ef01
abcd:ef01::ef01:ef01
abcd:ef01::ef01:ef01:ef01
abcd:ef01::ef01:ef01:ef01:ef01
abcd:ef01::ef01:ef01:ef01:ef01:ef01
abcd:ef01::
0位压缩表示法
abcd::8.8.8.9
(([0-9a-fa-f]{1,4}:){1}(((:[0-9a-fa-f]{1,4}){0,4}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|((:[0-9a-fa-f]{1,4}){1,6})|:))
(左起有1个位置用标准16进制表示)
abcd::ef01:8.8.8.9
abcd::ef01:ef01:8.8.8.9
abcd::ef01:ef01:ef01:8.8.8.9
abcd::ef01:ef01:ef01:ef01:8.8.8.9
abcd::ef01
abcd::ef01:ef01
abcd::ef01:ef01:ef01
abcd::ef01:ef01:ef01:ef01
abcd::ef01:ef01:ef01:ef01:ef01
abcd::ef01:ef01:ef01:ef01:ef01:ef01
abcd::
0位压缩表示法
::8.8.8.9
(:(((:[0-9a-fa-f]{1,4}){0,5}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|((:[0-9a-fa-f]{1,4}){1,7})|:))
(左起开始压缩)
::ef01:8.8.8.9
::ef01:ef01:8.8.8.9
::ef01:ef01:ef01:8.8.8.9
::ef01:ef01:ef01:ef01:8.8.8.9
::ef01:ef01:ef01:ef01:ef01:8.8.8.9
::ef01
::ef01:ef01
::ef01:ef01:ef01
::ef01:ef01:ef01:ef01
::ef01:ef01:ef01:ef01:ef01
::ef01:ef01:ef01:ef01:ef01:ef01
::ef01:ef01:ef01:ef01:ef01:ef01:ef01
::
综上,得出ipv6地址的完整正则表达式为:
3效果评价
对于日常开发中只接触ipv4,并没有深入研究过正则表达式的开发者,面对ipv6和正则表达式,容易产生畏惧心理,觉得是两座难以翻越的大山。本文通过一些表格整理对ipv6的表示方法,以及正则表达式的特殊符号进行了分类和说明,带领大家快速入门ipv6和正则表达式。
4推广建议
本文所述ipv6正则表达式已经过测试,可以直接拿到各个高级语言中应用。
2030全球车载传感器市场将超500亿美元
第二届“先导杯”计算应用大奖赛正式启幕
三相异步电动机能耗制动原理
CL2000变电站综合自动化系统的设计及通信解决方案
小米6曝光:配置残暴,还有陶瓷版!
快速入门IPv6和正则表达式
iPhone7/7plus都涨价了!iPhone7国行版5388元32G起步
DSO9254A数字示波器4通道2.5GHz
牛津大学研发出新型存储单元,助力实现芯片级光通信
谷歌携手微软揭开人工智能网络的神秘面纱
iPhone 14系列手机将推出新的配色
Cirrus Logic宣布同意收购Lion Semiconductor
铝壳气体耐压爆破两不误,新能源动力电池壳体测试设备全面升级
设计经验谈:模拟地与信号地的区别
卡尔曼滤波的总结和思维扩展
剖析子项空间技术的低复杂度FIR滤波器实现
传音拍照专利解决人体肤色差异
这次换亚菲特克莱斯勒的汽车排放作假连环爆
除了谷歌“亲儿子” 还有Galaxy S8、诺基亚8...这些手机都能升级Android 8.0
华为收到美国商务部传票 聚焦向制裁国家出口技术问题