按键精灵_正则匹配的提取你想要的内容

举个例子,我们在做接码案例的时候会收到验证码,“【某某app】验证码:8456,请注意保管好您验证码,请勿泄露!”,对于这段内容,我们希望提取里面的数字验证码,这个时候就用到正则匹配的方法。

按键精灵安卓版提取你想要的内容(正则匹配的简单介绍)

Import “shanhai.lua”

Dim 验证码短信=”【某某app】验证码:8456,请注意保管好您验证码,请勿泄露!”

Dim 验证码=shanhai.RegexFind(验证码短信,”%d%d%d%d”)

TracePrint 验证码(0)

这里面用到了山海插件的RegexFind命令,它是基于lua语言的正则表达式命令,之后我讲解基本都是在这个命令的基础上完成的。

上面例子中shanhai.RegexFind(验证码短信,”%d%d%d%d”),有两个参数,一个是验证码短信,也就是我们说的复杂内容,这个就不用多说,重点是第二个参数,这里我们单独提出来看看。

%d%d%d%d,这是4个%d,对于我们要提取的内容:4位数字的验证码,依据我们的经验,%d应该是代表一个数字。如果你要提取一个6位数字,那么就写6个%d。

对于不确定数字个数的情况,可以%d+

+代表匹配之前字符一次或者多次。

我们代码中调试输出是TracePrint 验证码(0),后面有(0),说明正则匹配的返回值是一个数组。对于数组来说,我们要写上数组下标。

Import “shanhai.lua”

Dim 验证码短信=”【某某app】验证码:8456,请注意保管好您验证码,请勿泄露!”

Dim 验证码=shanhai.RegexFind(验证码短信,”%d+”)

TracePrint 验证码(0)

由于内容只有一段数字,所以这样写%d+也是可以的。但是如果有两段或者多段数字,那么就会把所有的数字都提取出来,如下图

按键精灵安卓版提取你想要的内容(正则匹配的简单介绍)

这种情况,验证码(0)是1,验证码(1)是8456,你可以直接调用 验证码(1),获取验证码。需要注意的%d+并不是把所有的数字连在一起输出,而是分段的,连续数字是一组。

不知道大家还记不记得我之前提取中文的案例:

按键精灵安卓版提取你想要的内容(正则匹配的简单介绍)

Dim m=”你好囧犇hello 水电费world3aasdas50849638″

Dim 汉字

Import “shanhai.lua”

Dim s=shanhai.RegexFind(m,”[\128-\254]+”)

TracePrint s(0)

For i = 0 To UBOUND(s)

汉字=汉字&s(i)

Next

TracePrint 汉字

这里边的[\128-\254]表示ascii码的128-254,[]也是比较特殊的,代表字符集。比如想写数字,可以写成[0-9]

按键精灵安卓版提取你想要的内容(正则匹配的简单介绍)

除了提取验证码,其实还有一个内容我们也比较常用,提取界面xml的内容。举个例子:提取界面当中所有APP的名称。

按键精灵安卓版提取你想要的内容(正则匹配的简单介绍)

Import "shanhai.lua"
Dim m=shanhai.getuixml()
TracePrint m
Dim arr=shanhai.RegexFind(m,"text=""(.-)""")
For Each k In arr
TracePrint k
Next

还是单独把正则表达式拿出来text=””(.-)””

这里边好多引号,这个又涉及到一个知识点,按键精灵的转义字符引号,特别强调一下是按键精灵的,因为正则表达式的转义字符是%

在xml里面,是这样的格式 text=”系统应用”

引号比较特殊,需要在引号前面加一个引号,也就是如果想要在按键里显示上面的内容就要变成text=””系统应用””

对于初学者来说是比较乱的,因为还涉及到字符串本身带有的一对引号,那么整体看来就好多引号了。

关于引号这部分能明白最好,不明白也没关系,以后慢慢学吧,接着往下说,表达式text=””(.-)””里面的括号是用来捕获你需要提取出来的内容。

我们想想要提取text=””系统应用””里面的系统应用几个字,那么对于表达式text=””(.-)””,括号里面就是我们想要的内容。

在继续分析 .-这两个也是比较特殊的符号,点是代表所有字符,减号是代表匹配一次或者多次,在之前我们说到加号了,看起来作用一样,但是区别在于,减号是最少匹配。点代表所有字符,也就是我们匹配text=”系统应用”引号中的全部内容,如果用.+的话,就会匹配到最后一个引号位置。

比如,text=”系统应用”,text=”QQ”,

匹配的结果就是 系统应用”,text=”QQ

上面的方法还有一个问题,就是会有很多空白内容输出,这是因为,有些text=””,本身它就是空值,所以就会输出空白。

真的这种情况,换一种写法。

按键精灵安卓版提取你想要的内容(正则匹配的简单介绍)

Import "shanhai.lua"
Dim m=shanhai.getuixml()
TracePrint m
Dim arr=shanhai.RegexFind(m,"text=""([^""]+)")
For Each k In arr
TracePrint k
Next

这种写法中涉及到 ^ 这个符号是“非”的意思,也就说说这段正则表达式,是匹配非引号的多个字符,我们看到text=””这种情况,引号里面没有内容,第一个引号后面跟的是第二个引号,所以不符合我们我说的非引号匹配方式被排除了。

 

赞 (0)