标题:
rc1+黑名单问题研究
[打印本页]
作者:
idn
时间:
2007-3-31 13:42
标题:
rc1+黑名单问题研究
正则表达式中凡是使用非贪婪模式并且重复的,都会极大影响浏览速度
例如这条:#exd#*86zw.com*#<IFRAME id=("p180"|yahoo|MooterMedia)
(?:.|\n)*?
>
<\/iframe>###<!--by idn-->
或者置顶里面的那条#ex#<!--ads begin-->
(?:.|\n)*?
<!--ads end-->###
其中带有
(?:.|\n)*?
这种非贪婪重复匹配模式,你会发现浏览时浏览器会发呆几秒钟,大家试试看,是不是这么回事
不好意思,少写了个括号,已改正
[
本帖最后由 idn 于 2007-3-31 14:00 编辑
]
作者:
mutalisker
时间:
2007-3-31 14:57
楼主的建议改进方式是?
作者:
fratre
时间:
2007-3-31 16:09
也许可以考虑测试一下使用别的正则表达式解析引擎。当然,就算要试试,这也应该是2.5或3.0版的事了。
我一直有个问题想问,就是为什么用微软组件提供的vbs/js的正式表达式解析?
我想好处就是:
增加正式表达式的支持而主程序大小变化不大
但是微软提供的这个正式表达式的解析性能并不是太好,这是与pcre相比,如果与这里(
http://swtch.com/~rsc/regexp/regexp1.html
)相比就更不用说了。
等到2.0版正式推出了,开发人员有空了,可以考虑在以后的版本中尝试一下,看看对性能的影响到底有多大。
作者:
wdpfox
时间:
2007-3-31 18:13
不用正则表达式,浏览速度会很流畅!请网友试试!
欢迎光临 世界之窗论坛 (http://bbs.theworld.cn./)
Powered by Discuz! 7.2