标题:
正则表达式怎么写?
[打印本页]
作者:
okseek
时间:
2009-3-20 03:00
标题:
正则表达式怎么写?
我经常网上看小说 常去的小说站广告的源代码如下:
<script language='JavaScript' type='text/javascript' src='http://cpro.baidu.com/cpro/ui/cp.js'></script>
有多个类似的,不同的只是src=""里面的js路径而已,
本人对正则表达式不熟,请大家帮忙写个通用的可过滤这种类型的正则表达式,
谢谢!
作者:
needed
时间:
2009-3-20 09:41
本帖最后由 needed 于 2009-3-20 09:45 编辑
#exd#*
常去的小说站url
*#<script[^>]+?src=[\s\S]+?
这里写你想匹配的关键字[^<]+<\/script>
###这里是过滤后的字符,可空
上面的方法为tw2 提供独有的正则.
如果觉得不习惯, tw2同时提供了tw1.x方式过滤. 详细
可浏览
http://bbs.ioage.com/cn/thread-68858-1-1.html
作者:
okseek
时间:
2009-3-21 16:48
可以用
万分感谢!
作者:
okseek
时间:
2009-3-21 17:20
本帖最后由 okseek 于 2009-3-21 17:28 编辑
有的还是不行啊
我黑名单中是这样设置的:
#exd#*.changjiangzhongwen.*#<script[^>]+?src=[\s\S]+?baidu[^<]+<\/script>###过滤的百度广告
#exd#*.changjiangzhongwen.*#<script[^>]+?src=[\s\S]+?googlesyndication[^<]+<\/script>###过滤的google广告
#exd#*.changjiangzhongwen.*#<script[^>]+?src=[\s\S]+?alimama[^<]+<\/script>###过滤的alimama广告
#exd#*.changjiangzhongwen.*#<script[^>]+?src=[\s\S]+?gonggao[^<]+<\/script>###过滤的长江中文广告
#exd#*.changjiangzhongwen.*#<script[^>]+?src=[\s\S]+?ads[^<]+<\/script>###过滤的长江中文广告
#exd#*.changjiangzhongwen.*#<a[^>]*?ads[^>]*?>[\s\S]*?<\/a>###<!--Ad blocked by TheWorld2-->
#exd#*.changjiangzhongwen.*#<a[^>]*?gonggao[^>]*?>[\s\S]*?<\/a>###<!--Ad blocked by TheWorld2-->
小说站首页:
http://www.changjiangzhongwen.com/
可以正常过滤了
但具体看某篇小说的章节时,如
http://www.changjiangzhongwen.com/xiaoshuo/7/7712/2122078.html
就没作用了
章节中源代码应该是类似<script type="text/javascript" src="/ads/top.js"></script>
<script type="text/javascript" src="/ads/zhangjie/2.js"></script>
<script type="text/javascript" src="http://www.changjiangzhongwen.com/gonggao.js"></script>这样的多个
我用ads gonggao等怎么过滤不掉呢?
请再帮帮忙吧,我对正则表达式很菜
我知道在过滤列表中直接写
http://www.changjiangzhongwen.com/gonggao.js
就可以过滤掉这个js文件,但这样就要具体写上每个广告的js,我就想用正则写个通用的
作者:
needed
时间:
2009-3-21 19:25
#exd#*
www.changjiangzhongwen.com
*#<script[^>]+?ads[^<]*?<\/script>###过滤的长江中文广告
测试通过.
不过我还是强烈建议楼主添加置顶的基础黑名单.
因为那毕竟是版主辛辛苦苦的心血. 一定有它的价值.
作者:
okseek
时间:
2009-3-26 23:35
谢谢!真的很感激!
因为我平常上网主要就只看看小说,而且几乎就是去长江中文这一家,其他的都没怎么去,所以不用基础黑名单,我就想有个针对长江中文的过滤就好了,省点资源。
而且 广告有时也是一种信息,因此如果有浏览其他网站时我觉得广告还是可以接受的,说不定哪天就从中有啥意外发现呢。
只是一些个人观点不同,呵呵,谢谢needed啦!
作者:
needed
时间:
2009-3-27 16:32
呵呵.. 有意思..
其实我也很少过滤广告 . 除非是严重影响阅读跟速度的..
作者:
极品小猫
时间:
2009-3-29 10:41
大部分网站的广告都是大量的图片以及大型Flash~那应该都是很影响速度吧?
小的就那霏凡举例,顶部的广告一定要加载完才能看到下面的内容,这很烦人~网速不好的时候要等半天
作者:
needed
时间:
2009-3-31 07:43
100M光纤的路过..
作者:
极品小猫
时间:
2009-3-31 13:16
BS一个
欢迎光临 世界之窗论坛 (http://bbs.theworld.cn./)
Powered by Discuz! 7.2