Board logo

标题: [过滤规则] cnBeta.com第三版过滤规则(2008-12-19更新) [打印本页]

作者: 285900537    时间: 2007-12-17 18:49     标题: cnBeta.com第三版过滤规则(2008-12-19更新)

cnBeta.com过滤规则(2008-12-19更新)

【目前尚处于测试状态】
请将cnBeta.rar或cnBetaV2.rar解压缩后放入filter\cnbeta\文件夹内。
|--theworld.exe
|--filter
     |--cnbeta
          |--cnBetaSearcherV2.js

cnBeta.com V3.1 规则

  1. #exd#*cnbeta.com*#<center>[\s\S]*?<\/center>###
  2. #exd#*cnbeta.com*#<em>[\s\S]*?<\/em>###
  3. #exd#*cnbeta.com*#<div[^>]*?(?:c_ad|AdForward|comad)[^>]*?>[\s\S]*?<\/div>###
  4. #exd#*cnbeta.com*#(var )?(?:alimama|google)_[^\n]*?;###
  5. #exd#*cnbeta.com*#<div[^>]*?userInfo">[\s\S]*?<\/div>###<script type="text/javascript" src="$tw2f://cnbeta/cnBetaSearcherV2.js"></script>
  6. #exd#*cnbeta.com*#<div[^>]*?searcher">[\s\S]*?end fm_r -->###
  7. #exd#*cnbeta.com*#<script[^>]*?(?:alimama|googlesy)[^<]*?<\/script>###
  8. #exd#*cnbeta.com*#<a[^>]*?go\.maxreturn[\s\S]*?><\/a>###
  9. #exd#*cnbeta.com*#<div[^>]*?votes">\n[^\n]*?(?:赞|软|链)[\s\S]*?<!-- end (?:vote|推介) -->###
复制代码


须下载脚本替换文件,V3/V3.1规则使用V2的脚本替换文件,如已经下载过,则无须再下载了。

[ 本帖最后由 285900537 于 2008-12-19 21:59 编辑 ]
作者: tinham    时间: 2007-12-17 19:36

楼主写的没有页面重排的
作者: elkay    时间: 2007-12-18 01:13

楼主很用心,这个规则是我见到过得规则中拥有最长替换串的,想法很好,加分以示鼓励



ps:今后在过滤区发布规则,或者帮忙解答问题的我会视具体情况加分。
作者: qionglaoer    时间: 2007-12-18 14:40

我晕,这规则也太长了吧,不如E大的精简
作者: 285900537    时间: 2007-12-18 22:57

更新了,基本上不会再有问题了

filter文件的使用方法是放入filter文件夹内

|--theworld.exe
|--filter
      |--cnbeta
              |--cnbetasearcher.js
作者: micrian    时间: 2007-12-18 23:14

怎么右上角还是那样啊
作者: micrian    时间: 2007-12-18 23:17

加了这些正常了
src="$tw2f://cnbeta/cnBetaSearcher.js"></script>
http://www.cnbeta.com/images/admaxthon.png
#exd#*cnbeta.com*#(?:<!--[^>]|<div>[^>]id="searcher">\n[^\n]*?)<form[^\n]*?(\.\.\/)?search\.php[\s\S]*?(??:所有|软件|业界|互动)新闻|新闻(?:标题|摘要|扩展))\n[^\n]<\/form>(?:\n[^\n]<\/div>|[\s\S]-->)###
#exd#*cnbeta.com*#<div[^>]*?id="fm_r">[\s\S]*?class="midBlock">(?:赞助商|广告位|Google广告|软件推介|推荐使用|推介使用|软件推荐)([\s\S]*?<\/div>){7}###
#exd#*cnbeta.com*#<!-- SiteSearch Google -->[\s\S]*?<!-- SiteSearch Google -->###
作者: duckZCX    时间: 2007-12-19 01:27

过滤的非常完美,个人非常喜欢
楼主的钻研精神很激励人。
作者: Jazz.Hsu    时间: 2007-12-19 15:48

很清爽了。

速度变慢好多。。。
作者: elkay    时间: 2007-12-20 20:47

用白名单吧,你的页面里无法显示的图片链接如下

http://blogs.technet.com/blogfiles/curiousgeorge/WindowsLiveWriter/WindowsVistaShowcase_AD50/IMAGE_074_thumb.jpg

红色部分加入白名单即可,因为图片链接疑似广告,所以被黑名单拦截了,只能用白名单修正,改动黑名单会造成其他广告无法过滤的情况

  1. @@*/WindowsVistaShowcase_AD50/*
复制代码

[ 本帖最后由 elkay 于 2007-12-20 20:51 编辑 ]
作者: googune    时间: 2007-12-22 10:35

用了 基本没感觉啊,用默认的过滤代码就可以过滤了啊。
作者: 285900537    时间: 2008-1-7 13:27

2008年1月7日更新了
作者: 285900537    时间: 2008-1-21 16:51

2008年1月21日更新了,祝大家使用愉快:)
作者: jym2005    时间: 2008-1-21 22:00

提示: 作者被禁止或删除 内容自动屏蔽
作者: 11021016    时间: 2008-1-23 22:57

http://www.cnbeta.com/articles/47721.htm
这个好像还是不太干净
作者: 285900537    时间: 2008-1-31 00:09

重写全部规则,精简了50%,重新提供了js替代脚本,欢迎使用:)
作者: greenmoon55    时间: 2008-2-4 11:41

不错,但是有的阿里妈妈广告过滤后显示#exd#*cnbeta.com*#(var )?(?:google|alimama)_[^\n]*?;###,而不显示AD。
作者: 285900537    时间: 2008-2-4 14:07     标题: 回复 17# 的帖子

不会吧。。。。。截个图看看。。。我没遇到类似情况的说。。。
作者: spokeo    时间: 2008-2-4 18:20

添加搜索框之后,搜索框变形了~~
[attach]39623[/attach]
作者: 285900537    时间: 2008-2-4 18:58     标题: 回复 19# 的帖子

能够重现,并找到原因了。
请按照如下步骤操作:
查看(V) > 文字大小(X) > 中等(M)

上图造成的变形原因是选择了“较大”或“最大”所造成的。请选择“中等”即可恢复原状。
作者: spokeo    时间: 2008-2-4 23:42

谢谢楼主,现在正常了~~
作者: lucent2005    时间: 2008-2-22 13:45

现在又过滤不了了,CB广告换位置了。


刚才又上了一下,又好了。。。郁闷中

[ 本帖最后由 lucent2005 于 2008-2-22 15:35 编辑 ]
作者: only7    时间: 2008-2-24 21:31

CB的搜索引擎已经由Google变为Baidu,楼主能更新下吗?
否则可能会出现问题~~

[ 本帖最后由 only7 于 2008-2-24 21:37 编辑 ]
作者: vcAngel    时间: 2008-3-12 00:07

全部采用了~网站干干净净的~多谢分享规则
作者: 285900537    时间: 2008-3-19 16:34

最近CB加了新广告,规则已升级
作者: qionglaoer    时间: 2008-3-19 22:54

谢谢楼主,这次的过滤真的太霸道了,爽!
作者: jeccci5    时间: 2008-3-22 09:27

太好了,cb现在广告真是多阿
作者: cvintheworld    时间: 2008-3-27 09:31

哇……用了lz的filter后发现世界清净多了。
谢谢了
作者: yujack7    时间: 2008-4-24 23:47

#exd#*cnbeta.com*#<div[^>]*?id="(?:c_ad|ADtext|searcher[\s\S]*?<!-- end fm_r)[\s\S]*?<\/div>###
用了这条规则后,首页上的“DIG版 ,软件版, 业界版, 互动版”这些按钮点击后都不能显示页面了。我“试验”发现如果稍微改动一下,分成下面两条规则就正常了。
#exd#*cnbeta.com*#<div[^>]*?id="(?:c_ad|ADtext[\s\S]*?good[\s\S]*?nocomment[\s\S]*?<\/div>)[\s\S]*?<\/div>###
#exd#*cnbeta.com*#<div[^>]*?id="fm_r">[\s\S]*?<\/div>[^\n]*?<!-- end fm_r -->###
当然,我不懂正则,完全是瞎蒙。
希望楼主用更简练的规则替换一下。
作者: 11021016    时间: 2008-4-25 16:40

确实是
我已经按楼上说的改了
很奇怪的问题啊
作者: 11021016    时间: 2008-4-25 19:36

  1. #exd#*cnbeta.com*#<iframe id="baiduSpFrame"[\s\S]*?</iframe>
复制代码
好像还要加上这个
作者: hnist    时间: 2008-4-27 07:33

CN没有什么广告,可以接受。
作者: 285900537    时间: 2008-4-27 08:58     标题: 回复 29# 的帖子

nocomment不能作为关键字 。因为 nocomment出现的情况是:当没有热门评论出现的时候,才会出现 div id="nocomment",如果按照你的过滤方式,可能出现一些问题。

我现在在学校机房里用 fedora,不能使用theworld,我今晚用windows的时候再看看 。

最近一段时间有点事情,所以一直没有做filte,万分抱歉 。

今天晚上我会维护一下cnbeta和起点中文网的filte(将删除 cmfu的规则)。

将来的两个月里我可能会更加忙,周六周日还需要在学校里面学习嵌入式开发,所以可能会有相当大的一段时间内不能些新的规则。

:lol:
作者: 285900537    时间: 2008-4-27 09:04     标题: 回复 31# 的帖子

这个百度的广告在我这里貌似没有,我会在今天晚上看看。

我些规则的时候,cnbeta使用的是google的服务。。。
作者: yujack7    时间: 2008-4-27 23:37

嗯,刚才又“试验”了一下,看来似乎是楼主搞错了一个“)”的位置。
原来的:
#exd#*cnbeta.com*#<div[^>]*?id="(?:c_ad|ADtext|searcher[\s\S]*?<!-- end fm_r)[\s\S]*?<\/div>###
改动后(能正常显示页面了):
#exd#*cnbeta.com*#<div[^>]*?id="(?:c_ad|ADtext|searcher[\s\S]*?)<!-- end fm_r[\s\S]*?<\/div>###
作者: 285900537    时间: 2008-4-28 00:47     标题: 回复 35# 的帖子

下午小叔子结婚,取消了下午去展览中心参观上海教育展的行程,直接赶回家,然后前去金外滩宾馆,一直搞到现在才到家,明天还要一早去学校,我晕了。。。


PS:今天这天实在是太热了。。。
作者: klgd    时间: 2008-5-31 15:23

现在广告又有变化了~
作者: 285900537    时间: 2008-6-2 11:02

收到~~本周末之前更新.

因为全局规则对某些网站的杀伤性太大(导致某些网站根本没法浏览或访问),所以我以后的规则将推出两个版本,即与全局规则配合使用版本和独立版本(我本人大概暂时不会使用全局规则了...)
作者: 285900537    时间: 2008-6-8 23:08

CB广告没有大变化,新增的一出广告可以依靠通用规则杀除。
作者: 285900537    时间: 2008-7-8 14:15

V3版本以更新,替换脚本无需下载。

4条规则有变化,请更新的时候注意。
作者: jym2005    时间: 2008-7-9 17:45

提示: 作者被禁止或删除 内容自动屏蔽
作者: 285900537    时间: 2008-7-9 23:12

正是此三处广告,可能我是把V2规则发上来了。。。因为我这里各版本都有存档。。。。
作者: jym2005    时间: 2008-7-11 21:53

提示: 作者被禁止或删除 内容自动屏蔽
作者: 285900537    时间: 2008-7-23 14:40

第三版已经更新:)
作者: 99792    时间: 2008-7-23 19:41

为何V3不提供脚本下载了
作者: 285900537    时间: 2008-7-23 20:37

原帖由 99792 于 2008-7-23 19:41 发表 http://bbs.ioage.com/cn/images/common/back.gif
为何V3不提供脚本下载了



V3依旧使用V2的那个文件,没有改动。
作者: tinham    时间: 2008-7-24 20:27

用了感觉不错
作者: tinham    时间: 2008-7-25 10:58

兄弟有没有兴趣写一下新浪的过滤规则
作者: 285900537    时间: 2008-7-25 13:54     标题: 回复 48# tinham 的帖子

新浪的规则转帖不是已经有了嘛~~
作者: tinham    时间: 2008-7-26 12:55

新浪的过滤基本上大部分过滤不了
作者: yujack7    时间: 2008-7-28 07:50

过滤得很清爽
作者: klgd    时间: 2008-10-3 16:24

好像规则有无效了~
作者: zshstc    时间: 2008-10-21 14:55

为什么看不见评论了.......
作者: drvwst    时间: 2008-10-30 15:51

我用了【cnBeta.com V3 基础版过滤规则(最佳效率)】
效果果然好,干干净净的
作者: 想唱歌    时间: 2008-11-7 14:16

提示: 作者被禁止或删除 内容自动屏蔽
作者: 懒觉    时间: 2008-11-12 16:57

貌似把评论给过滤掉了
作者: 000163163    时间: 2008-11-23 16:43

感谢强大的人
作者: 285900537    时间: 2008-11-30 21:09

收到,将尽早抽空余时间予以更新(可能要到1月份 - -|| )
作者: yjingdi2006    时间: 2008-12-3 23:22     标题: 好帖子

我是菜鸟,但是用这个过滤原则节省了很多时间,页面也变得十分清爽
作者: 285900537    时间: 2008-12-8 22:18

新版本正在测试中,如没有问题,将在30天后发布。
作者: LeavesFLy    时间: 2008-12-11 11:49

用上了,~~
作者: 285900537    时间: 2008-12-13 21:13

10天的测试显示无问题,请诸位一同测试:)
作者: klgd    时间: 2008-12-15 15:17

那个热门评论好像有点问题~
不管有没有热评都给过滤了
作者: dewin    时间: 2008-12-16 09:16

好东西
作者: 佛渡渎    时间: 2008-12-18 10:26

感谢发布,看看效果
作者: klgd    时间: 2008-12-18 16:08

http://www.cnbeta.com/articles/72689.htm
这有个广告
作者: liujie3683    时间: 2008-12-20 11:21

很好,每次上cnbeta都要卡一下
作者: goodgogogo    时间: 2008-12-22 19:56

filter\cnbeta 目录在哪里哦,哪位说说撒,是不是绿色版的要自己建个?
作者: 285900537    时间: 2008-12-22 23:49

恩,绿色版还是安装版,都需要自己新建一下。
作者: 285900537    时间: 2008-12-22 23:50

原帖由 liujie3683 于 2008-12-20 11:21 发表 http://bbs.ioage.com/cn/images/common/back.gif
很好,每次上cnbeta都要卡一下




正在思考如何提高效率,放心,cb也是我每天需要访问的站点,所以我会尽量精益求精的。
作者: dobimok    时间: 2009-1-1 21:02

那位高手行行好,做点好事.像我这样的菜鸟中的菜鸟,你写的那些东西我也不知道怎么用哦,所以你们这样子说了等于没说.要不,干脆告诉我怎么做吧,英雄
作者: 000163163    时间: 2009-1-10 17:13

我经常上CNBETA
作者: joesqall    时间: 2009-3-19 21:09

顶一下  希望楼主能定期更新一下




欢迎光临 世界之窗论坛 (http://bbs.theworld.cn./) Powered by Discuz! 7.2