Board logo

标题: [提交Bug] [BUG反馈] 2X系列正则的一个BUG [打印本页]

作者: shieep    时间: 2009-6-12 12:30     标题: 2X系列正则的一个BUG

本帖最后由 shieep 于 2009-6-12 12:32 编辑

我把程序和配置文件打包上传了。
以这个页面为例。会导致CPU全满了。2核的话,CPU占用是50%。
http://bbs.news.163.com/bbs/society/138294681.html
BBS.news.163.com开头的都会是这样。但是其他163的页面没有问题。
作者: needed    时间: 2009-6-12 12:59

任何 不规范的黑名单都有可能导致 假死..
作者: smile16888    时间: 2009-6-12 15:11

  1. #exd#*.163.com*#<(div).*"(?:ad360|adList|endAd550|ad960_70|leftad|div_pic1|Ad|hrContent)"[^>]*>(?:<\1[^>]*>(?:<\1[^>]*>(?:<\1[^>]*>(?:<\1[^>]*>[\s\S]*?</\1>|[\s\S])*?</\1>|[\s\S])*?</\1>|[\s\S])*?</\1>|[\s\S])*?</\1>$###<!--163已过滤-->
复制代码
把你的这条广告过滤规则去掉试试,这条规则太复杂了。
我这没有出现楼主的问题
作者: shieep    时间: 2009-6-12 16:26

#exd#*.163.com*#]*>(?:]*>(?:]*>(?:]*>(?:]*>[\s\S]*?|[\s\S])*?|[\s\S])*?|[\s\S])*?|[\s\S])*?$###把你的这条广告过滤规则去掉试试,这条规则太复杂了。
我这没有出现楼主的问题
smile16888 发表于 2009-6-12 15:11 http://bbs.ioage.com/cn/images/common/back.gif

我知道是这个问题,这个正则是没有问题的。是TW内部处理出了问题。所以应该修正下。这个没办法,我要过滤163新闻的广告只能用多重了。这是5个嵌套。
作者: shieep    时间: 2009-6-12 16:27

任何 不规范的黑名单都有可能导致 假死..
needed 发表于 2009-6-12 12:59 http://bbs.ioage.com/cn/images/common/back.gif
我的黑名单是规范的。
作者: 琴心赏笛    时间: 2009-6-13 02:27

那些黑名单是规范的?




欢迎光临 世界之窗论坛 (http://bbs.theworld.cn./) Powered by Discuz! 7.2