Board logo

标题: 新基础黑名单与百度搜索引擎相冲突----找到原因--问题解决 [打印本页]

作者: killuasy    时间: 2008-3-19 11:03     标题: 新基础黑名单与百度搜索引擎相冲突----找到原因--问题解决

新基础黑名单与百度搜索引擎相冲突。

当在搜索栏选百度搜索引擎,搜索“日语”时。
出现以下画面。
2008-03-19_110620.jpg

输入其他词时,没有这个问题。


所引用的基础黑名单:
  1. /(?:\.|\/|_|")(?:ads?(?:\d|code|gif|graph|list|log|puba|s?file|sence|site|show)?|(?:ali)?union(?:sky|sys)?|all(?:4ad|yes)|banner|bdun|cp(?:c|ro)|(?:guan|my|newhua)?gg(?:ao)?|keyrun|p(?:4|f)p|sp(?nsor|code))s?(?:\d)*(?:\.|\/|_)/
  2. /[\W_]ads?(?!=&)(?:banner|click|flow|frame|ima?ge?|log|serv(?:er|e)?|stream|type|view|vert(?:ising|ise?ment)?|trix|xchange|wrapper)?s?[\W\d_]/
  3. /(?:\.|\/|_)(?:soft|hot)?ads?(?:s..|img|vert|rotator|view|bot|c_|client|council|gif|graph|images|info|log|pic)?(?:\.|\/|_)/
  4. /(?:\.|\/|_|")(?:a2d|alimama|clickeye|dotmore|cooperate|corporate|ifocus|ivansms|SogouUnion.*|themis|ulink(?:js|dir)|un|usmsweb|vodone|vogate|xc)s?(?:\d)*(?:\.|\/|_)/
  5. /[^0-9]+(?:\d){2,3}[x_](?:\d){2,3}[^0-9]+(?:swf|gif|jpg|js)/
复制代码
ps:加入了白名单,结果也一样。




---------------------        找到原因的分割线     --------------------------------------------


一般人的百度搜索串是:
  1. http://www.baidu.com/baidu?word=%s&tn=ichuner_4_pg
复制代码
由于我是双系统,为防止乱码,用的搜索串是:
  1. http://www.baidu.com/baidu?word=%us&tn=ichuner_4_pg&ie=utf-8&oe=UTF-8
复制代码
这时就出现了和黑名单相冲突的问题,具体怎样冲突的不了解,不过黑名单和搜索引擎只要修改其中一个,在百度引擎输入“日语”出现AD现象就没有了。



----------------------      解决问题的分割线  ----------------------------

感谢xyao,果然把搜索串改成如下就可以了。

  1. http://www.baidu.com/baidu?tn=ichuner_4_pg&ie=utf-8&oe=UTF-8&word=%us
复制代码
但和我原来的搜索串相比。
只是参数顺序颠倒了而已啊,没看出其他的区别,按理说结果都应该是一样的啊。

更新:谢谢xyao告知原因

原帖由 xyao 于 2008-3-21 18:59 发表 http://bbs.ioage.com/cn/images/common/back.gif

那是因为那个版本的黑名单过滤写的有问题,把地址栏里的符合规则的关键字也过滤了。你如果用原来的搜索串,有些字的编码里含有%AD,后边还带有&以及之后的一串内容,被认为是广告而屏蔽了,因此无法搜索。颠倒顺序以后%AD在最后,就不会被认为是广告了。

[ 本帖最后由 killuasy 于 2008-4-2 13:25 编辑 ]

图片附件: 2008-03-19_110620.jpg (2008-3-19 11:03, 4.24 KB) / 下载次数 1369
http://bbs.theworld.cn./attachment.php?aid=41382&k=01177490ba6310ca613de16677411b0b&t=1732698603&sid=0NKFIG


作者: nosa-1    时间: 2008-3-19 11:35

我的正常的啊 没有你说的情况
我的是新版 2.1.2.2
作者: killuasy    时间: 2008-3-19 11:41

新旧版我都试了,都有这个问题。

你的是新基础黑名单么?就是03/11/2008的那个版的?
作者: nosa-1    时间: 2008-3-19 11:45

嗯 是的
  我的没问题 倒是我的天气预报出问题了。。。
作者: killuasy    时间: 2008-3-19 12:09

为了防止是插件导致的广告过滤问题,我特意把theworld拷到空目录下运行,仅仅配置了新的黑名单。
就出现问题了。没配黑名单就没有问题。
作者: nosa-1    时间: 2008-3-19 12:35

那我就不知道了
我的没你说的那个问题。。。
作者: elkay    时间: 2008-3-19 14:58

楼主,把黑名单选项里的"过滤掉的元素显示为:"这里留空试试
作者: hhzxedu    时间: 2008-3-19 18:56     标题: 2.1.2.2测试版意外发现的一个罕见异常现象!

听闻2.1.2.2最新测试版发布,赶紧下载试用,感觉还可以,但是在接下来的使用过程中,经过多次测试,最终发现

了一个罕见的异常现象:

        用世界之窗打开百度主页,在百度搜索文本框中输入除“江”字之外的任何汉字后直接按回车都没有出问题,但只

要一输了“江”字,回车之后首页一片空白,连百度图标、文字什么的都不见了。

       不知道是为什么?而且已经测试过多次了都是这样!我立即还原到上一个版本,即2.1.2.0用上面同样的办法测试,没有出问题。
      恳请各位测试,并反馈自己出现的现象。
作者: 八万    时间: 2008-3-19 18:58

试试不会中病毒吧?
作者: 八万    时间: 2008-3-19 18:59

试过,确认不会中病毒
还确认一点,楼主好好检讨一下自己电脑
作者: 呦児咿    时间: 2008-3-19 19:00

好像是黑名单的原因. 确实有这个问题.
搜索后左上角会显示AD
作者: hhzxedu    时间: 2008-3-19 19:03

首先可以排除是我的电脑中病毒现象。
作者: 呦児咿    时间: 2008-3-19 19:05

打开www.baidu.com后, 输入"江", 回车后会显示AD. 用搜索框则正常.

刚再次测试了下:
就是黑名单的原因. (关闭黑名单恢复正常)

我用的是置顶的"基础黑名单 (03/11/2008)" 和 "安全浏览必备规则(首发霏凡论坛)2.9更新提示"

[ 本帖最后由 呦児咿 于 2008-3-19 19:09 编辑 ]
作者: hhzxedu    时间: 2008-3-19 19:07

如果是因为黑名单的原因,该如何解决?如何恢复世界之窗黑名单的默认值?
作者: 呦児咿    时间: 2008-3-19 19:11     标题: 回复 7# 的帖子

就是黑名单的原因, 关闭黑名单就正常了.
作者: killuasy    时间: 2008-3-20 08:36

原帖由 elkay 于 2008-3-19 14:58 发表 http://bbs.ioage.com/cn/images/common/back.gif
楼主,把黑名单选项里的"过滤掉的元素显示为:"这里留空试试


找到原因,

一般人的百度搜索串是:

  1. http://www.baidu.com/baidu?word=%s&tn=ichuner_4_pg
复制代码


由于我是双系统,为防止乱码,用的搜索串是:

  1. http://www.baidu.com/baidu?word=%us&tn=ichuner_4_pg&ie=utf-8&oe=UTF-8
复制代码


这时就出现了和黑名单相冲突的问题,具体怎样冲突的不了解,不过黑名单和搜索引擎只要修改其中一个,在百度引擎输入“日语”出现AD现象就没有了。

楼上那位和我测试一样结果的,想来用的也是utf-8编码的查询吧。
作者: nosa-1    时间: 2008-3-20 12:49

打 江  这个字
我也出现 AD
作者: roc5006    时间: 2008-3-20 14:03

这两天发现一厘米http://www.1cm.com.cn/do/1cmOpen?game=10drops的flash游戏无法加载,似乎是换了2.1论坛预览版后出现的,用的是最新的黑名单和白名单

最近还发现cnbeta页面上的百度站内搜索被过滤掉了

[ 本帖最后由 roc5006 于 2008-3-20 15:19 编辑 ]
作者: xyao    时间: 2008-3-20 19:52

改下搜索串即可,改成:
  1. http://www.baidu.com/baidu?tn=ichuner_4_pg&ie=utf-8&oe=UTF-8&word=%us
复制代码

[ 本帖最后由 xyao 于 2008-3-20 19:54 编辑 ]
作者: xyao    时间: 2008-3-21 18:59

那是因为那个版本的黑名单过滤写的有问题,把地址栏里的符合规则的关键字也过滤了。你如果用原来的搜索串,有些字的编码里含有%AD,后边还带有&以及之后的一串内容,被认为是广告而屏蔽了,因此无法搜索。颠倒顺序以后%AD在最后,就不会被认为是广告了。




欢迎光临 世界之窗论坛 (http://bbs.theworld.cn./) Powered by Discuz! 7.2