加入 我们
登录
论坛
搜索
导航
主站
论坛会员
帮助中心
私人消息 (0)
公共消息 (0)
系统消息 (0)
好友消息 (0)
帖子消息 (0)
世界之窗论坛
»
广告过滤规则讨论
»
TheWorld 2 过滤规则
» [问题]请问常规表示式匹对中文字元方法
返回列表
发帖
split
发短消息
加为好友
split
当前离线
UID
62983
帖子
8
精华
0
积分
8
威望
8
贡献
0
推广
0
有效BUG
0
阅读权限
20
在线时间
2 小时
注册时间
2007-7-2
最后登录
2007-8-3
注册用户
UID
62983
帖子
8
精华
0
贡献
0
推广
0
有效BUG
0
注册时间
2007-7-2
1
#
跳转到
»
正序看帖
打印
字体大小:
t
T
发表于 2007-7-31 19:37
|
只看该作者
[问题]请问常规表示式匹对中文字元方法
字元
,
中文
我最近常常去一个Discuz!的论坛,
这个论坛会摆放两种广告,文字广告和图片广告..
我观察了他的原始码发现,这些广告都会用HTML注解标示起来:
<!--圖檔廣告開始-->
<center>
<table border="0" cellpadding="0" cellspacing="0" style="border-collapse: collapse" bordercolor="#111111" width="59" id="AutoNumber1">
<tr>
广告广告
</tr>
</table>
</center>
<!--圖檔廣告結束-->
<!--文字廣告開始-->
<center>广告广告</center>
<!--文字廣告結束-->
复制代码
所以我想要用常规表示式来匹配"<!--文字廣告開始-->"到
<!--文字廣告結束->",但是使用unicode无法比对到(该网页使用big5码),
请问有没有人可以帮忙?
收藏
分享
www.813.com.cn
发短消息
加为好友
www.813.com.cn
当前离线
UID
65609
帖子
13
精华
0
积分
13
威望
13
贡献
0
推广
0
有效BUG
0
阅读权限
0
来自
中国大陆
在线时间
2 小时
注册时间
2007-8-1
最后登录
2007-8-13
禁止发言
UID
65609
帖子
13
精华
0
贡献
0
推广
0
有效BUG
0
来自
中国大陆
注册时间
2007-8-1
8
#
发表于 2007-8-1 18:46
|
只看该作者
提示:
作者被禁止或删除 内容自动屏蔽
淘宝代销联盟-首家推出[商品+配送]合作的联盟!
TOP
elkay
发短消息
加为好友
elkay
当前离线
我是警察~~~
UID
1110
帖子
2787
精华
3
积分
2926
威望
2886
贡献
20
推广
0
有效BUG
0
阅读权限
255
在线时间
1747 小时
注册时间
2005-5-26
最后登录
2014-10-29
论坛元老
UID
1110
帖子
2787
精华
3
贡献
20
推广
0
有效BUG
0
注册时间
2005-5-26
7
#
发表于 2007-7-31 21:19
|
只看该作者
哦,我没有仔细研究,不过用到的机会也不多
TOP
tongang
发短消息
加为好友
tongang
当前离线
UID
3486
帖子
208
精华
0
积分
218
威望
218
贡献
0
推广
0
有效BUG
0
阅读权限
40
在线时间
265 小时
注册时间
2005-10-11
最后登录
2012-11-1
中级用户
UID
3486
帖子
208
精华
0
贡献
0
推广
0
有效BUG
0
注册时间
2005-10-11
6
#
发表于 2007-7-31 21:13
|
只看该作者
我可以啊..原来的表达式就已经写出来过了..
DownInfo\u0028(.*?),"(.*?)","(.*?)","(.*?)"\u0029[\s\S]*?
这个就是
DownInfo(xxxxxx)
TOP
elkay
发短消息
加为好友
elkay
当前离线
我是警察~~~
UID
1110
帖子
2787
精华
3
积分
2926
威望
2886
贡献
20
推广
0
有效BUG
0
阅读权限
255
在线时间
1747 小时
注册时间
2005-5-26
最后登录
2014-10-29
论坛元老
UID
1110
帖子
2787
精华
3
贡献
20
推广
0
有效BUG
0
注册时间
2005-5-26
5
#
发表于 2007-7-31 21:07
|
只看该作者
回复 #4 tongang 的帖子
好像tw的正则表达式引擎不支持这个,我试过多次都以失败告终。
TOP
tongang
发短消息
加为好友
tongang
当前离线
UID
3486
帖子
208
精华
0
积分
218
威望
218
贡献
0
推广
0
有效BUG
0
阅读权限
40
在线时间
265 小时
注册时间
2005-10-11
最后登录
2012-11-1
中级用户
UID
3486
帖子
208
精华
0
贡献
0
推广
0
有效BUG
0
注册时间
2005-10-11
4
#
发表于 2007-7-31 21:06
|
只看该作者
建议你用unicode 编码:
\u(xxx)
具体的对应请查unicode编码表...我从网上随便找了个.
http://code.web.idv.hk/uao/uao.php
TOP
elkay
发短消息
加为好友
elkay
当前离线
我是警察~~~
UID
1110
帖子
2787
精华
3
积分
2926
威望
2886
贡献
20
推广
0
有效BUG
0
阅读权限
255
在线时间
1747 小时
注册时间
2005-5-26
最后登录
2014-10-29
论坛元老
UID
1110
帖子
2787
精华
3
贡献
20
推广
0
有效BUG
0
注册时间
2005-5-26
3
#
发表于 2007-7-31 21:06
|
只看该作者
回复 #2 split 的帖子
呵呵,也许是那个帖子没有能说明白。
实际上是有2种,如下:
#ex#(restring)###(replace string)
#exd#(url matching)#(restring)###(replace string)
TOP
split
发短消息
加为好友
split
当前离线
UID
62983
帖子
8
精华
0
积分
8
威望
8
贡献
0
推广
0
有效BUG
0
阅读权限
20
在线时间
2 小时
注册时间
2007-7-2
最后登录
2007-8-3
注册用户
UID
62983
帖子
8
精华
0
贡献
0
推广
0
有效BUG
0
注册时间
2007-7-2
2
#
发表于 2007-7-31 20:55
|
只看该作者
终於找到问题了..
只是因为广告过滤规则教程有误...
教程中写的:
#(type)#(restring)###(replace string)
复制代码
应该要改成
#(type)#(url matching)#(restring)###(replace string)
复制代码
所以我的案子只要加入
#exd#*forum*#廣告開始-->###following Ad removed
复制代码
就OK了
[
本帖最后由 split 于 2007-7-31 20:57 编辑
]
TOP
返回列表
世界之窗使用交流
7.x版本使用交流
团队日志
旧版使用交流
扩展和主题
6.x版本使用交流
5.x版本使用交流
4.x极速版(Chrome)
3.x版本使用交流
2.x版本使用交流
1.x版本使用交流
网络收藏夹测试区
常见问题解答
浏览器扩展
广告过滤规则讨论
TheWorld 6 过滤规则
TheWorld 3 过滤规则
TheWorld 2 过滤规则
浏览器皮肤资源
3.0皮肤设计大赛
3.0皮肤大赛讨论区
2.0皮肤设计大赛
浏览器插件资源
软件使用交流
图标壁纸光标美化
Windows系统使用与交流
休闲娱乐
读书之乐
每日一学
灌水区
天南海北
我的TheWorld 我的世界
会员交流、交友版
白金用户区
站务管理
站务广场
[收藏此主题]
[关注此主题的新回复]
[通过 QQ、MSN 分享给朋友]
管理团队