海蜘蛛用户手册-主页--->网址/关键字过滤

规则说明

网址过滤可以对匹配域名或参数过滤;URL关键字过滤可以对匹配一个网址中的任意部分参数过滤。

例:这个网址 http://lady.163.com/10/0315/17/61R5T9V0002626K1.html中的域名部分为:lady.163.com 参数部分为 10/0315/17/61R5T9V0002626K1

网址过滤、关键字过滤书写规则要符合正则表达式 。简单说明如下(免费版不支持):

  1. ^符号:匹配输入字符串的开始位置

    例:^mp3表示所有以mp3开头的网址,如mp3.baidu.com

  2. $符号:匹配输入字符串的结束位置

    例:.mp3$表示所有以.mp3为文件名结尾的网址

  3. *符号:表示匹配所有字符

    例:.* js 既可以匹配 .djo js 也可以表示匹配 .yg js 等等

  4. [a-z]符号:匹配指定范围内的任意字符,这里的字符范围可以是字母也可以是数字

    例:mp[1-4]表示所有含有 mp1/mp2/mp3/mp4 的网址

  5. #号为注释符:#www.baidu.com表示注释www.baidu.com规则,即不对百度网址进行过滤

    www.baidu.com #过滤百度 表示对www.baidu.com规则的作用进行注释

    [注意] 提示

    网址过滤和URL过滤支持过滤含有以下字符的网址:

    汉字、字母、数字、点(.)、下划线(_)、斜线(/)、问号(?)、等号(=)、逻辑与符号(&)、逗号(,)、分号(;)

    例:输入 &tn 即可过滤百度在线音乐链接