百度统计:通配符与正则表达式?

1、通配符:

通配符,即 * 符号,可以添加在url中,代替任意字符。假设您添加的网站域名是url.com,则通配符的使用规则如下:

  • 网站域名后不能直接添加通配符,如url.com* 这种方式会提示错误;通配符与域名至少间隔一个字符,如url.com?abab需用url.com?* 来表示;
  • url.com/*,表示包含url.com/ 这个形式的所有url,如 url.com/abab,url.com/abab/cdcd等;
  • url.com/abab*,表示包含url.com/abab这个形式的所有url,如 url.com/abab,url.com/ababcd,url.com/abab/cdcd等;
  • url.com/*.html,表示包含url.com/ 这个形式,且以 html 结尾的所有url,如url.com/abab.html等。

2、正则表达式

正则表达式是指匹配或捕获字段的若干部分的特殊字符以及支配这些字符的规则,比如:

“.”:匹配任何单个字符(字母、数字或符号),如bai.du与baigdu和bai8du匹配;

“?”:匹配0个或1个先前项,labou?r与labor和labour都匹配;

“*”:匹配0个或多个先前项,labo*r与labr和labour都匹配;

“+”:与星号的用法一样,只不过加号前至少必须匹配一个先前项;如+aidu和baidu、abaidu都匹配;

“|”:执行“或”匹配,a|b与a或b匹配;

“()”:使用圆括号创建项,而不使用默认项,如love(ableIly)匹配loveable或lovely;

“[]”:创建要匹配的项列表,www\.aaa\.com/mp[1-4]可以匹配www.aaa.com/mp1、www.aaa.com/mp2、www.aaa.com/mp3、www.aaa.com/mp4;

“-”:与方括号联合使用,用来扩展您的列表,如上例中的[1-4];

“$”:要求您的数据位于字段末尾,如www\.aaa\.com/mp[1-4]$就不能匹配www.aaa.com/mp5或者www.aaa.com/mp11等;

“^”:要求您的数据位于字段开头,如^baidu匹配所有以baidu开头的行;

“\”:将正则表达式字符转换为普通字符,如您选择了“是”使用正则表达式来设置,而您的URL本来为www.baidu.com,而“.”恰好是正则元字符,则您在设置正则表达式时需要将您的URL转义为www\.baidu\.com。

“{}”:一般与非负整数一齐使用,匹配确定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配"food" 中的两个 o。

由于正则表达式的含义复杂、操作困难,为了避免系统误判为您带来不必要的困扰,请在提交您的设置之前认真检查,注意转义,以确保您所设置的正则表达式完整、正确、能被系统识别且没有歧义。

以上符号为目前本网站支持的所有正则表达式字符。

发表评论

您的电子邮箱地址不会被公开。