浅谈帝国cms的分页采集正则及过滤技巧
之所以很多站长在做网站的时候,都会选择帝国CMS系统,我想其中的一个原因就是它的采集功能吧,今天我们就介绍以下帝国cms的分页采集正则及过滤技巧
从文章的源代码中获得的
第一种:
<p align='center'><b><font color='red'>[1]</font> <a href='/Eat/RMenu/200806/38611_2.html'>[2]</a> <a href='/Eat/RMenu/200806/38611_3.html'>[3]</a> <a href='/Eat/RMenu/200806/38611_4.html'>[4]</a> <a href='/Eat/RMenu/200806/38611_2.html'>下一页</a> </b></p>
编写的规则:
选全部列出式
区域正则:
<p align='center'><b><font color='red'>[!--smallpageallzz--]'>下一页
链接正则:
<a href='[!--pageallzz--]'>
--------------------------------------------------------------------------------
第二种
采集代码
<p align='center'><b><font color='red'>[1]</font> <a href='/lw/3/lw_31205_2.html'>[2]</a> <a href='/lw/3/lw_31205_2.html'>下一页</a> </b></p> <center>《
编写的规则:
选用上下导航式:
分页区域正则:<font color='red'>[!--smallpagezz--]下一页
分页链接正则:<a href='[!--pagezz--]'
新闻正文正则:
src="">
</script></td>
</tr>
</table>[!--newstext--]</td>
</tr>
<tr>
<td width=5></td>
过滤广告正则:
</p> <center>[!--ad--]</center>,</p><p align='center'>[!--ad--]</b>
例如:
--------------------------------------------------------------------------------
第三种
<p align="center"><img src="/bgy/Images_1/sy8.gif" border="0" align="absbottom"> <FONT style="COLOR: #ff0000">【1】</font> <a class=page href="094221656-2.html" target=_self>【2】</a> <a class=page href="094221656-3.html" target=_self>【3】</a> <a class=page href="094221656-4.html" target=_self>【4】</a> <a class=page href="094221656-5.html" target=_self>【5】</a> <a href="094221656-2.html"><img src="/gwy/Images1/xy.gif" border="0" align="absbottom"></a></p>
编写的规则:
"全部列出"式正则设置:
分页区域正则(无)
分页链接正则: <a class=page href="[!--pageallzz--]" target=_self>
--------------------------------------------------------------------------------
第四种:
<DIV class=pageContainer> <DIV class=pager><span class="nextprev"><< 前一页</span><span class="current">1</span><a href="0731_3493_686224_1.shtml" title="转到第2页">2</a><a href="0731_3493_686224_2.shtml" title="转到第3页">3</a><a href="0731_3493_686224_1.shtml" class="nextprev" title="后一页">后一页 >></a></DIV></DIV></DIV>
</div>
选全部列出式
区域正则:
<DIV class=pageContainer> <DIV class=pager><span class="nextprev">[!--smallpageallzz--]" class="nextprev" title="后一页">
链接正则:
<a href="[!--pageallzz--]"
本网声明:海南科技网发布此文仅出于信息分享,并非赞同其观点或证实其描述,不承担侵权行为的连带责任。投资者据此操作,风险自担。版权归原作者所有,如涉版权或来源标注有误,请联系我们删除。本网原创内容未经书面授权,任何单位或个人不得转载和摘编。
相关推荐:
帝国cms灵动标签调用图片缩略图为序号123的方法
<a href="<?=$bqsr[查看全文>>
帝国cms灵动标签调用图片缩略图ID为序号的方法
<a href="<?=$bqsr['titleurl']?>" 查看全文>>
帝国CMS高级应用—灵动标签调用二级导航 循环子栏目和信息
-
滚动新闻列表完整代码
这是滚动新闻列表完整代码,具体代码如下: <!doctype html> <html> <head> <meta http-equiv='查看全文>>- 建站经验
海南科技网
-
让文本框输入的文字距离左边框4px
input{text-indent:4px;}//首行缩进,但为了兼容性更好,建议使用text-indent:20px;替换成padding-left:2查看全文>>- 建站经验
海南科技网
-
如何在Navicat软件添加新字段到数据表的详细步骤及教程
在Navicat中添加字新段到数据库表的详细步骤及教程如下:‌ 注意:为了安全起见,在添加新字段查看全文>>- 建站经验
海南科技网