dedecms织梦后台的采集教程

使用织梦程序的网站比较多。免不了会采集一些数据。下面我教大家如何利用织梦默认的采集功能进来采集。

几个重点部分:
1,列表页面(列表的起始和结尾)
2,内容页面(内容的开始和结尾)
这部分要注意起始和结尾的唯一性,不能重复。
3,规则的设置
4,内容的过滤

下面是步骤和截图

第一步,登录网站后台。

采集---采集节点管理----增加新节点(如下图)



我们以A5为例子,来采集新手教程栏目下的内容。

http://www.admin5.com/browse/186/

这个是列表页,点击底部查看内容共有几页。我们可以看到共有225页,内容非常的多。

http://www.admin5.com/browse/186/list_9.shtml




获得测试












区域开始的HTML:


区域结束的HTML:



文章开始



最后就是配置完成,然后采集文章。

更详细的教程移步我的新浪博客:http://blog.sina.com.cn/s/blog_6afecf7901015lru.html

+