我们通过一个织梦采集文章的实例,来为你介绍下dede织梦如何采集文章的。
织梦采集文章点击菜单
1、在dede织梦后台点击左侧菜单上的采集→采集节点管理→在右侧点击增加新节点。
2、选择内容模型→普通文章→确定。
dede织梦采集文章节点设置
3、如上图中①、②填写节点名称,对应的注意被采集点的网站编码,不对的话测试会乱码。
4、③、填写被采集文章中的任一一个页面。
5、④、在匹配网址上输入该文章或者任意一个列表页匹配网址,注意括号为小写,否则通配符出错也会采集失败。
6、⑤、再然后填入需要采集的页码。注意采集时是以目标站的列表页进行采集,如果我们不需要考虑被采集文章的是否是完全指定需要的,则直接填写页码即可。如果是采集自己站点的,而且是需要指定内容的,如按日期。之所以这样说,是因为有的站点列表页面,有的并不完全是按日期排列的。
7、⑥、是列表页面被采集区域的起点,需要查看被采集目标站点的源码。
8、⑦、是列表页面被采集区域的重点,注意采集块需要有明显的区分。
9、⑧、保存信息,如果出错会提示失败,那么查找原因进行修改,否则会有测试通过信息。
织梦文章采集测试结果
10、再保存进行下一步设置。
织梦文章采集文章起点终点设置
11、⑨、同列表页面采集区域设置一样,这里只进行文章采集起点和终点即可。注意会多一个[内容]</div>。</div>形成一个闭环,而且要回车换行输入采集终点。
12、采集成功后可以看到测试的信息,点击确定并开始采集即可。
13、采集完成后需要导入,导入到自己站点的目录后,再一键更新即可在网站前台看到文章采集的结果了。
采集文章中主要是要注意目标采集站的内容选择块的起点和终点,其他的设置不是很复杂。dede织梦如何采集文章,就为你介绍到这里。