帝国cms采集规则教程
内容摘要
采集方法打开帝国后台,点击上面的栏目,左边的栏目管理里面有增加采集借点,进入。中间提示要选择要创建的栏目点击你要创建的栏目,比如国际新闻。好吧,点了就进去了。
出现的界面
出现的界面
文章正文
采集方法
打开帝国后台,点击上面的栏目,左边的栏目管理里面有增加采集借点,进入。
中间提示要选择要创建的栏目点击你要创建的栏目,比如国际新闻。好吧,点了就进去了。
出现的界面有先节点名称,因为上面创建的是国际新闻这里就填写国际新闻父节点不用管(就是不填)
页面采集地址,你可以去新浪的国际新闻那里复制一下,比如国际新闻几面的地址,地址栏复制一下就可以了。
采集页面地址方式二不用管不填内容页地址前缀写成
图片/FLASH地址前缀(内容)~~~截取内容简介这里都不用管开始填写采集内容正则这时候需要看网页的源代码注意
信息页链接正则
标题图片正则不用填标题正则:打开内容页随便打开你刚才的大栏目里面的文章
副标题正则:~~~信息来源正则不用写新闻正文正则:
好了提交!
下来就预览看看有没有错误的
点击“预览”采集,进入节点预览结果:
采集内容页列表
采集内容页页面:
预览采集节点无误后,然后返回“管理节点”,点击“开始采集”链接就开始进行采集
系统正在采集中
采集完后显示本地临时入库的信息,这时可以对临时入库的信息进行修改或者删除
对采集的信息进行审核并入库,点击入库全部信息按钮
确定操作
信息入库完毕提示
信息入库完毕后下来点击管理信息
我们可以看到刚刚采集入库的新闻信息
到此所有的采集信息已经完成,帝国cms采集功能非常强大,还需要自己摸索。
很多同学肯定按照我的方法试了一遍说还是预览不成功,不要灰心,继续从正则开始排查,要是真找不到错误所在,
你就一个字一个字的复制粘贴上去,新闻源码不变只是内容变了,也是可以采集的。
祝你成功!
代码注释