最近做了狂野小说的蓝天采集器发布插件,今天给大家带来的教程是系统自带的集成采集器规则的使用教程。
狂雨小说CMS是一个非常不错的小说程序,(以下简称KYXSCMS)提供一个轻量级小说网站解决方案,基于ThinkPHP5.1+MySQL的技术开发。
KYXSCMS,灵活,方便,人性化设计简单易用是最大的特色,是快速架设小说类网站首选,只需5分钟即可建立一个海量小说的行业网站,批量采集目标网站数据或使用数据联盟,即可自动采集获取大量数据。内置标签模版,即使不懂代码的前端开发者也可以快速建立一个漂亮的小说网站。
今天我们就来介绍以下采集规则教程;登录后台点击-----数据采集。
列表网址:
获取区间:<div id="newscontent">内容<div class="pages1">
如上图所示:我们的列表页获取区域选择的时候最好是选用具有唯一性的标签,这样抓取的时候不容易出现空白。
网址规则:
<span class="s2"><a href="内容1">
章节页:
从页中提取:默认内容页
是否章节列表:是
获取区间:<div id="list">内容<div id="footer" name="footer">
wangz
网址规则:<dd><a href="内容1" title="(*)">章节标题</a></dd>
内容规则:
栏目规则:<meta property="og:novel:category" content="内容1"/>
名称规则:<meta property="og:novel:book_name" content="内容1"/>
作者规则:<meta property="og:novel:author" content="内容1"/>
连载规则:<meta property="og:novel:status" content="内容1"/>
图片规则:<meta property="og:image" content="内容1"/>
介绍规则:<div id="intro">(*)<p>内容1</p>
标签规则:<meta property="og:novel:category" content="内容1"/>
章节名称规则:<h1>内容1</h1>
章节内容规则:<div id="content">内容1</div>
由于规则内容过多,我们就不一一截图了,采集整站的规则都在这里了,可以直接复制粘贴,然后点击保存就可以实现整站的采集小说了。程序默认是自动进行采集的,只要有人访问就会触发系统进行采集非常的方便。另外针对这个狂雨小说cms我们蜀戎网络也开发了配套蓝天采集器采集发布使用的发布插件,也是一样可以实现自动采集入库的,欢迎前来咨询。针对那种加了仿采集的页面使用我们的蓝天采集器就可以很好的模拟蜘蛛进行抓取,非常的便捷。