node爬虫,学习一下

学习原作者的文章//www.greatytc.com/p/7eb6a0b9e8a4
dom节点变更,所以改了一下,自己记录下

Paste_Image.png

还有记得要 **npm install cheerio **一下,要不然报“Cannot find module 'cheerio'”

var url = '//www.greatytc.com/u/53fb509bd05c';

<pre>
function filterChapter(html) {
var $ = cheerio.load(html);
var articleList = $('.note-list').children('li');
// 创建一个空数组,用来装载我们的文章对象
var articlesData = [];
articleList.each(function(item) {
// 以下 JQ 的方法,相信会一点 JQ 的人都能看懂啦,哈
var article = $(this);
var title = article.find('div').find('.title').text();
var span = article.find('div').find('.meta').find('a').eq(0).text();
var loveCount = article.find('div').find('.meta').find('span').eq(0).text();
// .eq(i) 通过索引筛选匹配的元素。使用.eq(-i)就从最后一个元素向前数。
// 创建文章对象,JS 的对象确实跟 json 的很像呀
var articleData = {
title: title,
love: loveCount.toString().trim(),
readCount: span.toString().trim()
};
articlesData.push(articleData);
});
return articlesData;
}
</pre>
ps:还不会用这个简书,顺便发一下第一个文章试试效果

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容