casperjs 循环抓取页面

var urls = [...];
var index = 0;
var visited_cnt = 0;


// 主要是使用 casper.each 方法
casper.each(urls, function(){
    var url = urls[index++];
    casper.thenOpen(url, function(){
        console.log('Open ' + url);
        visited_cnt += 1;

        if(visited_cnt >= urls.length) {
            casper.evaluate(function(){
                // 通知结束
                $('body')[0].dataset['crawlerover'] = 'yes';
            });
        }
    });
});


// 等待直到循环结束
casper.waitForSelector('[data-crawlerover]', function(){
    logging.info('over');
});


casper.run();

最后编辑于：2017.12.11 13:44:23

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

cURL的模拟登录和抓取页面
模拟登陆以模拟登录兄弟连猿代码为例四个步骤无需赘述了：初始化，配置，发送请求获取数据，关闭连接。配置的部分为...
王宝花阅读 9,747评论 0赞 1
[正儿八经PHP]抓取页面的几种方式
我们在开发网络程序时，往往需要抓取非本地文件，一般情况下都是利用php模拟浏览器的访问，通过http请求访问url...
anonymous66阅读 9,986评论 0赞 2
Scrapy抓取Ajax动态页面
一般来说爬虫类框架抓取Ajax动态页面都是通过一些第三方的webkit库去手动执行html页面中的js代码，最后...
mylonly阅读 25,421评论 6赞 42
使用 Node 抓取指定页面的有效链接，并输出所有非有效链接
1. Node.js 安装配置: http://www.runoob.com/nodejs/nodejs-inst...
盒子姐姐阅读 4,583评论 0赞 0
守望动员令：这个世界比以往更加需要我们，你们来不来？
The world is changing once again ,and it's time to pick o...
简书视觉馆小飞侠阅读 5,987评论 0赞 3

赞1赞

赞赏

手机看全文