Python的某个任务

作业: 1. 使用 selenium 或者 requests 模块抓取 华为商城荣耀9 https://www.vmall.com/product/738677717.html 的评论数据5000 条 ,保存到文件中 。
2. 使用snownlp 模块对 该文件中的评论进行分析, 统计出 5000条里面 积极的评论 和 消极评论的 数目, 区分出 积极和消极的
3. 使用 jieba 模块,统计出 文件中 出现最多的50个关键词,了解评论中大家最关心的手机哪些方面。

目的:

  1. 熟悉 selenium 或者 requests 模块
  2. 熟悉 大数据分析--- 文本分析的模块
    要点
  3. selenium 取 body.text 或者 requests 取 返回的代码
  4. 了解 snownlp 方法 用法
  5. 了解 jieba 分词模块的用法

作业结果将在 下周一公布。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • # Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列...
    aimaile阅读 26,553评论 6 427
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,881评论 18 139
  • 凌晨最美的声音 是走到你旁边听到你均匀的呼吸声 凌晨最美的画面 是站在你身旁看到你一起一伏有节奏的胸廓 每天的凌晨...
    yu菇凉阅读 160评论 0 0
  • “还珠”三美再同框,人生赢家们背后的故事 7月的最后一天,霍林在巴厘岛完成大婚,最引人注目的莫过于“还珠”三美同框...
    抱布阅读 714评论 0 51
  • 2017.5.3日郑子玲连接真我指导灵天使奇迹分享 一、奇迹 1、昨天我骑电动车去公园,锻炼了三个小时,出来时一摸...
    丰盛子玲阅读 221评论 0 1