小弟在做爬虫抓取加密qq空间数据时出错了

今天和大家分享的内容是…………………………………

如何用VBA代码爬取指定QQ帐号在空间里的说说数据?

坦白的说这事二步就可以解决了。

第一步登录QQ或者TIM软件。

第②步也就是最重要的一步,关注微信公众号:VBA编程学习与实践在该公众号的主页回复关键词:说说

获取Excel模版后,打开点击按钮,运荇宏……

代码使用了IE浏览器获取QQ空间的Cookie并计算关键参数g_tk的值,因此需要先将IE浏览器设置为默认浏览器否则运行代码会出现错误的提示信息。

嗯是时候回顾下过往的青春了。搞个小图表可视化一下过去的时光里哪个月发的说说条数最多?哪个词出现的频率最高再扩展下代码,看看哪个魂淡最爱到你的空间里扯淡是基情四射还是情愫暗涌……

打个响指,好吧本期代码如下所示。


在正式开始在前需要先准备好做爬虫的工具本例使用chrome无头浏览器进行爬取工作,也可使用其他浏览器程序中的其他可替代工具在此之后不再一一赘述,有一些不明白的地方可以自行百度有错误的地方欢迎大家指正,大家共同学习共同进步!!

从csv文件读取好友qq号码構造url链接
爬取好友说说的发表的时间信息
把爬取到的信息存储在mongodb中

从qq邮箱获取好友列表存储为csv文件

打开qq郵箱选择通讯录 > 工具 > 导出联系人文件选择部分好友文件导出,保存为csv文件之后便于从csv文件读取好友qq号

qq空间好友说说的链接为/{好友qq号码}/311,首次打开需登录

观察源码选择适当的筛选方法


 #判断页面是否需要登陆,通过查找是否有ID为login_div的div标签来进行判断
 #如果需要登陆则切换到需要登陆的框架进行登陆
 #通过查找是否囿ID为QM_OwnerInfo_Icon的div标签来判断是否有权限访问好友的qq空间
 #如果可以访问则切换到好友说说框架进行数据的爬取和储存
 #主程序入口通过csv库读取通讯录攵件,存入列表

我要回帖

更多关于 爬虫抓取 的文章

 

随机推荐