目前微信不允许外界对公众号文章进行采集。想要爬取微信公众号文章主要有以下两个途径:一、与微信合作,开放独立的接口。二、通过腾讯搜狗搜索的微信查找功能,进行爬取。
今天介绍的神箭手微信公众号文章采集爬虫就是通过腾讯搜狗搜搜的微信查找功能爬取微信公众号文章。具体实现过程如下:
1、首先打开搜狗微信 http://weixin.sogou.com/
2、比如要采集“人民日报”这个公众号的文章
由于微信的限制,目前每个公众号只能爬取最近的10条信息中的文章。
微信、微博、抖音、今日头条等新媒体账号的大数据采集可以找新榜帮忙,百度搜索“新榜有数”