方法1
寻找页面中的xhr请求, 并得到实际的请求参数. 直接获取相关搜索的请求返回代码, 然后进行数据整理.
方法2
模拟浏览器操作, 比如使用Selenium 模块.
python爬虫比较难入门。
建议使用操作简单、功能强大的八爪鱼。
八爪鱼具有以下特点:
1、行业知名,全球300万+用户都在使用。
2、内置数百个主流网站采集模板,满足绝大部分采集需求,会鼠标点击以及文本输入即可采集数据。
3、可视化操作流程,眼见即可采(可采集市面上98%的网站),不管是图片电话,还是自媒体论坛,支持所有业务渠道的爬虫,满足各种采集需求。
4、云采集,5000台云服务器,24*7高效稳定采集,结合API可无缝对接内部系统,定期同步爬数据。
5、支持企业私有化部署,可部署在隔离内网环境。提供定制化部署方案,满足多种数据安全级别。