求教一个关于”scrapy双向爬取的问题“

2025-04-05 16:59:30
推荐回答(1个)
回答1:

当初就是因为无法增量抓取所以放弃 scrapy 的。
因为我们的场景,定时更新,增量抓取是非常重要的,这要求很强 url 去重,调度策略逻辑。
而 scrapy 的内存去重实在是太简陋了。