如何把网站上的文字采集成txt文本文档

2025-02-26 16:05:35
推荐回答(2个)
回答1:

呵呵,建议你用ASP做一个,或者VB等语言。
使用xmlhttp对象读取到整个网页的HTML代码,然后用一个正则表达式去除所有的html标记,得到纯文本,再保存到文本文件里。

我有做这样的ASP采集程序。要做这样的小软件也很快的。

当然,你还可以用纯文件浏览器,有些浏览器打开网页只显示文本的。用它打开网页,再另存为本地文件即可。

回答2:

应该有,不过我是一章一章的复制