可以用htmlparser来获取html源码中的所有节点,然后遍历各个节点,转换为对应的xmlnode~~给你一篇文档 了解一下
http://blog.csdn.net/tudopi/article/details/4946093
这个不好弄找懂电脑的帮你
这个是需要自己编兑的