function get_html( $url )
{
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
//设置URL,可以放入curl_init参数中
curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.202 Safari/535.1");
//设置UA
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
//将curl_exec()获取的信息以文件流的形式返回,而不是直接输出。 如果不加,即使没有echo,也会自动输出
$content = curl_exec($ch);
//执行
curl_close($ch);
return $content;
};
用这个方法去抓吧,几乎什么东西都能抓,file_get_contents()这个方法不靠谱,限制太多
1. 抓取阿里巴巴网址不正确。
2. 某些信息需要cookie支持,也就是说可能需要先登录后才能获取。
上代码。
你找一下论坛 盈诺网 吧 希望可以帮到你