[转载]网络采集器 – 镇水古月 – 博客园

网络采集器 - 镇水古月 - 博客园. 我们在浏览网页的时候,都会在浏览器地址栏中输入需要访问的地址,通常这些地址都是以HTTP打头,表明是采用HTTP协议实现和站点通 讯,HTTP准确的说法是超文本传输协议,归根结底还是文本,所以传输的内容就是文本,浏览的网页也是文本,这就是我们可以采集网站数据的根本。 同时,在地址栏中我们还会看到网址中会包含www的字样,这表示我们请求的是Web服务,