[转载]网络爬虫(网络蜘蛛)之网页抓取 – Sonet – 博客园

网络爬虫(网络蜘蛛)之网页抓取 - Sonet - 博客园. 现在有越来越多的人热衷于做网络爬虫(网络蜘蛛),也有越来越多的地方需要网络爬虫,比 如搜索引擎、资讯采集、舆情监测等等,诸如此类。网络爬虫涉及到的技术(算法/策略)广而复杂,如网页获取、网页跟踪、网页分析、网页搜索、网页评级和结 构/非结构化数据抽取以及后期更细粒度的数据挖掘等方方面面,对于新手来说,不是一朝一夕便能完全掌握且熟

[转载].net 2.0下的OOXML神器:NPOI.OpenXml4Net

.net 2.0下的OOXML神器:NPOI.OpenXml4Net - Tony Qu - 博客园. 作者:Tony Qu NPOI官方博客:http://tonyqus.sinaapp.com | 官方QQ群:189925337 可 能很多人已经习惯了使用.Net 3.0下的System.IO.Packaging(WindowsBase.dll)来操作Office 2007/2010的

[转载]Jumony入门(一)从这里开始

Jumony入门(一)从这里开始 - Ivony... - 博客园. 首先介绍一下Jumony是什么,Jumony是一个.NET的开源项目,项目主页位于:http://jumony.codeplex.com/,采用LGPL协议发布。 Jumony 试图提供在传统Web开发模型中许多难以解决问题的解决方案。一言蔽之,Jumony的一切基础建立在服务器端的HTML DOM之上。在服务器端将HT