搜索引擎—_原理、技术与系统[1].chs
搜索引擎 网络爬虫 网络蜘蛛最简单例子,其中只用了一个类,就模拟了爬虫爬行抓取的过程
很好的搜索引擎的入门书籍。
北大天网实验室出的一本书,主要结合了天网的实践,并有一套称为TSE的C++代码。
全书分为三部分。除了第三部分涉及更多的高级问题,理论性较强,书中描述也不太详细之外,前两部分对于非专业人士了解IR系统的“原理,技术与系统”很有帮助。该书对网页抓取,文本分析,索引建立,搜索效率等方面都做出了分析,提供了一个功能详尽的web文本信息检索框架,
《百度搜索引擎优化指南》SEO白皮书,了解百度SEO的不错的书籍,毕竟是百度自己出的SEO
Google搜索引擎优化初学者指南【中文PDF】
FTP搜索引擎的设计与实现(优化版)
By falcon
摘要:FTP是因特网最主要的服务之一,FTP搜索引擎为资源共享提供了极大的方便。本文分析和设计了一个基于WEB的FTP搜索引擎,在ASP+ACCESS+VB环境下给出了编程实现,并体现了具体实践中总结出的一些经验。
来自:兰大开源
毕业设计论文--基于Lucene与Heritrix的搜索引擎构建,可以研究一下。
LUCENE实现的基于RSS的博客搜索引擎,非常好。
基于Lucene_XML技术的Web搜索引擎设计与实现
迅龙中文Web搜索引擎0.7( C# .NET)核心代码