(论文 字数:4737 页数:7)【内容提要】本文介绍自行设计的CNS搜索引擎的开发过程,着重探讨基于Spider技术的体系结构的设计。同时为提高集中式搜索引擎性能,提出了缓冲队列以及监控线程两个新思想。
【关键词】CNS搜索引擎,体系结构,缓冲队列,监控线程
【ABSTRACT】This thesis takes the development of the server engine (named CNS) . it focuses on design of the frame system on the base of spider technology. For impoving the capability of the concentrated search engine, This thesis suggests using of two new ideas--buffer queue and monitor thread.
【Keywords】CNS server engine, frame system, buffer queue, monitor thread
目录
1 引言 2 CNS搜索引擎系统结构 3 搜索引擎的具体实现 4 小结
1引言 搜索引擎(Search Engine)提供的导航服务已经成为互联网上非常重要的网络服务。搜索引擎发展速度迅速,自1994年出现一个真正意义上的搜索引擎是Lycos以来,搜索引擎技术不断更新,根据它们所基于的技术原理,可以把它们分成三大主要类型:基于 Spider的搜索引擎、目录(Directory,也叫做Catalog)和Meta搜索引擎。在搜索引擎结构设计上,可以采用集中式和分布式两种。两种方式各有优缺点。一个有效稳定的结构设计对搜索引擎是至关重要,本文就集中式搜索引擎提出一种有效的设计结构,在提高效率与智能管理提出新的想法。 |