您现在的位置:网站首页答辩论文计算机毕业设计

毕业设计 新闻搜索引擎的设计与实现

  • 简介:毕业设计-新闻搜索引擎的设计与实现,正文共42页,15152字,附源程序。,内容摘要,网络中的资源非常丰富,但是如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。,本文首先介绍了搜索引擎的发展历史、分
    类型:word+java    页数:42    字数:15152   
    资料包括:论文 程序   
    • 请与管理员联系购买资料 QQ:5739126
  • 论文简介
  • 相关论文
  • 论文下载
文件大小:1.56MB
适用专业:程序设计
适用年级:大学
论文编号:199060

论文简介:
毕业设计-新闻搜索引擎的设计与实现,正文共42页,15152字,附源程序。
内容摘要
网络中的资源非常丰富,但是如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。
本文首先介绍了搜索引擎的发展历史、分类、最新发展状况及所面临的问题等。接着详细介绍了基于Lucene的全文搜索引擎的系统结构,然后介绍网络机器人的原理和实现。又详细介绍了lucene的原理及基于lucene的搜索引擎的实现过程。详细介绍了如何解析网页提取网页内容,如何创建索引,并进行搜索,怎样进行分页等主要功能的代码并给了详细的讲解。接着介绍服务器,开发工具及运行环境。最后以添加两条URL并解析网页,然后搜索并显示,并给出了运行的关键步骤的截图,条理清晰。最后一章介绍了系统的展望,和还有待与完善和提高的地方。
本人在介绍搜索引擎的章节中除了详细的阐述技术核心外还结合了新闻搜索引擎的实现代码来说明,图文并茂、易于理解。
关键词: 网络机器人 搜索引擎 网页解析 URL
目 录
一、绪论 1
(一)开发搜索引擎的目的和意义 1
(二)搜索引擎的发展史 1
1.Google新闻搜索 2
2.百度新闻搜索 2
3.搜狐新闻搜索引擎 3
(三)搜索引擎的分类及其工作原理 3
(四)所面临的问题及可能的原因 4
(五)本章小结 4
二、 搜索引擎的结构 5
(一)搜索引擎的构成 5
(二)什么是网络机器人 5
1.网络机器人 5
2.网络机器人的程序分析 6
3.如何解析HTML 7
4.如何提高程序性能 10
(三)什么是基于TOMCAT的WEB服务器 10
(四)本章小结 11
三、基于LUCENE的全文搜索引擎 12
(一)LUCENE全文检索介绍 12
(二)LUCENE的原理分析 12
1.全文检索的实现机制 12
2.Lucene的索引效率 13
3.Lucene和其他一些全文检索系统/应用的比较 15
4.Lucene的创新之处 16
5.Lucene的组成结构 16
6.中文切分词机制 16
(三)LUCENE创建索引 17
(四)LUCENE索引的追加 20
(五)LUCENE删除索引 20
(六)LUCENE恢复索引 21
(七)对索引进行搜索 21
(八)本章小结 26
四、系统实现 27
(一)系统界面设计 27
1.首页面设计 27
2.搜索结果页面设计 28
3.系统其他辅助类 30
(二)系统开发和运行环境 30
(三)系统运行关键步骤截图 31
(四)本章小结 36
五、总结与展望 37
参考文献 38
致谢 39


论文文件预览:
共1文件夹,1个文件,文件总大小:1.56MB,压缩后大小:1.29MB

  • 毕业设计-新闻搜索引擎的设计与实现
  • doc毕业论文 小型WEB搜索引擎的设计与实现.doc  [1.56MB]

查看评论 已有0位网友发表了看法
  • 验证码: