湖南科技大学本科毕业设计 基于网络蜘蛛的网页搜索系统,共50页,21849字。 目录 1 绪论 1 1.1 开发背景 1 1.2 研究意义 2 2 开发技术简介 3 2.1 JAVA简介 3 2.2 MYSQL简介 4 2.3 TOMCAT简介 5 2.4 JSP简介 6 2.5 ECLIPSE简介 8 3 需求分析 10 3.1 引言 10 3.2 系统需求 10 4 系统总体设计 12 4.1 系统架构图 12 4.2 系统设计 12 4.3 结构设计 12 5 系统详细设计 13 5.1 数据库设计与实现 13 5.2 下载系统设计 14 5.3分析系统设计 16 5.4 索引系统设计 26 5.5 查询系统的设计 36 6 系统运行与维护 39 6.1 系统运行 39 6.2 系统测试 39 6.3 系统不足 44 6.4 系统维护 44 7 结束语 45 致谢 46 参考文献 47 基于网络蜘蛛的网页搜索系统 网络工程专业 赵宏帅 指导老师:胡蓉 摘要:随着互联网的发展,网络上的资源呈几何级数增长,面对海量的资料,如何快速寻找自己感兴趣的内容,成为搜索引擎出现的契机。一般认为,基于网页的信息检索工具主要有网页搜索引擎和网络分类目录两种。网页搜索引擎是通过“网络蜘蛛”等网页自动搜寻软件搜索到网页,然后自动给网页上的某些或全部字符做上索引,形成目标摘要格式文件以及网络可访问的数据库,供人们检索网络信息的检索工具。 本系统采用JAVA和JSP技术进行核心的代码编写,采用网页下载系统和搜索系统分离的方式,防止下载内容影响到搜索的速度。其中借鉴了不少国内外专家的经验和代码,有关中文分词和网页过滤采用了已有的开发包。开发使用工具包括:JAVA,ECLIPSE,MYSQL,TOMCAT等主流工具。 本文首先简要介绍了各个开发工具的技术特点,然后阐述了整个系统的设计和开发的具体过程及相关代码,最后对通过对系统的运行、测试,提出了改进和维护建议。 关键词:网络蜘蛛;中文分词;信息抽取;搜索引擎 |
湖南科技大学本科毕业设计 基于网络蜘蛛的网页搜索系统
查看评论
已有0位网友发表了看法