文件大小:3.14MB 适用专业:计算机软件与理论 适用年级:研究生 论文编号:13229 论文简介: 硕士学位论文 中文人名搜索引擎的设计与实现,共51页
摘要:
随着时代的发展,Web信息量正在以指数级的速度增长,传统搜索引擎的检索方式,造成搜索的结果集为海量冗余信息,难以找到特定行业用户所需要的精简而准确的信息。这样,面向主题的搜索引擎便孕育而生,它也被认为是新一代搜索引擎的发展方向。 本文提出了一种采用了多维数据方体作为中文人名搜索引擎的数据存储方式,通过对职业、所在地、出生年月的信息提取,然后运用补偿式信息提取的主题文本分类算法和语句一词条聚类算法,对相似文档归类,最终实现了以检索人名为主题的中文人名搜索引擎原型系统。通过对原型系统的试验分析,我们可以将不同的人物按照职业、所在地、出生年月以层次化形式展示,以便用户能够从不同角度快速的查询目标人物。
关键词:
搜索引擎; 信息提取; 文本分类; 文本聚类; TF; IDF; 语句—词条矩阵; 多维数据方体;
论文文件预览: 共1文件夹,1个文件,文件总大小:3.14MB,压缩后大小:3.10MB
- 硕士学位论文-中文人名搜索引擎的设计与实现
- 中文人名搜索引擎的设计与实现.NH [3.14MB]
|