第五节 本章小结........................................................................................................ 149 第九章 用户行为的特征及缓存的应用................................................................. 151 第一节 用户查询与点击日志.................................................................................... 152 第二节 用户行为特征的统计分析............................................................................ 154 一、 用户查询词的分布情况................................................................................ 154 二、 雷同查询词的衰减统计................................................................................ 155 三、 相邻N项查询词的偏差分析......................................................................... 156 四、 用户在输出结果中的翻页情况统计............................................................ 158 五、 用户点击URL的分布情况............................................................................ 159 六、 考虑与不考虑查询项时点击URL分布的对比分析.................................... 160 七、 查询过程的自相似性.................................................................................... 161 第三节 查询缓存的使用............................................................................................ 164 一、 基于用户行为的启示.................................................................................... 164 二、 缓存替换策略研究........................................................................................ 165 v 第四节 用户行为与WEB信息的分布特征................................................................. 167 一、 基本术语....................................................................................................... 167 二、 海量Web信息的特征分析............................................................................. 168 第十章 相关排序与系统质量评估......................................................................... 173 第一节 传统IR的相关排序技术................................................................................ 173 第二节 链接分析与相关排序.................................................................................... 176 一、 链接分析....................................................................................................... 176 二、 Web查询模式下的新信息............................................................................ 178 第三节 相关排序的一种实现方案............................................................................ 182 一、 形成网页中词项的基本权重........................................................................ 183 二、 利用链接的结构............................................................................................ 185 三、 收集用户反馈信息........................................................................................ 187 四、 计算最终的权重............................................................................................ 189 第四节 搜索引擎系统质量评估................................................................................ 191 一、 引言............................................................................................................... 191 二、 查询类别分析与查询集的构建.................................................................... 192 三、 评估实验的建立与分析................................................................................ 193 下篇 面向主题和个性化的WEB信息服务.......................................................... 196 第十一章 中文网页自动分类技术......................................................................... 197 第一节 引言................................................................................................................ 197 第二节 文档自动分类算法的类型............................................................................ 197 第三节 实现中文网页自动分类的一般过程............................................................. 199 第四节 影响分类器性能的关键因素分析................................................................. 201 一、 实验设置....................................................................................................... 201 二、 训练样本....................................................................................................... 202 三、 特征选取....................................................................................................... 207 四、 分类算法....................................................................................................... 210 五、 截尾算法....................................................................................................... 216 六、 一个中文网页分类器的设计方案................................................................ 218 第五节 天网目录导航服务........................................................................................ 219 一、 问题的提出................................................................................................... 219 二、 天网目录导航服务的体系结构.................................................................... 220 三、 天网目录的运行实例.................................................................................... 221 第六节 本章小结........................................................................................................ 221 vi 第十二章 搜索引擎个性化查询服务..................................................................... 223 第一节 基于WEB挖掘的个性化技术......................................................................... 223 一、 Web挖掘技术................................................................................................ 224 二、 典型个性化Web服务系统的比较................................................................. 225 三、 基于Web挖掘的个性化技术的发展............................................................. 226 第二节 天网知名度系统............................................................................................ 227 一、 系统结构....................................................................................................... 227 二、 网页与命名实体的相关度评价.................................................................... 231 第十三章 面向主题的信息搜集与应用................................................................. 235 第一节 主题信息的搜集............................................................................................ 235 一、 主题信息分布的局部性................................................................................ 235 二、 一种主题信息搜集系统................................................................................ 236 第二节 主题信息的一种搜集与处理模型及其应用................................................. 238 一、 模型设计....................................................................................................... 238 二、 应用实验:以“十六大”为主题................................................................ 242 三、 总结与讨论................................................................................................... 244 参考文献................................................................................................................... 245 附录. 术语................................................................................................................ 256 后记........................................................................................................................... 264 |
查看评论
已有0位网友发表了看法