基于本体的语义检索在数字图书馆中的应用研究
摘要
随着知识经济的发展,数字图书馆成为信息资源传播的重要载体,目前数字图书馆的检索系统基本采用基于关键字的检索方法,仅限于字符之间的匹配,不能表达语义信息,检索结果与用户需求产生偏差,致使检索查全率和查准率较低。
本文以传统的数字图书馆检索模型作为基础,利用本体语义技术对检索模型做了深入研究,提出了一个基于本体结构的数字图书馆检索模型,该模型以领域本体为基础,综合了扩展查询、语义推理、语义索引、资源映射等技术,完成了语义检索。构建了一个本体库。以计算机类图书为实例,从领域信息收集、分析及其归类,构建了一个完整计算机图书本体库的子集,设计了领域本体的概念集及概念之间的函数关系。在比较本体库存储方案的基础上采用了关系数据库存储方式。实现一个基于本体语义的数字图书馆检索模型。在研究本体中概念之间关系的基础上,设计了资源映射模型,实现了本体库中概念、属性与数据库表模式的匹配,建立本体库与数据库之间的映射。运用 OWL 语言对本体进行描述,采用 Jena2 完成了本体的存储、语义推理。在模型的基础上设计了一个原型系统,包括本体库维护模块、资源映射模块、检索模块以及检索结果输出模块,通过实验数据分析,加入语义的数字图书馆结构模型在查全率和查准率方面优于传统结构。
关键词:数字图书馆;本体;语义检索;相似度计算;语义推理
目录
摘要 ........................................................................................................ I
Abstract ..................................................................................................... II
目录 ........................................................................................................ III
1 绪论 ...................................................................................................... 1
1.1 研究背景 ......................................................................................................... 1
1.2 国内外研究的现状分析 ................................................................................. 1
1.2.1 国外研究现状 ...................................................................................................... 1
1.2.2 国内研究现状 ............................................................................................................ 2
1.3 研究的意义 ..................................................................................................... 3
1.4 研究的内容 ..................................................................................................... 3
1.5 论文的组织与结构 ......................................................................................... 4
2 相关基本概念和理论 .......................................................................... 5
2.1 数字图书馆 ..................................................................................................... 5
2.2 本体概念及相关理论 ..................................................................................... 5
2.2.1 本体概念 .............................................................................................................. 5
2.2.2 本体的应用 .......................................................................................................... 6
2.2.3 本体的构成 .......................................................................................................... 7
2.2.4 本体描述语言 ...................................................................................................... 8
2.2.5 本体库的构建 .................................................................................................... 10
2.3 语义及语义相似度 ....................................................................................... 10
2.3.1 语义相似度计算概念 ......................................................................................... 11
2.3.2 语义相似度算法及分析...................................................................................... 11
2.4 语义推理机-JENA........................................................................................... 13
2.5 小结 ............................................................................................................... 14
3 图书本体库建设 ................................................................................ 15
3.1 构建语言及工具 ........................................................................................... 15
3.2 计算机本体领域数据来源 ........................................................................... 15
3.3 计算机本体领域概念结构 ........................................................................... 16
3.3.1 概念结构设计 .................................................................................................... 16
3.3.2 领域概念集示例 ................................................................................................ 18
3.4 计算机本体领域中概念关系处理 ............................................................... 19
3.4.1 领域概念合并 .................................................................................................... 19
3.4.2 概念之间的关系与函数..................................................................................... 19
3.5 本体库的存储 ............................................................................................... 20
3.6 小结 ............................................................................................................... 22
4 数字图书馆中语义检索模型 ............................................................ 23
4.1 总体结构设计 ............................................................................................... 23
4.1.1 数字图书馆体系结构设计...................................................................................... 23
4.1.2 基于本体语义数字图书馆检索模型总体设计 .................................................... 26
4.2 基于本体检索模型 ....................................................................................... 27
4.3 资源映射管理设计 ....................................................................................... 27
4.4 扩展查询 ....................................................................................................... 28
4.4.1 单关键字查询 .................................................................................................... 29
4.4.2 多关键字组合查询 ............................................................................................ 29
4.5 语义索引与推理设计 ................................................................................... 30
4.5.1 语义索引 ............................................................................................................ 30
4.5.2 语义推理设计 .................................................................................................... 31
4.6 检索模型工作总流程 ................................................................................... 32
4.7 小结 ............................................................................................................... 33
5 基于本体语义的数字图书馆检索系统设计与实现 ........................ 34
5.1 检索系统结构图 ........................................................................................... 34
5.2 数据结构设计 ............................................................................................... 35
5.3 模块设计 ....................................................................................................... 35
5.3.1 本体库维护模块 ................................................................................................ 36
5.3.2 资源映射模块 .................................................................................................... 37
5.3.3 检索模块 ............................................................................................................ 38
5.3.4 检索结果输出模块 ............................................................................................ 39
5.4 实验分析 ....................................................................................................... 40
5.5 小结 ............................................................................................................... 44
6 结论与展望 ........................................................................................ 45
6.1 总结 ............................................................................................................... 45
6.2 下一步工作展望 ........................................................................................... 45
参考文献 .................................................................................................. 47
致谢 ........................................................................................................ 50
联系我们
学位论文:1157918155
2860401462
期刊论文:2860401462
1157918155
电话:张老师:13189798483

推荐阅读