《领域本体构建方法及实证研究:以测绘学领域为例》从本体的定义、类型、基本元素、描述语言、构建方法和构建工具分析了本体的基本内涵和构建本体的基本方法,把本体构建方法划分成概念获取、关系获取和形式化三个部分;运用组词规则、N-gram、互信息、信息熵、加权等算法研究了领域本体的等级关系和非等级关系的提取方法;运用Jena工具研究了领域本体的形式化方法。作者通过对现有方法的反复实验,针对领域本体构建过程中存在的问题,对现有的方法进行了综合用用,并对部分方法进行了改进,最终提出了一套构建本体的通用方法。最后,本书以测绘学领域的数据为例,对该方法进行了实用检验,实验结果证明了该方法的可行性。本书结构严谨、布局合理、重点突出、逻辑清晰、实例丰富,是一本系统讲述领域本体构建方法的专著。
余凡,讲师,武汉大学质量发展战略研究院研究员,研究方向为宏观质量管理、质量大数据等。先后主持中国博士后基金项目、武汉大学自主科研项目,参与国家社会科学基金重大项目、“十二五”科技支撑计划项目等国家级、省部级项目7项,在Electronic Library、《宏观质量研究》等国内外期刊上发表学术论文16篇。
0 引言
0.1 选题背景与研究意义
O.1.1 选题背景
0.1.2 研究意义
0.2 国内外研究综述
0.2.1 基于不同数据源的本体半自动构建方法研究
0.2.2 本体概念获取方法研究
O.2.3 本体关系获取方法研究
O.2.4 本体形式化方法研究
0.2.5 国内外研究述评
0.3 研究目标与思路
0.3.1 研究目标
0.3.2 研究思路
0.4 研究方法与工具
0.4.1 研究方法
0.4.2 研究工具
0.5 创新之处
1 本体相关理论研究
1.1 本体的定义
1.2 本体的类型
1.3 本体的基本元素
1.4 本体描述语言
1.4.1 可扩展标记语言XMI
1.4.2 资源描述框架RDF
1.4.3 网络本体语言OWL
1.5 本体构建方法
1.5.1 本体构建抽象方法
1.5.2 本体构建具体方法
1.6 本体构建工具
1.6.1 Prot6g6
1.6.2 Jena
2 领域本体的概念提取方法研究
2.1 基于叙词表的领域本体概念提取方法
2.1.1 叙词表的分类及存在的问题
2.1.2 文本存储方式的转换
2.1.3 关系二维表的数据结构
2.1.4 叙词表编码映射
2.1.5 实验分析
2.2 基于文本的领域本体概念提取方法
2.2.1 领域本体概念提取流程
2.2.2 PDF文献的下栽和转换
2.2.3 文本切分方法
2.2.4 领域词汇提取方法
2.2.5 领域词汇的筛选方法
3 领域本体的关系提取方法研究
3.1 领域本体的等级关系提取方法
3.1.1 基于叙词表的等级关系提取方法
3.1.2 基于文本的等级关系提取方法
3.2 领域本体的非等级关系提取方法
3.2.1 基于叙词表的非等级关系提取方法
3.2.2 基于文本的非等级关系提取方法
4 领域本体形式化方法研究
4.1 本体、0WL和语义
4.2 形式化语言选择
4.3 本体的形式化
4.3.1 本体形式化目标
4.3.2 本体形式化方法
4.3.3 测绘学领域本体形式化
5 测绘学领域本体构建系统的实现
5.1 领域本体构建流程
5.2 需求分析
5.3 系统总体设计
5.4 系统详细设计
5.4.1 概念提取模块
5.4.2 概念筛选模块
5.4.3 等级关系提取模块
5.4.4 非等级关系提取模块
5.4.5 领域本体形式化模块
5.5 测绘学领域本体可视化展示
5.6 测绘学领域本体的应用领域
5.7 领域本体构建方法性能测试
6 结论与展望
6.1 结论
6.2 不足与展望
参考文献
附录:测绘学领域本体代码
后记
《领域本体构建方法及实证研究:以测绘学领域为例》:
(1)研究本体以及本体构建方法的相关理论(第1章实现)。具体研究本体在信息科学领域的定义是什么;本体具备哪些特征;本体有哪些不同的类型;本体由哪些基本元素组成:描述本体的语言包括哪几种,它们之间存在什么联系;本体包括哪些抽象和具体的构建方法;本体构建的工具有哪些。
(2)研究本体概念提取方法(第2章实现)。具体研究如何从叙词表和文本中提取领域概念:如何利用关系二维表的数据结果存储叙词表概念;如何实现不同编码的叙词表之间的映射;如何利用叙词表组词规则和N—gram算法提取文本概念;如何利用扩展互信息、信息熵过滤概念;如何利用扩展信息熵和加权算法筛选领域核心概念。
(3)研究本体关系提取方法(第3章实现)。具体研究如何提取叙词表和文本中的等级和非等级关系;如何利用基于字和词的邻近词汇相似度算法形成等级关系以及两种算法结果的比较分析;如何利用扩展的关联规则算法提取本体三元组中的主语和宾语:如何利用规则统计的方法提取本体三元组中的谓语。
(4)研究本体形式化方法(第4章实现)。具体研究如何选择本体形式化语言;本体形式化的目标和具体方法有哪些;如何实现本体的形式化处理。
(5)对本体构建方法进行系统实现(第5章实现)。描述领域本体构建的总体流程,并以测绘学为例,对上文研究的本体构建方法予以系统实现。通过需求分析、总体设计和详细设计,将系统细分为概念提取模块、概念筛选模块、等级关系提取模块、非等级关系提取模块和形式化模块。系统分别实现每个模块的具体功能。
0.3.2研究思路
本书首先提出问题,然后分析并解决问题,最后辅以实证研究,以保证本研究的理论和实践紧密结合。本书采用总一分一总的研究思路,在总结本体构建理论方法的基础上,分章节对本体构建的具体步骤进行探究,最后在实证中分别使用这些构建方法,从而检验构建方法的适用性。具体而言,本书既分别对本体构建步骤进行研究分析,又对这些方法进行比较分析。既有理论方法的研究,也有对这些方法的应用研究。既有单个方法的研究,也有多个方法的综合研究。既有对现有方法的研究,也有对现有方法改进的研究。本书采用理论与实践紧密结合的方法,针对目前构建方法的不足,对现有的方法进行适当的综合和改进,以促进本体构建方法的发展,从而扩大本体应用的广度和深度。
……