语义指纹著者姓名消歧理论及应用_韩红旗著_9787518945948

　　《语义指纹著者姓名消歧理论及应用》提到的语义指纹是一种信息指纹，它将文献文本特征表示为固定位数（如64位或128位）的二进制指纹，保留了文本的语义特征且具有很好的降维效果。将语义指纹应用到姓名消歧是一种新的尝试，不仅可以实现良好的消歧效果，而且可以实现较高的消歧效率。
　　《语义指纹著者姓名消歧理论及应用》共分7章，第1章对姓名消歧进行了综述，第2章介绍了姓名消歧的主要方法，第3章介绍了姓名消歧相关国内外评测会议情况，第4章介绍了研究者标识系统，第5章介绍了语义指纹姓名消歧的相关理论，第6章介绍了基于语义指纹的著者姓名消歧，第7章介绍了基于语义指纹的专利发明人姓名消歧，第8章进行了总结和展望。
　　《语义指纹著者姓名消歧理论及应用》可以作为姓名消歧、科学合作网络、科技监测等研究的参考书。

　　狭义上讲，科学合作网络（Scientific Collaboration Network）是指以论文或专利数据中的合著关系为基础构建的社会网络。论文的作者、专利的发明人在本书统一称为著者或作者。科学合作网络中，节点是著者，边是著者之间的合著关系（Coauthorship）。虽然也有研究国家或地区间合作的科学合作网络，但本研究限定其为著者合著关系构建的网络。科学合作网络中的合著关系是一种强社会关系，合著者一般认识，往往是同一个机构、同一个项目、同一个科研工作中的“同事”，或者通过其他合著者间接认识，所以它在揭示科研工作者的关系、发现科研合作社区、提升学术信息检索质量、评价科研人员的能力、提供学术推荐和科研合作建议、服务科研论文和项目评审等方面有着重要的应用，从而受到了不少研究人员的关注。
　　在对科学合作网络进行研究的过程中，我们发现构建的科学合作网络由很多不连通的子网络构成，其中通常存在一个作者数量很多的“中心网络”和很多作者数量较少的“边缘网络”。文献调研中发现，虽然不少研究者已经注意到构建的科学合作网络是由很多不连通的子网络构成的，但并未就其进行深入研究。科学合作网络的不连通问题会在一些实际应用产生错误的结果，影响其应用效果。为此，本项目拟对不连通问题的原因、不连通问题对实际应用的影响进行分析，探索提高科学合作网络连通性的方法。基于不连通是因为数据不全面的假设，对中英双语言体系下的跨数据库姓名消歧问题进行研究，在此基础上，对采用关系扩展方法提高科学合作网络连通性的方法进行研究。基于关系扩展法成本高、效率低等不足，对采用链接预测算法提高科学合作网络连通性的方法进行研究。通过对科学合作网络不连通问题的研究，探索提高连通性的方法，希望为科学合作网络的深入研究和应用提供新的理论或方法的指导。
　　在科学合作网络研究中，著者姓名消歧是普遍认可的一个重要步骤，也是一个关键步骤。来源于传统图书馆权威控制（Authority Control）思想的人工消歧固然是一种较为可靠的方法，但该方法效率较低，人为因素可能造成消歧效果充满不确定性，使其难以满足文献数据量激增和数字图书馆服务及时化的需求。因此，采用自动化的姓名消歧技术是一种更为现实的解决方案，也是当前的研究热点和重点。自动姓名消歧技术是自然语言处理的基本问题之一，最初是作为实体共指现象来研究的，后来在一些会议和评测竞赛的推动下，姓名消歧作为一个单独的研究问题被提出来。提出的众多自动化消歧技术大体上可以落入无监督和有监督的机器学习的范畴。虽然很多算法被提出来以解决这个问题，但迄今为止不少研究者认为它依然是学术界的一大难题。此外.当前的自动化处理技术多研究静态数据环境下的姓名消歧，大多需要较大的运算量，较少考虑真实的、动态的数字图书馆情景下的消歧。

你还可能感兴趣

我要评论