基于语义Web下本体的分布式搜索研究
渤海大学 胡洁
首先介绍了语义Web和本体相关理论,然后分析了传统信息检索模型特点,并据此结合语义Web技术提出了新的信息检索模型。通过该模型将推理和检索更好紧密结合起来,有效地解决了用户反馈问题和提高了用户查询质量。与传统信息检索模型相比较,它进一步提高了检索质量的查全率和查准率。接着对语义推理进行了研究,探讨了描述逻辑推理算法的优缺点,并结合缺省逻辑对基于规则的推理算法进行了改进,还对算法性能进行了分析。传统单机环境在处理本体数据查询、推理性能和可扩展性等方面表现严重不足。随着语义Web技术不断完善、规模不断扩大、数据量高速增长并呈现多样化等特性逐渐被引起高度的重视。开源Hadoop云计算平台凭借高性能、易扩展性、海量数据存储和超强计算能力逐渐被当前国内外产业界和学术界作为研究云计算最重要的工具。本文基于Hadoop平台设计并实现了分布式倒排索引子系统,论文最后还实现了基于Hadoop平台的语义搜索系统。利用Hadoop大数据处理、高性能计算能力,更好改善了信息检索效率。实验结果表明,被本体描述的信息资源能够很好的被计算机理解和处理。基于分布式计算机平台的语义检索系统,不仅能提供更好的查询效率,而且在信息查全率和查准率方面也得到了很好的改善。