学习啦>论文大全>毕业论文>公共管理>图书馆管理>

数字图书馆中个性化信息检索研究

张重续分享
摘要:本文通过将智能技术应用于数字图书馆信息检索系统,并结合Agent的特点和优势,提出了一个基于Agent技术的个性化信息检索模式,提高数字图书馆的个性化信息服务水平,提高信息检准率,实现面向用户兴趣的信息搜索。
  关键词:数字图书馆 Agent 个性化信息服务
  
  在网络技术迅速发展的今天,人们已经从信息匮乏时代进入到信息爆炸的时代,但是人们在认知过程中所面临的供求矛盾并没有由此而得到解决。数字图书馆的个性化信息检索技术为解决这一矛盾提供了可行性。
  
  1、个性化信息检索的Agent技术
  
  1.1 Agent的概念
  Agent是在分布式系统中持续自主发挥作用的并且能以主动交互服务的方式完成一系列操作的计算实体,是一种基于分布式系统技术的设计模式。
  1.2 Agent的基本结构
  Agent基本结构分为三部分既信息处理系统、引擎模块、内部状态集。
  (1)信息处理系统是Agent的行为控制系统。Agent的活性正是表现在它的事件处理系统上。在该结构中,信息是与Agent有关的特定状态。信息处理系统涉及三个环节的活动即信息的感应、信息的适配、信息的处理。信息的感应,Agent在信息感应环节中时刻捕捉其所关注的信息状态的出现。并根据其活动类型启动相应的信息适配器工作。信息的适配,信息的适配主要是Agent通过适配器获取相关事件信息作识别。在Agent的基本结构中适配器作为外界与Agent交流信息的接口来使用。信息的处理,Agent通过信息的感应和适配表明了当前信息检索事件的表征状态,而信息的处理这一环节正是通过对信息检索事件的表征状态的处理使Agent智能化的不断发生变化。
  (2)引擎模块是Agent的核心。Agent的引擎种类主要有以下三种触发引擎、反射引擎、执行引擎。触发引擎,当出现某些事件时,触发引擎就操纵事件的规则,执行复杂的推理以决定事件的反映。比如说一个传递给A的服务器请求导致消息事件的发生。A的(消息)事件感知将及时检测该事件的发生’从而引发A的(消息)事件适配接收此消息。反射引擎,其作用是检测事件并且反映出Agent现有的状态。执行引擎,信息检索事件发生时能够使用虚拟机系统调用Java或者调用脚本语言解释系统。总的来看,引擎模块主要负责处理人机之间检索信息的互动,具有交互与协调功能。
  (3)内部状态集是表现Agent当前状态的成分,它包括感知器、适配信息、数据库信息。感知器,感知器时刻感应检索信息的出现。适配信息,从感知器接受信息,并且对其做出反映并提供与其它信息资源做出连接。比如用户界面信息、连接指引信息等。数据库信息,为了方便信息的查询及共享使信息以某种标准格式存储在库里。
  
  2、Agent的个性化信息检索结构体系
  
  2.1 现有的个性化信息检索结构体系的缺陷
  (1)较少的考虑用户的差异,适应用户兴趣变化能力差
  (2)综合利用个性化信息检索优势性差
  (3)用户与检索系统交互方式比较单一
  (4]检索精度和效率低
  (5)动态监测能力差
  2.2 Agent个性化信息检索的结构体系总体建设思路
  通过对现有的个性化检索结构体系缺陷的分析,我们提出了基于Agent的个性化信息检索结构体系。
  3.Agent的个性化信息检索
  根据以上对基于Agent个性化信息检索结构体系的思路分析,笔者提出了以下新的基于Agen价性化信息检索模型
  3.1 针对现有的个性化信息检索模型的缺陷进行了如下的改进:
  (1)进一步的考虑到用户的差异并采取循环反馈的措施使的系统给出结果能够自适应于用户查询兴趣的变化。并在用户接口和用户数据库连接环节除了采用相关问题反馈和聚类处理还采用了更新创建用户档案的措施,进一步提高了查询效率。
  (2)采用了基于内容和查询协作的双向混合过滤,使的查询结果更加准确。
  3.2 工作流程描述如下:
  (1)用户描述兴趣和提出检索请求,在用户接口部分用户Agent接受该请求,调用用户信息数据库中的用户个性化信息,通过推理产生精化的个性化检索模式。
  (2)启动信息检索模块,调用元搜索引擎去检索与用户兴趣最为相关的信息,同时通过情景关注Agent对信息动态变化予以关注。并且进一步通过基于多Agent协同合作的检索器进行提取和分解有用信息。
  (3)结合搜索引擎调度机制及用户个性化信息推送Agent,根据查询请求及对用户需求分析,进行搜索,并将信息搜索Agent搜集来的信息装入数据库,自动分类,搜索工作是时时进行的。
  (4)系统将用户需要的信息通过个性化信息推送Agent、信息过滤Agent、信息挖掘Agent等多个Agent间的协作处理后提供给用户,还可以向用户推荐最新的和其他兴趣相似的用户感兴趣的信息,同时更新通用兴趣主题库。
  (5)通过相关问题反馈和聚类处理模块,将用户评价记录到相应的知识库中。同时更新用户兴趣档案。
  (6)收集从各个选中的搜索引擎所返回的结果,消除无效的链接页面,去除重复、多余的信息,按照相关性进行排序。
  (7)根据用户要求,把这些信息依照相关性从高到低的顺序按照统一的格式返回给用户。
  (8)用户通过浏览返回的结果确认是否为感兴趣的信息,并将反馈结果交给用户信息数据库进行聚类,精化用户信息数据库信息。
  
  4、结 语
  
  数字图书馆个性化信息检索是对数字图书馆实现“以用户为中心”的信息服务模式的有益尝试。数字图书馆的个性化信息检索的实现是一项十分复杂的工作。他依赖与很多技术的发展。目前虽然取得了一些进展但尚存在需要完善和改进的地方。因此,我们应该将更多科研成果应用与其中,加强对模型的研发,以推出效率更高的检索模型。
    43430