学习啦>知识大全>知识百科>百科知识>

什么是全文检索全文检索的简介

谢君分享

  全文检索是一种将文件中所有文本与检索项匹配的文字资料检索方法。那么你对全文检索了解多少呢?以下是由学习啦小编整理关于什么是全文检索的内容,希望大家喜欢!

  全文检索的简介

  基本介绍

  全文检索是将存储于数据库中整本书、整篇文章中的任意内容信息查找出来的检索。它可以根据需要获得全文中有关章、节、段、句、词等信息,也就是说类似于给整本书的每个字词添加一个标签,也可以进行各种统计和分析。例如,它可以很快的回答“《红楼梦》一书中“林黛玉”一共出现多少次?”的问题。

  与之相关的议题

  语根处理 (stemming)

  符素解析器 (token parser) 1-gram, 2-gram , n-gram

  断词/分词 word segmentation

  倒排索引 inverted index

  算法、搜寻策略之模型

  布尔式 boolean

  统计模型 Probabilistic model

  向量空间模型 vector base model

  隐性语义模型 Latent semantic model

  系统检索的介绍

  评量之准则

  判断检索效果的两个指标:

  查全率=被检出相关信息量/相关信息总量(%)

  查准率=被检出相关信息量/被检出信息总量(%)

  开放源代码之全文检索系统

  Apache Solr

  BaseX

  Clusterpoint Server(freeware licence for a single-server)

  DataparkSearch

  Ferret

  Ht-//Dig

  Hyper Estraier

  KinoSearch

  Lemur/Indri

  Lucene

  mnoGoSearch

  Sphinx

  Swish-e

  Xapian

  ElasticSearch

  议题优化的概念

  和中文有关的议题

  断词(分词)

  语法解析

  古籍议题

  多语言混合

  优化

  剔除字(Stopwords)

  词性标注

  权威档(authority file)

  知识体系,本体论(ontology)

  超链接分析(page rank)技术

  历史及未来之趋势

  自由语句搜寻

  基于自然语言的分词
看过“全文检索的简介”的人还看了:

1.浅谈档案信息计算机的检索论文

2.ei论文怎么发表

3.浅谈图书馆古籍的数字化管理论文

4.使用Word2010翻译英文的三种方法

5.高中生物必修一课本目录

    1697773