第六章 文献信息检索与利用 联系客服

发布时间 : 星期一 文章第六章 文献信息检索与利用更新完毕开始阅读80ed6185d0d233d4b14e6982

第六章 文献信息检索与利用

第一节 文献信息检索基础知识

随着科学技术日新月异地发展,人类步入了信息时代,人们交流、学习及生活的方式已随之发生了巨大的变化。在这些变化中,我们时刻感受着文献信息资源的多元化利用及信息的多样化服务。如今,文献信息资源已同物质资源、能源资源并列成为现代社会资源的三大支柱。文献信息作为一种资源在社会生产和人类生活中起着越来越重要的作用,特别是对中小学生进一步拓展知识视野,有效地提升自我学习能力方面成为了一项必备的基本素养。为了更好地掌握这项技能,从小学起就对学生进行信息教育,提高利用信息意识和获取信息技能,掌握文献信息的相关知识是很必要的。

一、文献信息检索概述

1.文献信息检索的概念

文献信息检索是从文献信息资源集合中找出所需文献信息的过程。从广义上讲,文献信息检索包括两个过程:一是文献信息的存储过程。存储是选择文献信息、按规范化语言文本揭示与描述文献信息内、外特征并使其有序化。即对大量有关信息集中起来,并对信息的外表特征和内容特征进行著录、标引和组织,经过整理、分类、归纳等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。二是文献信息检索过程。检索是系统根用户提问按规范化语言进行概念转换,经逻辑匹配输出与提问相关的文献信息。即是指运用编制好的检索工具或检索系统,查找出满足读者要求的特定信息。狭义的检索是指依据一定的方法,从已经组织好的大量有关文献集合中,查找并获取特定的相关文献的过程。 综上所述,文献信息检索就是将文献信息按照一定的方式组织和存储起来,并能根据用户的需求,找出其相关文献信息的过程。

2.文献信息检索类型

文献信息检索按不同的标准可以划分为不同的类型,下面介绍两种目前比较普遍的划分方法。

(1)按文献信息检索存储和检索内容划分。

按文献信息检索存储和检索内容划分:可分为文献型检索、事实型检索和数据型检索。 ①文献型检索:是指利用文摘、题录、索引、目录等二次文献信息,查找文献线索和根据文献线索查找原始文献。如查找某一课题、某一著者、某一地域、某一机构、某一事物的有关信息,都属于文献型检索范围。如检索“我国中小学课程改革的论文”。

②事实型检索:是指对特定的事件或事实的检索,包括事物的性质、定义、原理及发生的地点、时间、前因后果等。凡是利用百科全书、辞典、年鉴等检索工具从存储事实的信息系统中查找特定的事实过程称为事实型检索。如检索“改革开放以来我国中小学教育事业的成果”。

③数据型检索:是指从检索工具(系统)存储的数据中检索用户所需数据的检索。凡是利用参考工具书、数据库等检索工具检索包涵文献中某一数据、参数、公式或化学分子式等,统称为数据型检索。如上海杨浦大桥的高度与跨度,2008年我国人均GDP指数。 (2)按文献信息的组织方式划分。

按文献信息的组织方式划分,可分为全文检索、超文本检索、多媒体检索和网络信息资源检索。

①全文检索也称全文数据库检索:是指检索系统中存储的是整篇文章乃至整本书。它通过计算机将文件的全貌,包括文字、图形和图像等信息转换成计算机可读形式,直接采用自然语言来设置检索入口,检索时以文中任意信息单元作为检索点,计算机自动进行高速比照,完成检索过程。

②超文本检索:是指超文本的内容排列是非线性的,它按知识(信息)单元及其关系建立起知识结构网络,如具有图形的信息又称超媒体。超文本(媒体)检索是通过超文本(媒体)链接来实现的。其形式有的在网页的文字处有下画线或以图标方式标志,用户点击这些标志便能进入与此信息相关的下一页,在该页面上通过超文本链接进入下一个页面,超文本起信息导向作用。这样,用户在从一个页面转向另一个页面的过程中就可以获取自己所需要的信息了。

③多媒体检索:是指能够支持两种以上媒体的数据库检索。多媒体数据库存储以及数据库检索技术对同时存在文字、图形、图像、动画、声音等媒体的数据进行统一的存取与管理,检索时不仅能够浏览对象的文字描述,而且能够做到听其声、观其形。

④网络信息资源检索:是一种集合各种新型检索技术于一体,能够对各种类型、各种媒体的信息进行跨时间、跨空间检索的大系统。网络信息资源的组织管理需要诸多的信息技术支持,其中以WWW(World Wide Wed)全球浏览技术最具优越性和可用性,它使用WWW浏览器在Windows界面下交互作业,能给用户揭示到一篇篇文章的信息,具有很强的直观性。WWW是一种集超文本技术、多媒体技术和网络技术于一体的新型检索工具。与传统信息检索方式相比较,它具有深入、实时、快速、跨时空共享和多媒体应用等优点。

(3)根据文献信息存储、检索方式和技术划分为手工检索和计算机检索

①手工检索简称“手检”,是指人们通过手工的方式来存储和检索文献信息。其使用的检索工具主要是书本型、卡片式的文献信息系统,即文摘、索引、目录、手册等。

②计算机检索简称“机检”,是指人们利用数据库、计算机软件技术、计算机网络以及通信系统进行信息存储和检索,其检索过程是在人机的协同作用下完成的。包括脱机检索、联机检索、光盘数据库检索和网络信息检索(也称WWW检索)。

二、文献信息检索语言

1.文献信息检索语言概述

文献信息检索语言就是文献信息组织与文献信息检索时所用的主要语言。文献检索语言又称为情报检索语言、文献标引语言、索引语言。它是以文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。因其使用的场合不同,检索语言也有不同的叫法。例如在存储文献的过程中用来标引文献,叫标引语言;用来索引文献则叫索引语言;在检索文献过程中则为检索语言。

2.检索语言的作用

检索语言在信息检索中起着极其重要的作用,它是沟通信息存储与信息检索两个过程的 桥梁。其主要作用如下 :

(1)标引文献信息内容及其外表特征,保证不同标引人员表征文献的一致性; (2)内容相同及相关的文献信息加以集中或揭示其相关性;

(3)文献信息的存储集中化,系统化,组织化,便于检索者按一定的排列次序进行有序化检索;

(4)便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性;

(5)保证检索者按不同需要检索文献时,都能获得最高查全率和查准率。

3.检索语言的类型: 信息检索语言很多,一般按照标识的性质与原理可划分为:分类检索语言和主题检索语言两种。

(1)分类检索语言

分类语言是用分类法来表达各种文献信息资源的概念,将各种概念按学科、专业性质进行分类和系统排列。分类检索语言的类型有三种,即:体系分类法、组配分类法、混合式分类法。我国大多数图书馆采用《中国图书馆分类法》。 (2)主题检索语言

主题语言是从内容角度标引和检索文献信息资源的方法。它不像分类法以学科体系为中心,而是利用词语来表达文献信息资源中论述的主题概念。用来表达文献信息内容的词语称为主题词。主题词不同于自然语言,它是将自然语言中的词语或规范化作为揭示文献主题标识,并以此标识、编排、组织或查找文献的编排方法。主题检索语言又可分为标题、元词、叙词、关键词多种类型。

①标题词

标题词是指从自然语言中选取并经过规范化处理,表示事物概念的词、词组或短语。标题词是主题语言系统中最早的一种类型,它通过主标题词和副标题词固定组配来构成检索标识,只能选用“定型”标题词进行标引和检索,反映文献主题概念必然受到限制,不适应时代发展的需要,目前已较少使用。

②元词

元词又称单元词,是指能够用以描述信息所论及主题的最小、最基本的词汇单位。经过规范化的能表达信息主题的元词集合构成元词语言。元词法是通过若干单元词的组配来表达复杂的主题概念的方法。元词语言多用于机械检索,适于用简单的标识和检索手段(如穿孔卡片等)来标识信息。 ③叙词

叙词是指以概念为基础、经过规范化和优选处理的、具有组配功能并能显示词间语义关系的动态性的词或词组。一般来讲,选做的叙词具有概念性、描述性、组配性。经过规范化处理后,还具有语义的关联性、动态性、直观性。叙词法综合了多种信息检索语言的原理和方法,具有多种优越性,适用于计算机和手工检索系统,是目前应用较广的一种主题检索语言。CA、EI等著名检索工具都采用了叙词法进行编排。 ④关键词

关键词是指出现在文献标题、文摘、正文中,对表征文献主题内容具有实质意义的语词,对揭示和描述文献主题内容是重要的、关键性的语词。读者常用的检索语言就是利用关键词进行检索。

三、文献信息检索工具

无论是文献、数据还是事实,它们都广泛分布于各种文献之中,如果不借助一定的工具,要获取它们无异于大海捞针。这种工具是一种特殊的文献类型工具书,汇聚、浓缩某一方面资料并按特定的方法编排起来。检索工具用以存贮和检索文献或报道、累积和查找文献线索的工具,它是在一次文献的基础上经过加工、整理、编辑形成的二次文献。文献信息检索工具分为事实数据检索工具和线索性检索工具。用于查询数据和事实的检索工具,如字典、词典、手册、年鉴等属于事实数据检索工具。用以报道、存储和查找文献线索的属线索性检索工具,它是附有检索标识的某一范围文献条目的集合。

目前可供人们使用的检索工具有很多,不同的检索工具各有特点,可以满足 不同的文献信息检索的需求。 1.检索工具的类型 (1)目录

目录也称“书录”,是著录一批相关的文献,并按一定的次序编排而成的一种揭示与报道文献的检索工具。书目实际上是伴随着文献的丰富和人类对文献的整理而出现的,是整理文献后的“副产品”。目前,影响较大的书目有《全国总书目》、《全国新书目》(期刊)、《中国国家书目》、《社科新书目》(报纸)、《中国丛书综录》等。对于中小学图书馆而言,目录主要有馆藏图书目录、报刊目录、电子资源目录等。 (2)文摘

文摘是以精炼的文字,将文献的主要论点、数据、结论简要的摘录出来,并按一定的方式编排而成的检索工具。文摘以“精”和“快”见长,“精”即力求以较少的文字突出文献内容的关键,摘要精炼;“快”即它多以期刊形式刊行,及时向读者传递最新信息,出版周期短,报导时差小。

就某一具体的文摘而言,由于它是全文的提炼和浓缩,信息密度大,于原文就有管窥全豹之功能,有助于我们用较少的时间获得较多的信息,节约时间和精力;就检索工具角度而言,文摘具有报导文献广泛系统,揭示文献内容专深的特点,是一种重要的检索工具。所以,文摘为读者广泛使用,是二次文献的核心。

常见的文摘,主要有《新华文摘》、《教育文摘》、《教育卡片文摘》等。 (3)索引

索引一般以文献内部的知识单元或单篇文献为著录基本单位,揭示单篇文献的基本特征、文献中的事物名称和重要信息,特点是“深”和“便”,即对文献内容的揭示程度较书目深,提供的检索途径多,检索快捷方便。

常见的索引有两类:一是提供单篇文献线索的篇名索引,如《全国报刊索引》、《复印报刊资料索引》、《人民日报索引》、《中国古典文学研究论文索引》、《中国小学教学论文索引》等;二是提供字、词、句及其他重要信息线索的事实索引,如《十三经索引》、《全唐诗索引》、《二十四史纪传人名索引》、《二十五史人名索引》等。每条索引款目通常包括3项:标目、说明语、材料出处或存储地址。

①标目:为识别特定款目的主要标志,它控制款目在索引中的位置,检索者通过他可以迅速地找出有关款目。作者姓名、主题词等都可作为标目。采用不同形式的标识,就构成不同类型的索引。如关键词索引、分类号索引、作者索引等。

②说明语:说明语用来限定和进一步细分同一标识下的文献,达到改善索引的功能。文献题名、自编的短语或短句等都可以作为说明语。

③材料出处或存储地址:指明了索引中款目的文献线索,如页码、题录或文摘的顺序号等。在一般检索工具中,文献描述项和索引之间常用文摘号连接,文摘号是检索系统编制者给每一篇文献确定的一个能代表该篇文献的号码,检索者可以通过索引中的文摘号的指