《信息组织》知识点汇总(1)- 联系客服

发布时间 : 星期日 文章《信息组织》知识点汇总(1)- 更新完毕开始阅读c312b46410a6f524cdbf8570

类目体系完整,覆盖全部知识、文献;类目详尽,等级分明,便于理解使用;首创以简明的号码标记类目的方法,便于图书排架、目录组织和检索;首次采用数字层累标记制,通用性好,易排易检,易于扩充、组配,具有较强的助记性、等级性;首创了类目相关索引,提供了从字顺角度查找类目的途径,便利分类表的使用;首次使用了复分与仿分方法;成立了长设机构,不断修订更新,保持分类法的长久生命力。 2.简要论述冒号分类法的分面理论要点及特点。

(1)CC分面理论的核心内容,是阮冈纳赞提出的概概念分析兼综合原则,以及他的分面分析分面标记方法;

(2)分析兼综合的基本思想是:任何复杂的主题都可以分解为基本的主题单元,而简单的主题单元又可以组配成任何复杂的主题;因此分类法的类目可以用基本的主题单元表示,按一定序列组织并配置号码,分类时,先分析析文献主题成分,然后利用已分面的主题概念组配表达文献主题; (3)为了类目体系和标引有一定的规律和层次,阮冈纳赞又提出了五种基本范畴即本体(personality)、物质(matter)、动力(energy)、空间(space)、时间(time),五种基本范畴代表一般主题的五个基本分面,并分别用“,”、“;”、“:”、“ ? ”、“ ‘ ”表示这五种基本范畴;

(4)为了表达各主题之间的关系,CC提出了相的概念,相是一个基本类派生出来部分,相关系则表示主题之间联结形成的关系,CC把相关系分为五种:一般、倾向、比较、差异和影响关系。每一种关系又可细分为:主题相关、面内相关、类列内相关的关系。其中主题相关指两个基本类的关系;面内相关指同一面中两个点的关系;类列内相关指同一类列中两个类列点的关系。相的连接符号为:首相用“&”表示第一相与第二相的连接符号,再分别用15个小写字母来表示各种相的关系。 1. 对分类标引有哪些要求?

为了保证标引质量,对分类标引的基本要求是:准确即归类要正确,归入的学科专业无误;要确切,标引的类号专指度最高、最能代表其内容;充分即信息源中有价值主题的揭示要充分;一致即同一主题内容的资源的标引结果应一致;适用即标引要适应系统的特点和用户的检索需要。 2. 分类标引工作程序应分哪些步骤?

为了确保标引工作质量,分类标引工作程序应严格按如下步骤进行:

1)查重,在资源描述时要核查是否为已处理过的信息资源,以避免重复劳动,提高效率; 2)主题分析,对要处理的资源内容特征进行分析,确定其主题概念;

3)转换主题概念即归类,根据主题分析确定的主题概念,将要处理的资源归入所使用分类法的相应类目; 4)确定标识即给号,根据确定的类目给要处理的资源标引相应的类号; 5)审核,由专人对每种文献的标引结果逐项进行审查。 3.分类标引的基本规则有哪些? (1)按学科属性原则

分类标引必须首先以其内容的学科或专业属性为主要标准,只有在不适于以学科属性为区分标准时, 才考虑以其它方面的性质(如体裁、地域、时代、语文等)作为分类标准; (2)专指性原则

文献分类标引必须符合专指的要求。即将文献分入恰如其分的类,而不能分入范围大于或小于文献实际内容的类目;要区分总论与专论,不要将专论性的文献归入总论类;还要区分是阐述一般原理的,还是阐述具体问题的,不要把研究具体问题的文献归入阐述一般原理的类; (3)实用性原则

文献分类标引必须使文献尽其用,即要根据读者的需要将文献分入最大用途的类; (5)系统性与逻辑性原则

文献分类标引必须体现分类法的系统性、等级性和次

第性。凡能归入某一类的文献,必带有其上位类的属性。也就是说,凡能归入某一类的文献,一定也能归入其上位类; (6)不能单凭题名或篇名的含苞欲放义归类,因为不少题名仅有象征意义,不能确切反映文献内容。 4.简述多主题信息资源的一般标引规则。

(1)多主题信息资源是指同时论述两个或两个以上事物对象的信息资源,主要有并列关系、从属关系、联结主题等类型;

(2)多主题信息资源的一般标引规则是:

1)并列主题是指一个资源同时论述两个或两个以上独立的主题,如果论述两个独立主题并有直接的上位类,则归入上位类,否则则按重点论述的主题或在前的主题归类,同时为另一主题作附加分类;同时论述三个或三个以上的并列

13

主题,可以归入其上位类或概括性类目;

2)从属关系多主题资源,是指一个资源同时论述一个大主题一个小主题且大主题可以包含小主题,一般按大主题归类,但是论述重点是小主题的,可按小主题归类;

3)联结关系的多主题是指一个资源论述两个或两个以上具有应用、比较、影响、因果等关系的主题。归类时,应用关系的主题,一般按应用到的主题归类,但综合论述一主题多方面应用的,仍按该主题归类;比较关系的多主题资源,一般按作者重点论述的主题归类;因果及影响关系的多主题资源,一般按受影响的主题或结果的主题归类。 1. 主题法的特点是什么?主题法有哪些基本类型?

(1)主题法的主要特征是:直接以语词作为检索标识, 以字顺作为主要的检索途径;以特定的事物、问题、现象、主题为中心集中信息资源;通过参照系统等方式揭示主题词之间的关系; (2)主题法的类型主要有标题法、元词法、叙词法、关键词法等

2. 叙词表一般由哪些(宏观结构)部分组成?叙词表组成基本要求是什么?

(1)叙词表一般由字顺显示部分和系统显示部分组成前者主要有字顺表、专有叙词表、双或多语种对照索引,后者主要由范畴索引、词族索引、轮排索引、分类主题一体化词表等部分组成;

(2)好的叙词表的基本要求是:功能完备,各组成部分功能结合,使词表具有各种必要的功能;功能互补,词表各组成部分功能有效,性能互补,在整体功能上效果良好;结构简明,各组成部分没有或少有重复词表结构整体性好,既结构简明,又功能完备;编制和管理方便;易于掌握,易于使用。

3.简要说明叙词语言的词汇控制方法。 叙词语言的词汇控制方法主要有:

(1)词汇选择。词汇选择的原则是客观性、可预见性、实用性、单义性、成族性、专指性和科学性等;词汇选择的类型是以名词为主,必要时也收录少量形容词。叙词可以分为普通名词和专有名词两种。对于专有名词或专有叙词可单独编制专有叙词表。 叙词表中收录词组的原则是:保留学科领域中使用频率较高的词组;凡经分解后,分解后的单词有一方没有独立检索意义,或改变它在词组中的原义,或组配结果可能有歧义的,应该在叙词表中收录词组;有检索价值的专有名词,一般可直接使用。 (2)词形控制与词义控制。

1)词形控制是指根据主题标引与检索的需要对语词的形式及构成成分作出的规定,以方便语词的排检。主要内容有:规定语词形体,一般以通行的字体为准;规定外来语和数字的用法,一般选规范的译名,如果外文的名词术语更通用,也可以直接选用原文;规定标点符号的用法,一般只在必要时使用()、——、? 等符号,另有规定的除外;规定词序,一般使用自然词序,不用倒置词序;规定外文的词形,主要是规定单复数、名词形式等;规定词长,使语词保持在规定的长度以内。

2)同义控制,是指在语义相同而词形不同的语词之间,只能优选其中的一个作为正式的叙词,其余的可作为非叙词收入叙词表,作为查找入口。同义控制的内容包括同义词之间的控制和准同义词之间的控制。一般同义词之间的控制主法是选取较通用的一个作为正式叙词;学名与俗称、新称与旧称、全称与简称、不同译名、产品型号与代号等词汇的控制,一般选择学名、新称、全称、规范译名、产品型号等作为正式叙词;词组与对应的组配形式之间,一般选取对应的组配形式;准同义词之间的控制主要有近义词的优选,即选通用的词作为叙词; 反义词之间的优选一般选表示正面含义的词为叙词;太专指词并入泛指词。

3)词义控制主要是对一义多词现象进行控制,使其具有明确性和单义性。 主要内容有:加限义词;加含义注释、用法注释或历史注释。

(3)词间关系控制,是对叙词与非叙词词间关系的显示与规范,它是使叙叙词系统化的重要手段。叙词语言使用了参照系统、范畴索引、词族索引、轮排索引、词族图等多种方式显示词间关系,从而形成完整的语义网络。语词之间主要有三种关系:等同关系、等级关系、相关关系。在《汉语主题词表》中,等同关系用“用”(Y)“代”(D)两币符号表示,等级关系用“属”(S)、“分”(F)、“族”(Z)三种符号表示,相关关系用“参”(C)表示。

4.为什么说叙词法是多种信息标引与检索语言的综合?

(1)叙词法是一种在综合多种检索语言技术方法基础上发展起来的新型词汇控制系统,它总结了各种标引和检索的经验,综合了多种检索语言的优点,结合新兴的计算机技术来构造它的结构和方法体系;它的参照系统最为完备,索引形式多样,还编制了各种分类主题目一体化的对应词表,使之成为结构完备、功能丰富的检索语言;

(2)叙词法吸取了元词法的组配技术,把元词法的字面组配和反记法发展为概念组配与倒排档;它也吸取了体系分

14

类法的学科分类和等级结构的方法,编制了范畴索引、词汇索引和词汇分类表;同时它广泛吸取了先组式标题和参照方法、关键词法的轮排技术、分面分类法的分面技术等,使之成为最具优势的检索语言。

5.分别简析标题法与叙词法的特点。

(1)标题法的主要优点是:用受控的自然语言作标识,直观地表达主题概念,直接地标引文献;以字顺序列组织标识,提供直接的主题检索途径;主要用参照系统间接显示标题所表达的主题概念之间的关系,形成语义网络;按事物集中文献,不是按学科集中;提供先组式的主题标识,标识含义比较明确,选用标识比较容易;标引所用的标题不必都是标题表中列举的现成标题,必要时可以自拟标题。

标题法的不足是:采用列举方式,往往会带来词汇量大,专指度低,修订难度大;大量采用先组式标题,只能从规定的组配次序入手查找,无法进行多途径检索、多因素检索。 (2)叙词法的优点:

1)结构完备,词汇控制严格;采用概念组配,避免了字面组配带来的一些误差,保证了组配语义的准确性;设置了完善的参照系统,同时使用多种方法显示概念间的关系,有利于提高查全率与查准率;

2)组配准确,标引能力强,能准确、专指地标引和揭示各种主题内容;灵活的叙词组配,使叙词语言有较强的表达能力,能专指、及时地表达复杂、新颖的主题;

3)检索效率高,允许多因素检索、多途径检索,使检索具有灵活性;

4)对检索系统的适应能力强, 能同时使用于标识单元方式与文献单元方式的检索系统,能较好地适应机检系统和手检系统的需要。

叙词法的缺点是:由于词汇控制严格,词表编制和管理的要求高,编制和管理成本高;文献标引需要在概念分析的基础上进行,增加了标引的难度。

6.简析概念组配与字面组配的区别。

(1)两者的本质不同,前者重在拆义,后者在于拆词。它是利用构词法进行词的分拆与组合。概念组配本质是在概念分析的基础上进行概念的综合;

(2)两者的词汇单元不同。单元词是不能再分的词汇单元,而叙词则以表达事物的基本概念为基础的。

1.简述LCSH的结构特点和自由浮动标题的类型。

(1)LCSH的结构特点是:整体结构由主表、副表、和使用说明组成,主表是它的主体,包括导言和字顺表,副表和使用说明另收入《主题编目手册(标题部分)》中;LCSH的款目结构由标题目与非标题、分类号、注释、参照项组成;

(2)LCSH的自由浮动标题四种类型:一是通用自由浮动复分表,由形式子标题和论旨子标题两种,由一般子标题复分使用,使用范围在各子标题下注明;二是特定范畴自由浮动复分表,只适用特定范畴的标题如人物、种族、团体、地名等复分使用;三是类型示范标题表,在某类标题中有代表性的标题下列出示范标题供同类标题仿照使用;四是多款目标题,某些标题有多个类似的子标题,并以举例方式规定其复分办法。

2.评价MeSH的特点。

(1)MeSH的优点是:词表是在医学文献标引的基础上编制的,符合医学文献标引的需要;树形结构表级别深,有利于从分类角度查词;设置了多种参照,全面建立语义关系,提高了检索效率;注释种类多样,说明详尽,有利于提高标引质量,也便于回溯性检索。

(2)MeSH的不足之处是:作为一部从标题法脱胎而来的叙词表,仍带有不少标题表的特点,产生了形式上不一致,简明性不够的缺点;副主题的使用除了在部分主标题下列出之外,同时还采用副标题组配的形式,且使用范围常有变化,增加了标引的难度。

1.比较主题标引与分类标引的异同。

相同:揭示的对象相同;依据的数据来源相同;操作程序相同;基本处理方法相同

不同: (1)主题分析的角度不同。 (2)转换途径不同。 (3)标识不同。 (4)揭示的特点不同。 2.什么是主题分析?主题分析的基本方法?

答:根据标引和检索需要,对信息资源的内容和特征进行分析,析出主题概念的过程。方法:分析主题类型和分

15

析主题结构。

3.什么是分解转换?在分解转换时,应该注意哪些问题?

答:指分析出来的主题概念没有现成的主题词可供直接标引,需将该主题概念分解成若干个简单主题概念,然后再分别用相应的主题词进行转换。转换过程中应注意:(1)避免字面分拆(2)从专指到泛指的次序查找;(3)善于根据概念的含义分析出专指的分解形式。

4. 主题标引的概念转换有哪些基本的方式和规则?

(1)主题概念的转换有两种方式,一种是直接转换,即直接用叙词表的一个叙词来表达,一种是分解转换,即需要用叙词表中的几个叙词组配表达,着涉及到对主题概念的分解转换的问题;

(2)主题概念分解转换的规则是:必须进行概念分,避免字面分拆;必须根据概念内涵析出最专指的分解形式。

5. 简述组配标引的组配规则

主题标引的组配规则是:主题标引的组配必须是概念组配;在几个相互组配的主题词之间,其概念必须有交叉或限定的逻辑关系,不能采取单纯的字面拼合组配或随意组配;应优先选用在概念上具有交叉关系的交叉组配方式,在不能采取交叉组配方式时,才考虑采用限定组配方式;必须选用与文献主题关系最密切、最邻近的主题词,不能选用泛指的主题词进行越级组配;对并列多主题文献进行分组标引;组配必须概念清楚、确切,只能具有一个含义,若组配的结果具有多个含义时,应考虑改用上位或近义的主题词标引,或者是增补新的专指主题词标引;组配次序,应依据国家标准中主题分面组配公式,即:“主体因素(A)通用因素(B)位置因素(C)时间因素(D)文献类型因素(E)”确定其次序,多个主体因素的主题可依逻辑顺序确定其次序,在难以确定逻辑顺序时,可采用自然语言顺序。

6. 简述标引选词的专指性与优先顺序的规则。

标引选词的专指性与优先顺序的规则是:首先选取与文献内容主题概念相对应的、最专指的词标引;词表中没有专指词时,可选用与其最直接相关的、最邻近的主题词进行组配标引(参见组配规则);在词表中没有恰当的主题词组配,可考虑选用一个最直接的上位主题词进行上位标引或近义的题词进行靠词标引;如果以上都不合适时,可以采用增词标引。

1. 用于标引和检索的自然语言有哪些类型?各类自然语言主要应用于哪些方面?

(1)用于自然语言标引与检索的类型有:关键词法、文本检索、 自由标引、 自然语言入口词检索和自动标引等; (2)各类自然语言主要应用于:关键词语言主要用于编制关键词索引,关键词索引编制思想是将关键词不加规范化或只作极少量的规范化处理,按字顺排,提供检索途径的方法;文本检索主要用于自然语言检索,即不对文献进行任何标引,直接依据自然语言中的语词实施匹配查找的系统。常见的文本检索技术有布尔检索、截词检索、精确检索、限定范围检索、调整检索包括容错检索、过滤检索、概念检索、自然语句检索等方面、相关检索等。

2. 后控词表有何特点?它有哪些主要的编制方式?

(1)后控词表的特点是:1)后控性,即在后控词表中,标引与检索用词是自然语言,控制词是人工语言,这与先控语言里控制词的情形相反;2)成长性或动态性,是指后控词表词汇的不断更新、结构显示的不断深化。起初,所控制的词量有限,随着自然语言发展与变化,就需定期对新增的自然语言进行控制,对其结构的显示也逐步细化与深化。后控词表被称为不断增长的词表;3)灵活性。由于受控词表主要用于对自然语言检索标识的控制,不用于标引,其分类体系就可灵活变动,显示方式也可灵活多样,且逐步丰富;4)易用性,具有面向文献和用户的特点,利用后控词表进行自然语言检索,可自由地扩大、缩小检索范围,提高检索效率,减轻检索者智力负担;5)低成本性,是指编制与维护后控词表的费用低于先控词表;6)词间关系不同与传统词表,在后控词表中,等同关系的显示,实际上不是用代关系,而是一种互见关系;7)入口词丰富,词汇控制不如先控词表严格。

(2)后控词表编制方式有:1)积累式。指通过对检索用词的不断积累,由人工整理成词汇表的方式。随着积累词汇的丰富,后控词表不使用效果会越来越好。2)抽词式。指将自由标引、自动抽词标引或通过从词典,工具书抽取的自然语言词汇,经过整理而成的后控词表。3)嫁接式。将自然检索标识与某种先控词汇表(类表或主题词表)相对应而形成的后控词表。它是以原先控表作基本框架,建立自然语言检索标识与原控制词的参照关系,其自然语言词汇作为“用”项加以显示;4)替代品式。是以某种叙词表作为后控词表的代用品使用。该方式因叙词表对使用中的自然语言检索标识不进行规范,其使用效果大打折扣;5)混合式。采用以上某几种方式的结合形式形成的后控词表。其中,对自然语言检索标识的覆盖度(网罗度)、结构控制度、(语义关系揭示的充分程度)、检索途径多样化程度是

16

衡量一部后控词表质量的重要指标。

3. 自然语言与受控语言为何要结合起来?二者结合的发展趋势如何?

(1)自然语言与受控语言结合的原因是由两种语言的优势与不足决定的,自然语言信息的主要优点是:专指度高,处理速度快,可以提供更多的检索点,系统费用低,词汇及时更新,面向用户能力高;它的主要缺陷是:语词与概念不一一对应,存在着大量一词多义、一义多词及词义含糊现象,影响检索效率;检索点多,会检出大量无关文献,影响检准率;对词间关系不控制,不便进行扩检、缩检;词汇量大,必然会给词汇的加工、管理带来困难;自然语言不具有文献资源的组织功能,不能进行图书排架工作。而同时,受控语言具有自然语言没有的优点:通过词汇控制,使得检索结果更准确,提高检准率和检全率;通过词间关系控制,可以在计算机检索系统中显示 示的关系结构,方便用户的扩检与缩检,以满足不同的检索需求;压缩词量,使得词汇所占空间或篇幅较小,便于进行各种处理;某些种类的受控语言,如分类语言,还具有对信息资源集合本身进行系统组织的功能和理的功能;然而受控语言却有自然语言没有的缺陷:标引速度慢,对标引人员的要求高,难以满足使用文献量大的信息组织部门的需要;受控词表编制与维护的成本高;更新速度不如自然语言等。 (2)自然语言和受控语言结合的方式有:

1)两者并存,建立平行的系统,即在检索系统中同时使用文本检索、自由词标引、受控标引等多种检索方式,向用户提供分类号、叙词、关键词等检索途径,供用户选用;

2)建立杂交的系统,同时在一个检索系统中采用控制词汇和自由词进行标引和检索;

3)使用后控词表,即在组织检索系统时采用自然语言,在检索阶段对检索词实施控制(后控); 4)自动赋词标引,利用计算机编制的机内词表在标引阶段对标引词进行控制。

17