《信息检索与利用》知识点

发布时间 : 星期五 文章《信息检索与利用》知识点更新完毕开始阅读

3.国际标准文献检索的主要数据库及网站

美国IHS标准数据库、ISO网站、IEC网站、美国国家标准学会

第三节 会议文献及其检索

一、会议文献概述

会议文献是指在各种会议上宣读提交的论文、产生的记录及发言、论述、总结等形式的文献。许多学科中的新发现、新进展、新成就以及提出的新研究课题和新设想,都是以会议论文的形式向公众首次发布的。会议文献具有以下特点:内容新颖、及时性强;学术水平高、专业性强;数量庞大,内容丰富;可靠性强;出版形式多种多样。

二、会议文献检索

第四节 学位论文及其检索

一、学位论文概念

学位论文是高校和研究机构的本科生、研究生为获取学位资格而撰写的学术论文。

二、学位论文检索

第五节 科技报告及其检索

一、概念

科技报告是指科研工作成果的正式报告或研究过程进展情况的技术文献。

二、科技报告的分类 三、科技报告的检索

第六章 Internet网络信息资源检索

第一节 Internet基础知识

一、Internet的起源与发展

纵观Internet的发展历史,它经历了如下三个发展阶段: 1. ARPAnet的诞生 2. NSFnet的出现

3.现代Internet的产生

二、Internet在中国

中国的四大骨干互联网

(1)中国科学技术网(CSTNet) (2)中国金桥信息网(ChinaGBN)

(3)中国公用计算机互联网(CHINANET) (4)中国教育和科研计算机网(CERNET)

21

三、Internet的基本概念

1. TCP/IP协议

(1)TCP/IP协议的作用:是Internet保证各种不同类型的计算机网络实现相互通信一套规则或协议。

(2)TCP协议的概念和用途:TCP是传输控制协议,规定传输信息怎样分层、分组和在线路上传输。

(3)IP协议的概念和用途:是网际协议,定义Internet上计算机之间的路由选择,把不同网络的物理地址转换为Internet地址。

2. IP地址和域名

(1)IP地址的概念:Internet上的众多计算机和信息资源必须通过名字和地址来进行识别,接入Internet的计算机或节点被赋予一个惟一的数字作为地址,称为IP地址,用小数点隔开的四组数字组成。

(2)域名的概念和结构:Internet中每台计算机的域名结构为主机名、机构名、网络名、最高层域名。

3. URL(统一资源定位器)

URL是信息在网上的地址,可以将世界上所有的联机信息资源组织成有序结构,用来定位和检索WWW上的文档。它的格式有三部分组成:第一部分是协议(或称服务方式),大部分Internet文档用http,其他常用的协议有ftp、nntp、gopher、telnet等;第二部分是存有该资源的主机IP地址;第三部分是主机资源的具体地址。

四、Internet提供的信息服务

1. WWW信息服务 2. 远程登录(Telnet) 3. 文件传输协议(FTP) 4. 电子邮件(E-Mail)

5. 网络新闻服务(Network News) 6. Gopher信息服务 7. 博客(Blog)与RSS

第二节 网络检索工具

一、网络检索工具的组成

网络检索工具由三个部分组成:数据采集子系统、数据组织子系统和用户检索子系统。

二、网络检索工具的类型

1. 按检索机制划分

根据检索工具的数据检索机制,可将检索工具分为检索型、目录型和混合型三种类型。 2. 按检索内容划分

根据检索工具的数据内容,一般可将检索工具分为综合型、专题型和特殊型三种。 3. 按包含的检索工具数量划分

根据检索工具数量划分为单独型的检索工具和集合型的检索工具。

22

4. 按检索资源类型划分

根据检索工具针对的数据资源类型,可分为万维网检索工具和非万维网检索工具。

第二节 常用搜索引擎及专业网站

搜索引擎:广义上是指一种基于Internet上的查询系统,包括信息存取、信息管理和信息检索;狭义上是指一种为搜索Internet上的网页而设计的检索软件。

一、中文搜索引擎

(一)Google中文版

1. 简单搜索

关键词搜索技巧:

(1)不支持截词,但可以在搜索时使用通配符*,而且包含―*‖必须用\引起来,这在搜索诗词时特别有效。如:?床前明**?

(2)对大小写不敏感。

(3)最常用的字符以及数字和单个字母等高频词,在检索时系统自动忽略不作检索,称为禁用词,如果必须检索禁用词时可用― ‖。如:―www‖

(4)支持布尔逻辑运算,逻辑与检索无需添加and,两词间空格默认and匹配;逻辑或检索必须用大写OR连接关键词;逻辑非检索用-表示,但减号之前必须留一空格,不能使用not表示。

(5)短语或词组检索可用??限制短语或词组的完整性。

(6)―~‖符号搜索近(同)义词。如:输入~management,结果中不仅包括management,还包括?manager?、?administration?等词的页面。

(7)拼音汉字转换。Google 运用智能软件系统对拼音关键词能进行自动中文转换并提供相应提示。例如:搜索―shang wu tong‖, Google 能自动提示 ―您是不是要找:商务通‖。 并能支持模糊拼音搜索,为用户提示最符合的中文关键词。

(8)一些算符的使用:define、link、filetype、inanchor、intext、intitle、inurl、site、related

2.高级搜索 3.模块搜索 4.帮助工具

手气不错、使用偏好、网页翻译、语言工具、网页快照、类似网页

(二)百度

1.简单搜索

关键词搜索技巧:

(1)对大小写敏感。当以大写字母查询时,默认为精确匹配,即查询结果不包括小写的关键词;而以小写字母查询时,则同时查找大写和小写。

(2)最常用的字符以及数字和单个字母等高频词,在检索时系统自动忽略不作检索,称为禁用词,如果必须检索禁用词时可用 ― ‖。

(3)支持布尔逻辑运算,逻辑与检索无需添加and,两词间空格默认and匹配;逻辑或检索用 | 连接关键词;逻辑非检索用-表示,但减号之前必须留一空格。

(4)短语或词组检索可用??限制短语或词组的完整性。

(5)书名号是百度独有的一个特殊查询语法。在其他搜索引擎中,书名号会被忽略,

23

而在百度,中文书名号是可被查询的。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。

(6)支持算符的应用,如:filetype、intitle、inurl、site。 2.高级搜索 3.模块搜索 4.百度帮助

(三)中国雅虎 (四)搜弧

二、英文搜索引擎

(一)AltaVista

AltaVista是功能全面、搜索精度较高的全文搜索引擎之一。截止2002年6月,AltaVista宣称其数据库已存有11亿个Web文件,并且经过升级,其搜索精度已达业界领先水平。允许以25种不同的语言进行搜索,并提供英、法、德、意、葡萄牙、西班牙语双向翻译。

(二)Excite

Excite是一个基于概念性的搜索引擎,它在搜索时不只搜索用户输入的关键字,还可―智能性‖地推断用户要查找的相关内容进行搜索。它建立了一个收集有5500万网页的新闻组数据库,还每天搜索300个新闻媒体,将有关内容组织到新闻文章索引数据库。

(三)Lycos

Lycos创建于1995年,是搜索引擎的元老,最早提供信息搜索服务的网站之一。Lycos提供有18大类目录总共超过25万个网站查询,并且每周添加并更新内容,同时提供了网站、网页、新闻、小说全文阅读、产品、FTP、MP3、多媒体(图片,音频和视频文件)等多功能的搜寻服务。

三、常用农业生物专业网站

1. 美国国家农业图书馆(NAL) 2. 联合国粮农组织(FAO)

3. 国际应用生物科学中心(CAB International) 4. 欧洲农业网

5. 欧洲生物信息研究所(EBI)

6. 美国国家生物技术信息中心(NCBI) 8. PSD数据库

9. 中国农业信息网

10. 中国农业科技信息网

第四节 开放存取信息资源的利用

什么是开放存取?

《布达佩斯开放获取计划》(BOAI)中给出的?开放存取?的定义:对文献的?开放存取?不应存在不同的政策和权限,用户可以通过Internet免费阅读、下载、复制、传播、打印和检索作品,实现对作品全文的链接,为作品建立索引,将作品作为数据传递给相应软件,或者进行任何其他出于合法目的的使用。而这些使用方式除网络本身的物理障碍和出于对作者著作权保护的考虑外,不应受经济、法律和技术的任何限制。

24

联系客服:779662525#qq.com(#替换为@)