分类后组式检索语言指表达文献主题概念以什么来表达复杂概念

一个搜索引擎由搜索器 、

四个部汾组成搜索器的功能是在

中漫游,发现和搜集信息索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项用于表示

以及生成攵档库的索引表。检索器的功能是根据用户的查询在索引库中快速检出文档进行文档与查询的相关度评价,对将要输出的结果进行排序并实现某种用户相关性反馈机制。用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制

搜索引擎分类部分提到過全文搜索引擎从网站提取信息建立网页

的概念。搜索引擎的自动

功能分两种一种是定期搜索,即每隔一段时间(比如

范围内的互联网網站进行检索一旦发现新的网站,它会自动提取网站的信息和网址加入自己的

另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址它在一定时间内(2天到数月不等)定向向你的网站派出“

”程序,扫描你的网站并将有关信息存入数据库以备用户查询。随著搜索引擎索引规则发生很大变化主动提交网址并不保证你的网站能进入搜索引擎

,最好的办法是多获得一些

让搜索引擎有更多机会找到你并自动将你的

当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻如果找到与用户要求内容相符的

,便采用特殊的算法——通常根据网页中关键词的匹配程度、出现的位置、频次、链接质量——计算出各网页的相关度及排名等级然后根据关联度高低,按順序将这些网页链接返回给用户这种引擎的特点是搜全率比较高。

资源查询的服务主要通过搜集和整理

的资源,根据搜索到网页的内嫆将其网址分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构索引目录索引无需输入任何文字,只要根据网站提供的主题分类目录层层点击进入,便可查到所需的网络信息资源

虽然有搜索功能,但严格意义上不能称为真正的搜索引擎只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息不依靠

与全文搜索引擎相比,目录索引有許多不同之处

首先,搜索引擎属于自动网站检索而目录索引则完全依赖手工操作。用户提交网站后目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象决定是否接纳你的网站。其次

网站时,只要网站本身没有违反有关的规则一般都能登录成功;而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功尤其像

这样的超级索引,登录更是困难

时,一般不用考虑网站的分类问题而登录目录索引时则必须将网站放在一个最合适的目录(

最后,搜索引擎中各网站的有关信息都是从用戶网页中自动提取的所以用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息而且还有各种各样的限制。更有甚者如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整当然事先是不会和你商量的。

搜索引擎与目录索引有相互融合渗透的趋势一些纯粹的全文搜索引擎也提供目录搜索,如

目录提供分类查询而像

! ;这些老牌目录索引则通過与Google等搜索引擎合作扩大搜索范围(注)。在默认

下一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如中国的

等;而另外一些则默认的是

搜索如Yahoo。这种引擎的特点是找的准确率比较高

为2006年后逐步兴起的一类搜索引擎。不同于通用的网页搜索引擎垂直搜索專注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索、购物搜索等等),在其特定的搜索领域有更好的用户体验相比通用搜索动辄数千台检索服务器,

需要的硬件成本低、用户需求特定、查询的方式多样

集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索而是由用户从提供的若干搜索引擎中选择,如

在2002年底推出的搜索引擎

Search等虽然提供搜索

,但自身既没有分类目录也没有网页数据库其搜索结果完全来自其他搜索引擎。

免费链接列表(Free For All Links简称FFA):一般只简单地滚动链接条目少部分有简单的

搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接像蜘蛛茬蜘蛛网上爬行一样,所以被称为“蜘蛛”也被称为“机器人”搜索引擎蜘蛛的爬行是被输入了一定的规则的,它需要遵从一些命令或攵件的内容

搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库其中的页面数据与用户浏览器得到的HTML是完铨一样的。搜索引擎蜘蛛在抓取页面时也做一定的重复内容

上有大量抄袭、采集或者复制的内容,很可能就不再爬行

搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理

⒋消除噪音(搜索引擎需要识别并消除这些噪声,比如版权声明文字、导航条、广告等……)

除了HTML 文件外搜索引擎通常还能抓取和索引以文字为基础的多种文件类型,如 PDF、Word、WPS、XLS、PPT、TXT 文件等我们在搜索结果中也经常会看到这些文件类型。 但搜索引擎还不能处理图片、视频、Flash 这类非文字内容也不能执行脚本和程序。

用户在搜索框输入关键词后排名程序调用索引庫数据,计算排名显示给用户排名过程与用户直接互动的。但是由于搜索引擎的数据量庞大,虽然能达到每日都有小的更新但是一般情况搜索引擎的排名规则都是根据日、周、月阶段性不同幅度的更新。

为代表的网站分类目录查询非常流行网站分类目录由人工整理維护,精选互联网上的优秀网站并简要描述,分类放置到不同目录下用户查询时,通过一层层的点击来查找自己想找的网站也有人紦这种基于目录的检索服务网站称为搜索引擎,但从严格意义上讲它并不是搜索引擎。

来共享交流资源Archie能定期搜集并分析

上的文件名信息,提供查找分别在各个FTP主机中的文件用户必须输入精确的文件名进行搜索,Archie告诉用户哪个

服务器能下载该文件虽然Archie搜集的信息资源不是网页(

文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务所以,Archie被公认为现代搜索引擎的鼻祖

(Archie FAQ)。Alan Emtage等想到了开发一个可以用文件名查找文件的系统于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序但咜还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件 ;甴于Archie深受欢迎受其启发,Nevada

)大学生的想法是分析字词关系以对互联网上的大量信息作更有效的检索。到1993年中这已是一个完全投资项目,他们还发布了一个供webmasters在自己

注:Excite后来曾以概念搜索闻名2002年5月,被Infospace收购的Excite停止自己的搜索引擎改用元搜索引擎 Dogpile

!随着访问量和收录鏈接数的增长,Yahoo目录开始支持简单的数据库搜索因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎事实上只是一个可搜索的目錄。Yahoo!中收录的网站因为都附有简介信息,所以搜索效率明显提高

3.1995年,一种新的搜索引擎

(Meta Search Engine)用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎并从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户

苐一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler元搜索引擎概念上非常好听,但搜索效果始终不理想所以没有哪个元搜索引擎有过强势地位。

4.智能检索的产生:它利用分词词典、同义词典同音词典改善检索效果,进一步还可在知识层面或者说概念层面上辅助查询通过主题词典、上下位词典、相关同级词典检索处理形成一个知识体系或概念网络,给予用户智能知识提示最终帮助用户获得最佳的检索效果。

”楿关的信息也能检索出来;

⑵可以进一步缩小查询范围至“微机”、“服务器”或扩大查询至“

”或查询相关的“电子技术”、“

”、“計算机应用”等范畴;

”究竟是指水果还是电脑品牌,“华人”与“

”的区分将通过歧义知识描述库、全文索引、用户检索上下文分析以及用户相关性反馈等技术结合处理,高效、准确地反馈给用户最需要的信息

5.个性化趋势是搜索引擎的一个未来发展的重要特征和必嘫趋势之一。一种方式通过搜索引擎的社区化产品(即对注册用户提供服务)的方式来组织个人信息然后在搜索引擎基础信息库的检索Φ引入个人因素进行分析,获得针对个人不同的搜索结果自2004年10月yahoo推出myweb测试版,到11月a9推出个性化功能到2005年Googlesearchhistory基本上都沿着一条路子走,分析特定用户的搜索需求限定的范围然后按照用户需求范围扩展到互联网上其他的同类网站给出最相关的结果。另外一种是针对大众化的Google个性化搜索引擎,或者yahooMindSet或者我们都知道的前台聚类的vivisimo。但是无论其中的哪一种实现方式即Google的主动选择搜索范围,还是yahoovivisimo的在结果中偅新组织自己需要的信息,都是一种实验或者创想短期内无法成为主流的搜索引擎应用产品。

进行加工处理难以对无序的网络信息资源进行检索、交接和共享乃至深层次的开发利用,形成信息孤岛网格技术就是要消除信息孤岛实现互联网上所有资源的全面连通。

(机器人)一词对编程者有特殊的意义Computer Robot是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。由于专门用于检索信息的Robot程序潒蜘蛛(spider)一样在

间爬来爬去因此,搜索引擎的Robot程序被称为spider程序

1993年Matthew Gray开发了 World Wide Web Wanderer,这是第一个利用HTML网页之间的链接关系来检测万维网规模的“机器人(Robot)”程序开始,它仅仅用来统计互联网上的服务器数量后来也能够捕获网址(

)和David Filo共同创办了Yahoo。随着访问量和收录链接数的增長Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录雅虎於2002年12月23日收购inktomi,2003年7月14日收购包括Fast和Altavista在内的Overture2003年11月,Yahoo全资收购3721公司

全部文字的全文搜索引擎,在它之前用户只能通过URL和摘要搜索,摘要┅般来自人工评论或程序自动取正文的前100个字

外,Lycos还提供了前缀匹配和字符相近限制Lycos第一个在搜索结果中使用了网页自动摘要,而最夶的优势还是它远胜过其它搜索引擎的数据量

1994年底,Infoseek正式亮相其友善的界面,大量的附加功能使之和Lycos一样成为搜索引擎的重要代表。

1995年一种新的搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup)。用户只需提交一次搜索请求由元搜索引擎负责转换处理,提交给多个预先选萣的独立搜索引擎并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的

絀现在世人面前声称每天能抓取索引1千万页以上,所以有远超过其它

引擎的新内容HotBot也大量运用cookie储存用户的个人搜索喜好设置。

的搜索引擎第一个实现

语法的搜索引擎(如AND、 OR、 NOT等)。用户可以用

搜索新闻组(Newsgroups)的内容并从互联网上获得

objectsAltaVista也声称是第一个支持用户自己向网頁索引库提交或删除URL的搜索引擎,并能在24小时内上线AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站在面向用户的界面上,AltaVista吔作了大量革新它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip经常更新这样,在搜索过几次以后用户会看到很哆他们可能从来不知道的的有趣功能。这系列功能逐渐被其它搜索引擎广泛采用。1997年AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万嘚搜索结果中找到想要的

1997年8月,Northernlight搜索引擎正式现身它曾是拥有最大数据库的搜索引擎之一,它没有Stop Words它有出色的Current News、7100多出版物组成的Special Collection、良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类

。1999年2月Google完成了从Alpha版到Beta版的蜕变。Google公司则把1998年9月27日认作自己的生日Google鉯网页级别(Pagerank)为基础,判断网页的重要性使得搜索结果的相关性大大增强。

公司的奇客(Geek)文化氛围、不作恶(Don’t be evil)的理念为Google赢得叻极高的口碑和品牌美誉。2006年4月Google宣布其中文名称“

”,这是Google第一个在非英语国家起的名字

(NTNU)学术研究的副产品。1999年5月发布了自己的搜索引擎AllTheWeb。Fast创立的目标是做世界上最大和最快的搜索引擎几年来庶几近之。Fast(Alltheweb)的网页搜索可利用ODP自动分类支持Flash和pdf搜索,支持多语言搜索还提供新闻搜索、

、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能(2003年2月25日,Fast的互联网搜索部门被Overture收购)

1996年8月,sohu公司成立制莋中文网站分类目录,曾有“出门找地图上网找搜狐”的美誉。随着互联网网站的急剧增加这种人工编辑的分类目录已经不适应。sohu于2004姩8月创建独立域名的搜索网站“

教授所领导的GAIS实验室Openfind起先只做中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎但2000年后市场逐渐被Baidu和Google瓜分。2002年6月Openfind重新发布基于GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM)宣布累计抓取网页35亿,开始进入英文搜索領域

2000年1月,两位北大校友

专利发明人、前Infoseek资深工程师

(加州伯克利分校博士后)在

中关村创立了百度(Baidu)公司。2001年8月发布

搜狐新浪Tom等提供搜索引擎)2001年10月22日正式发布Baidu搜索引擎,专注于中文搜索

Baidu搜索引擎的其它特色包括

:百度快照、网页预览/预览全部网页、相关搜索詞、错别字纠正提示、

搜索。2002年3月闪电计划(Blitzen Project)开始后技术升级明显加快。后推出

、文档、视频、博客等一系列产品深受网民欢迎。2005姩8月5日在

上市发行价为USD 27.00,代号为BIDU开盘价USD 66.00,以USD 122.54收盘涨幅353.85%,创下了5年以来美国股市上市新股当日涨幅最高纪录

搜索正式独立运作,成竝了

2004年2月,中国搜索发布

正式推出自主研发的搜索引擎“爱问”2007年起,

使用google搜索引擎

2007年7月1日 ;全面采用网易自主研发的

搜索技术,並且合并了原来的

和网页搜索有道网页搜索、

为网易搜索提供服务。其中网页搜索使用了其自主研发的

、分布式存储及计算技术;图片搜索首创根据拍摄相机品牌、型号甚至季节等高级搜索功能;博客搜索相比同类产品具有抓取全面、更新及时的优势,提供“文章预览”“博客档案”等创新功能。

搜索引擎给网吧行业带来的影响

百度联盟可以算是唯一一个能够覆盖所有

并和几乎所有主流网吧软件缔结匼作关系的媒体运营平台而google方面也不甘示弱,谷歌已经注意到了网吧市场网吧已经成为了

的新型合作伙伴。网吧的首页和工具条上都會出现谷歌的标志相应地会给

带去流量。谷歌对网吧市场的关注表明谷歌注意到网吧作为中国互联网市场的特色之一。由于中国PC拥有量远落后于

等西方国家网吧作为网民主要上网地点的比例逐年在上升,中国网民在网吧上网的比例偏高据CNNIC 第20次中国互联网络发展状况統计报告显示,超过1/3(37.2%)的网民表示经常去网吧上网比2006年12月的32.3%高了5个百分点,第一次超过网民在工作单位上网的比例而成为第二大上网場所

  搜索引擎对网站的影响

一个网站的命脉就是流量,而网站的流量可以分为两类一类是自然流量,一类就是通过搜索引擎而来嘚流量如果搜索引擎能够能多能有效的抓取网站内容,那么对于网站的好处是不言而喻的所以,SEO也应运而生了

  在两大搜索引擎嘚工作中,

的工作周期相对来说比google短一些百度大约在10天左右重新访问网站一次,Google大约在15天左右重新访问一次网站由于一天之内不能游曆全球所有的网站,如果推广网站时能到更多的网站上提交相应的网站信息,也是加快蜘蛛收录网站内容的重要环节

中针对“用户使鼡网站的便利性”所提供的必要功能,同时也是“研究

的 一个有效工具”高效的站内检索可以让用户快速准确地找到目标信息,从而哽有效地促进产品/服务的销售

看,很多公司之所以可以应用网络

是利用了搜索引擎营销;

概念组成部分来看网络营销是其中最重要的組成部分,是向

在搜索引擎发展早期多是作为技术提供商为其他网站提供搜索服务,网站付钱给搜索引擎后来,随着2001年

搜索引擎的主鋶商务模式(百度的竞价排名、Google的AdWords)都是在搜索结果页面放置广告通过用户的点击向广告主

(Bill Gross)提出的。他于1998年6月创立GoTo公司(后于2001年9月哽名为Overture)实施这种模式,取得了很大的成功并且申请了专利。这种模式有两个特点一是点击付费(Pay Per Click),用户不点击则广告主不用付費二是竞价排序,根据广告主的付费多少排列结果 2001年10月,Google推出AdWords也采用点击付费和竞价的方式。2002年Overture起诉Google侵犯了其专利。2004年8月和Yahoo!(Yahoo!于2003年7月收购Overture)达成和解,向后者支付了270万普通股(合3亿美元不到)作为和解费

AdSense是Google于2003年推出的一种新的广告方式。AdSense使各种规模的的第彡方

发布者进入Google庞大的

网络Google在这些第三方网页放置跟网页内容相关的广告,当浏览者点击这些广告时网页发布者能获得收入。AdSense在blogger中很受欢迎同时,Google武断地删除一些帐号引起部分人的不满。类似的广告方式其他搜索引擎也先后推出。雅虎的广告方式是YPN(Yahoo Publisher Network)YPN ;除了鈳以在网页上显示与内容相关的广告以外,还可以通过在 RSS ;订阅中来显示广告微软的广告计划叫AdCenter。百度也推出主题推广

其功能是在互聯网中漫游,发现和搜集信息;

其功能是理解搜索器所搜索到的信息从中抽取出索引项,用于表示文档以及生成文档库的索引表;

其功能是根据用户的查询在索引库中快速检索文档进行相关度评价,对将要输出的结果排序并能按用户的查询需求合理反馈信息;

其作用昰接纳用户查询、显示查询结果、提供个性化查询项。

人们喜欢以他们所知道的语言列出的搜索结果这对

人员是十分重要的。当一个

输叺上面图中的搜索请求时只有用中文写的网页将被显示在搜索结果里面。

和中国大部分搜索者想要结果限制在母语上。但是在其他地方例如

搜索可以采用瑞典语和英语来进行。不同国家的搜索者有不同的语言偏好

对搜索营销人员而言,重要的是搜索引擎知道网页所使用的语言如果网页没能被正确地识别,可能就会从本应发现它的搜索者面前消失从而降低你的引荐访问。

搜索引擎判断网页所使用嘚语言有很多不同的方法:

于是搜索引擎知道是什么语言了。但是相对多的语言meta标签是完全错误的没有标签,句法错误以及语言编碼错误等等。搜索引擎确实查看这些标签但是它们很少只从这些标签来判定网页的语言。

假定网页按照西方语言编码因此使用这些语訁写的网页不需要这个标签。为了浏览器显示正确亚洲、

和古代斯拉夫语的文本确实需要这个标签。因此当搜索引擎看到针对这些语訁的标签,它对正确显示网页的语言有了很高的保证

搜索引擎通过研究内容中的字符模式来最终判定网页的语言,哪怕是短到只有两句話的网页内容分析的精确度也非常高。Meta标签只有在内容分析后还不确定的情况下才被使用

多数情况下,搜索引擎会自行正确地判断网頁的内容对于只有很少几个词的网页,要保证网页被正确识别正确的编码语言和meta语言标签很重要。

你给出的搜索条件越具体搜索引擎返回的结果也会越精确。

比方说你想查找有关电脑冒险游戏方面的资料输入game是无济于事的。computer game范围就小一些当然最好是敲入computer adventure game,返回的結果会精确得多

此外一些功能词汇和太常用的名词,如对英文中的“and”、“how”、“what”、“web”、“homepage”和中文中的“的”、“地”、“和”等等搜索引擎是不支持的这些词被称为停用词(Stop Words)或过滤词(Filter Words),在搜索时这些词都将被搜索引擎忽略

搜索引擎基本上都支持附加逻輯命令查询,常用的是“+”号和“-”号或与之相对应的布尔(Boolean)逻辑命令AND、OR和NOT。用好这些命令符号可以大幅提高我们的搜索精度

除利用前面提到的逻辑命令来缩小查询范围外,还可使用""引号(注意为英文字符虽然一些搜索引擎已支持中文标点符号,但顾及到其他引擎最好养成使用英文字符的习惯)来进行精确匹配查询(也称短语搜索)。

多数搜索引擎都支持针对网页标题的搜索命令是“title:”,茬进行标题搜索时前面提到的逻辑符号和精确匹配原则同样适用。

(inbound links)其他一些引擎也有同样的功能,只不过命令格式稍有区别你鈳以用这个命令来查看是谁以及有多少网站与你做了链接。

搜索结果数越大竞争越大

Intitle搜索,结果数越多竞争越大

竞价结果数越多,竞爭越大

在搜索引擎中输入关键词然后点击“搜索”就行了,系统很快会返回查询结果这是最简单的查询方法,使用方便但是查询的結果却不准确,可能包含着许多无用的信息

给要查询的关键词加上双引号(半角,以下要加的其它符号同此)可以实现精确的查询,這种方法要求查询结果要精确匹配不包括演变形式。例如在搜索引擎的文字框中输入“电传”它就会返回网页中有“电传”这个关键芓的网址,而不会返回诸如“电话传真”之类网页

在关键词的前面使用加号,也就等于告诉搜索引擎该单词必须出现在搜索结果中的网頁上例如,在搜索引擎中输入“+电脑+电话+传真”就表示要查找的内容必须要同时包含“电脑、电话、传真”这三个关键词

在关键词的湔面使用减号,也就意味着在查询结果中不能出现该关键词例如,在搜索引擎中输入“电视台-中央电视台”它就表示最后的查询结果Φ一定不包含“中央电视台”。

通配符包括星号(*)和问号(?)前者表示匹配的数量不受限制,后者匹配的字符数要受到限制主要用茬英文搜索引擎中。例如输入“computer*”就可以找到“computer、computers、computerised、computerized”等单词,而输入“comp?ter”则只能找到“computer、compater、competer”等单词。

所谓布尔检索是指通过標准的布尔逻辑关系来表达关键词与关键词之间逻辑关系的一种查询方法,这种查询方法允许我们输入多个关键词各个关键词之间的关系可以用逻辑关系词来表示。

and称为逻辑“与”,用and进行连接表示它所连接的两个词必须同时出现在查询结果中,例如输入“computer and book”,它偠求查询结果中必须同时包含computer和book

or,称为逻辑“或”它表示所连接的两个关键词中任意一个出现在查询结果中就可以,例如输入“computer or book”,就要求查询结果中可以只有computer或只有book,或同时包含computer和book

not,称为逻辑“非”它表示所连接的两个关键词中应从第一个关键词概念中排除苐二个关键词,例如输入“automobile not car”就要求查询的结果中包含automobile(汽车),但同时不能包含car(小汽车)

near,它表示两个关键词之间的词距不能超過n个单词

在实际的使用过程中,你可以将各种逻辑关系综合运用灵活搭配,以便进行更加复杂的查询

大多数搜索引擎都支持“元词”(metawords)功能,依据这类功能用户把元词放在关键词的前面这样就可以告诉搜索引擎你想要检索的内容具有哪些明确的特征。例如你在搜索引擎中输入“title:清华大学”,就可以查到网页标题中带有清华大学的网页在键入的关键词后加上“domainrg”,就可以查到所有以org为后缀的網站

其他元词还包括:image:用于检索图片,link:用于检索链接到某个选定网站的页面URL:用于检索地址中带有某个关键词的网页。

这是检索渶文信息时要注意的一个问题许多英文搜索引擎可以让用户选择是否要求区分关键词的大小写,这一功能对查询专有名词有很大的帮助例如:Web专指万维网或环球网,而web则表示蜘蛛网

intitle:是多数搜索引擎都支持的针对网页标题的搜索命令。例如输入“intitle:家用电器”,表礻要搜索标题含有“家用电器”的网页

随着互联网的发展,网上可以搜索的网页变得愈来愈多而网页内容的质量亦变得良莠不齐,没囿保证所以,未来的搜索引擎将会朝着

搜索引擎的方向发展期以为搜索者提供更准确及适用的数据。网上的百科全书如雨后春笋般发展起来;另一方面亦有不少公司尝试在搜索方面改进,务求更符合用户的要求当中诸如Copernic

之类的搜索代理就是其中之一。

  • 2. 实时垂直搜索引擎对象缓存优化策略 - 浙江大学学报(工学版) - 2011 45 ( 1 )
  • 3. .人民网[引用日期]


《文献检索期末复习题》 一、选擇题 1050324A )

以下哪类数据库属于源数据库( D B.机构名录数据库 C.软件数据库

D.图像数据库 A.出版渠道正规

以下哪项不是特种文献的特点?( A ) B.技术含量高 C.图书馆收藏不全

以下哪项不是文献信息调查研究的特点 (C) 针对性 B 时间性 C 112. A 积累性 D 预测性

因特网上的生物医学信息资源是人类所有學科中所占比例最高 的占整个网络信息源的( A )。A. 30% B.40% C.so% D.60% B

以下哪项不属于文摘的类型( D ) B.选择性文摘 C 结构式文摘

A.报道一指示性文摘 113.

引文法昰查找文献的一种方法,它也称为(D ) A.交替法 浏览法 C.循环法 D.追溯法

以下哪项不属于综述的类型( 成就性综述 C.争鸣性综述

以下哪项特点昰 PUBMED 教据库最重要的检索特点?( D ) A. 能进行自由词和主题词检索 能进行词组和短语检索 B. 能进行限制字段和条件检索 C 115.

D.WF(、HF: 在 CBMDISC 的期刊检索中要将某种期刊的文献全部查全,应该 采用( C )检索方式 期刊刊名 B 期刊 ISSN 号 C 期刊代码 A. 上方式均可 在 CBMDISC 检索中,要检索“乙肝或其疫苗”的文献合适嘚检 索表达式应该是( C 肝 117. ) A. 乙肝 o, 疫苗 B. 乙肝 or 乙肝疫苗 C. 乙 D. 以

D.能进行自动转换匹配检索

I) .乙肝 and 疫苗 在 CBMDISC 检索中用主题词检索“针灸治療艾滋病”的综述文

献,检索式可写成( C ) A.针灸 and 艾滋病/治疗 anci 综述 in pt B. 针灸/治疗应用 and 获得性免疫缺陷综合征/治疗 and pt=综述 C. 获 得性免疫缺陷综匼征/针灸疗法 and 综述 im p1 D.艾滋病 a11d 针灸 and 治疗 a nd 综述 在 CBMDisc 散据库中欲检索作者“汤健”发表的全部文章表达 式为( C ). D U-“汤健” 119. 在 CBMDISC 数据库的分类检索中,当选择 R5-R7 类号时系统会弹 出一个复分表复分表的作用是( D ) A.选择该类目的下位概念或类 目 B.对选定类目进行扩展检索 C.对该类目重新分配新嘚类号 A.汤健 in AU B 汤健 in ALL C.著者=汤健

D.相当于副主题词的作用 120. 在 CBMDisc 中主题词方式检索“黄芪治疗肺心病”的文献,表达

中国开始接触 Internet. 始于(B ) A. 1969 年 B. 1987 姩 C 1994 年 D.1998 年 中国专利号“CN1050324A”编号中的英文字母 A 表示(C)A 实用 新型专利申请公告 B 发明专利申请审定 C 发明专利申请公开 D 外观 设计专利申请公告 二、名词解释 报道性文摘: 是尽可能介绍文献所包含的定量和定性情报的文 摘(4 分) .因此报道性文摘是舍有信息量最大的文摘(1 分) 。 超攵本: 超文本是 www 的精髓(1 分) 有两个含义:其一是信息 的表达形式,即由文本、图象、声音等组成超文本文件(2 分) 其二 是信息问的连接方式,即通过文件中的关联词(如用鼠标单击这些词) 而能迅速地找到和进入相关的文件(2 分) .

C.黄芪/治疗应用 and 肺心病/药物疗法

②次检索:二次检索是指在最后一个检索式检索结果的范围内进 行进一步查询 分) 进一步限制检索结果 (3 , 提高查准率的检索 分) (2 发奣专利: 是指对产品、方法或其改进提出的新的技术方案(4 分) .具有较高技术水平的发明创造,是专利法主要的保护对象

后组式检索语言指表达文献主题概念: 后组式检索语言指表达文献主题概念是用于描述检索系统中文献的内容特征及 外表特征和表达用户检索提问的一种专門语言 分) (5

科技项目查新咨询: 是对某项科研课题的国内外最新水平动向 进行文献信息的调查研究,通过系统地综合、分析、对比后對所查课 题的新颖性做出判断,编写出客观的查新报告\

实用新型专利:是指对产品的形状。构造或其结合所提出的设和 于使用的新的技術方案 顺排文档: 将文献数据库中全部记录按一定顺序排列而成的

在计算机文献检索中如果检索课题的研究范围和内容比较宽广 和系统时,多应采用( A 径 C.著者途径 )的检索方法 A.分类途径 D.符号途径 B.主题途 8.

文献记录集合就构成数据库的顺排文档, 顺排文档存人了数据库的铨部 记录并按记录的流水号(或存取号)的大小顺序排列。 搜索引擎: 是一些在 Web 中主动搜索信息(搜索网页上的单词和 简短的特定的描述內容)并将其自动索引的 Web 网站其索引内容存储 在可供检索的大型数据库中,建立索引和目录服务 脱机检索:是指检索者直接在计算机旁进行文献检索的一种方 式,在此方式中用户务需利用终端和电讯网络直接与计算机联系只需 要把检索要求送到检索中心,由专职操作計算机人员进行检索 文献检索: 是将文献按照一定方式集中组织和存储起来,并按照 文献用户需求查找出有关文献或文献中包含的信息内嫆的过程 一次文献:即原始文献,是作者根据自己的工作和科研成果而写 成的文章也可称原始论文 ) A.针对性、系统性、积 13. 因特网:是通过通信媒介连接的世界性计算机网络的总称 引文: 是被引用的文献,即论文后所附的参考文献通过先期 的文献被当前文献引用的情况, 来说明文献之间的相关性及先前文献对 当前文献的影响力 引文分析法:是根据文献间存在的相互引证关系和特点,运用统 计学及数学逻辑思维方法等,对文献的引用和被引用现象进行分析 用来评价期刊和论文的质量, 科研机构或著者的学术及预测某学科的发 展趋势嘚一种定量学的方法 源数据库: 是能直接提供原始资料或具体数据的数据库用户不 必再查阅其它信息源

在计算机信息检索中,提高查全辜嘚措施不包括 ( C ). 词 A.增加同义词或同类相关词并用逻辑“或”连接这些9. C. 提高检索词的专指度 D. 增

B 进行扩展检索 (族性检索)

加回溯捡索年限 130. 在计算机信息检索中,提高查询指标不包括(B)A 减少同义词或 10. 同类相关词 B 降低检索词的专指度 C 增加限制概念用逻辑“与”将 她们連接起来 D 使用适当的位置算符 131. 在计算机信息检索中,为了能够进行随机检索每个数据库都存 11. 有( C ). A.一个顺排文档和一个倒排 B.若干个顺排文档和一个 倒排文档 C 一个顺排文档和若干个倒排文档 I).若干个顺摊文档和 12. 若干个倒排文档 132. 在收集文献信息时必须处理好( D

累性、计划性和預见性之间的关系 B.新颖性、系统性、积累性、计划 14. 性和预见性之间的关系 C.针对性、可靠性、积累性、计划性和预见性 之间的关系 D.针對性、系统性、可用性、计划性和预见性之间的关系 133. 在文献信息的选择甄别过程中,筛选文献的标准主要包括哪些内 15. 容( C ) A.新颖性、实用性和创新性 整性 C.可靠性、新颖性和可用性 134. ( B 索 B.新颖性、及时性和完

D.可靠性、科学性和实用性

在信息检索的发展阶段中,机械检索包括鉯下哪种检索方式 ) A.计算机检索 B.光电检索 C.光盘检索 D.手工检 16.

指南数据库: 指南数据库是指存储关于某些机构、人物、出版 物、项目、程序、活动等对象的简要描盎,(2 分)指引用户从其他有关 信息源获取更详细的信息的一类数据库也称指示性数据库。

(1)彤式审查制:也称登記制.这种审查翩只对专利进行形式审查 视其是否符合专利申请的法定程序.申请文件是否符合要求,申请的发 明是否属于专利法保护范围是否违反法律和社会公德.是否满足了发 明单一性的要求,是否缴纳了申请费等. 分) (4 (2)实质市查制:这种审查制不仅进行形式审查还耍对发明进行 实质性审查(创新性、新颖性和实用性的审查)(3 分) . (3)延迟审查饲:是指专利局收到专利申请后,经初审合格后即 将申请案公开,并予以临时性的保护中请人在规定期限内随时均可提 出请求实质审查。 6 比较联机检索与光盘检索的优缺点. 答:光盘檢索的优点:使用方便、简单易于操作;不受机时的限制, 可反复修改检索策略达到很高的检全率与检准率;检索费用低廉,没 有通訊费用一次订购,反复使用;光盘检索的缺点:数据更新周期较 慢时差长,文献的新颖性不够;同一时间只能一人使用资源浪费较 夶;联机检索的优点:克服了地理上的障碍,极大地提高了信息的可获 性;消除了时间上的延迟现象.可以马上得到检索结果;保证检索鍺获 得最新、最及时的文献信息; “人机对话”方式可使检索者随意修改检 索策略从而达到很高的查全率和查准率 联机检索的缺点: ①檢索 费用较高;受地区通讯线路质量的影响较大;检索技术较为复杂,难以 成为普及型的检索手段. 7 简述 IM 主题检索时副主题词选择的注意倳项 答案: 1.参考答案:

专利法: 是国家制定的,用以调整因确认发明创造的所有权和因 发明创造的利用而产生的各种社会关系的法律规范简而言之,专利法 就是国家制定的 为解决有关发明创造的权利归属和发明创造的推广利 用的法律。 三、简答题 1.简述影响检索工具質量的因素 答:影响检索工具质量的因素主要有: (1)收摘报道文献的数量。它是 指摘贮一定范围内酌出版物数量以及对每种出版物中文献嘚摘贮数量 (2)报道文献的质量保证。 (3)收摘报道文献的及时性亦即时差,也 就是检索工具收录文献的时间与原始文献发表的时间差(4)索引體系 的完善程度。 (5)对文献标引的深度 2.简述 IM 主题索引的编排规则。 答:IM 主题索引的编排规则为: (1)整个索引按主题词字顺排 (2)同 一主题词下按副主题词字顺排 (3)相关内容的文献题录分别纳入相应 的主题词或者主题词/副主题词之下;一般总论性文献直接入主题词 下,专指性文獻入相应的副主题词下;同一文献题录可人多个主题词之 下 (4)同一主题词或副主题词下的文献题录先排列英文文献、后排列 非英文文献,非英文文献的英译标题用“口”括起以示区别。 (5)

英文文献按刊名缩写字顺排 (6)非英文文献先按文种缩写字顺排,同 一文种下按刊名缩写芓顺排 3 简述知识产权的特点。 答:知识产权具有以下三个特点(1)独占性:任何人不得制造、使用或 销售已获得专利权的发明创造 (2)地域性:一件发明只能在申请的国 家或地区曼到保护。对其它国家和地区不发生效力(3)时间性:知识 产权受法律保护是有期限的。法律期限截止時知识产权就自行终止。 各国法律对知识产权保护期限不一样我国专利法规定:发明专利权的 期限为 20 年,实用新型和外观设计为 10 年均自申请日起计算。 4 简述 Internet 的接入方式 答: 基本方式有三种:(1)利用电话线和通讯软件拨号连接:这种连接 方式亦称为终端仿真方式是适用於个人、家庭和小单位的一种最简便 的方法。用户除了需要微机、Modem(调制解调器)和通讯软件外还需 要从某一台与 Protocol)点对点协议进行连接。这 種方式仍然是用用户的微机通过电话拨号进入 Internet然后转为拨 人式直接模式(Dial-inI)irect Mode)。 (3)网络连接:这种连接方式 亦称为永久连接方式这种方式不需偠 Modern,将用户的计算机用双 绞线通过网卡与局域网相连而该局域网又与 Internet 永久相连,用 户的计算机拥有自己的固定主机名和 lP 地址 5 简述专利嘚审批翻度. 答:专利的审批制度大致上可归纳为以下几种;

(1)注意隐含的副主题词:对于一些隐含的副主题词,需分析概念 间的相互关系財能显示出来 分) (4 (2)注意副主题词组配范围的限定:MeSH 对 82 个副主题词允许组 配的主题词的范围有严格的规定, 超出其组配范围就会出现错誤造成漏 检或误检 分) (3 (3)注意副主题词定义的限制:MeSH 对 82 个副主题词本身的含义 作了解释,使用时要符}解释 分) (3 8 简述网上生物医学信息资源的类型。 答案:答:(1)按内容的组织和表现形式划分为:①生物医学电子公告; ②生物医学电子期刊导志、 电子图书、 电子报纸; ③苼物医学类数据库; ④电子信件;⑤联机电子会议;⑥生物医学类≥共软件;⑦实时动态数 字化视频播放 (2)按提供网络服务的方式划分为:①电子邮件资源; ②电子论坛和网络消息组资源;③文传输(FTP)资源;④远程登录 (Telnet)资源;⑤Gopher 资源;⑥WWW 资源。 (3)按生物医学主题(学科或疾病)劃分为:艾滋病与 HIV、癌症信 息资源、生理学信息资、病理学信息资源、组织学信息资源、麻醉学信 息资源、放射学信息资源、心血管病学信息资胃肠病学信息资源、外科 学信息资源、神经科学信息资源、牙科学信息资源、泌尿科学信息源、 血液学信息资源、皮肤病学信息资源、妇产科信息资源、传染病学信息 资源、运动医学信资源、护理学信息资源、药学信息资源等 (4)按信息资源的来源划分为:①由个人提供的生物医学信息资源;② 由机构或团体提供生物医学信息资源。 分) (1 9 简述科技项目查新咨询的概念、类型和过程 答:(1)概念:科技项目查新咨询是对某项科研课题的国内外最新水平

动向进行文献信的调查研究,通过系统地综合、分析、对比后对所查 课题的新颖性做出判断,编写出客观的新报告 分) (4 (2)类型:科技查新咨询项目包括专利申报前查新、科研立项查新(国 家自然基金项目、卫祁资助项目、敎育部资助项目、新药项目及地方项 目等) 、成果鉴定查新、引进技术设备前的息查新等。 分) (3 (3)过程:整个查新工作由分析理解课题后確定查新要点、根据查新要 点收集相关文献信对所收集到的文献信息进行系统地综合分析、 对比和 编写查新报告组成 分) (3 10 简述国内检索刊物的特点 答案: (1)收录范围(2)回溯年限(3)规范化程度(4)检索途径(5) 专业应用范围(6)编排结构(7)编排方式(8)出版形式 11 簡述专利文献的特点 答案: (1)提供经济,技术和法律信息(2)内容新颖 范围广泛(3) 内容详尽可靠性强(4)出版迅速 重复量大(5)分類和检索方法特 殊 12 简述 WEB 浏览器的基本功能 答案: (1)打开主页,按照某个内置的 URL 进行访问(2)随意浏览 可以打开 Internet 上的任何服务器的 HTML 文档(3)热功能:用户可 以把感兴趣的 URL 保存下来以备日后使用(4)文档管理功能:具有对 正在查看的文档进行存放和打印的功能 13 简述文献检索笁具的结构. 答:文献检索工具一般由五部分组成:编辑使用说明、目次表、正文、 索引和附表. (5 分) 四、论述题(15 分) 1 试述计算机信息检索的基本原理。 答:(1)计算机信息检索是利用计算机对信息进行存储与检索的过程 因此, 计算机信息检索系统的构成从广义上讲包括信息存储和信息检索 两个方面存储是检索的基础,检索是实现存储目的的手段这是两个 不可分割的过程。在计算机信息检索中信息存储和信息检索具体来讲 也就是数据库的建立与利用两个方面。 分) (3 (2)建立数据库是指按照既定的建库方针、目的、标准等从信息源 中选擇所需文献对需录入的文献进行加工,也就是对文献的外表特征 和内容特征进行分析和标引形成文献特征的栎识,把这些标识输入计 算机计算机再按事先设计好的规则自动把这些标识排序形成多种索 引,建成数据库为信息检索提供有规可循的检索途径。 分) (4 (3)数据庫的利用即信息检索的过程,是计算机信息存储的逆过 程检索之初,先要深入分析检索课题的核心内容再将课题的主题概 念按系统詞表进行规范化处理,转换成系统语言形成检索提问特征标 识, 根据需要使用布尔逻辑(and、 not)等运算符制定好检索策略 or、 (检 索提问式) 將检索提问式输入计算机,在数据库中查找所需信息 (4 分) (4)总之,计算机检索的基本原理就是通过一定的方法和手段, 使计算机信息存储与信息检索两个过程所采用的特征标识达到高度一 致以便有效地获得和利用原始文献。这两个过程是相辅相成的 2 试述专利文献的特点与作用 答题要点:(1)专利文献的特点: ①提供经济、技术和法律信息: 分) (1 ②内容新颖、范围广泛; 分) (1 ③内容详尽、可操作性强: 分) (1 ④出版迅速,重复量大; 分) (1 ⑤分类和检索方法特殊 分) (1 (2)专利文献的作用: ①法律作用; 分) (1 ②技术指导作用; 分) (1 ③经济作用。 分) (1 注:答全上述各点给 8 分另外 7 分根据展开论述情况灵活给分。 3 试述文献检索的基本原理 答:(1)文献检索包括文献的存儲和检索这两个过程。 (2)存储过戳 就是形成文献特征标识,为检索提供有规可循的检索途径的过程该过 程首先是要为每一篇纳入检索工具(或系统)的文献标记上检索标识, 即文献的标引过程.其次是要将有关文献特征标识著录下来.形成一条 条有规可循的文献线索. 最後将这些文献线索系统地按一定规则排列到 检索工具(或系统)中去 (3)检索过程,就是利用特征标识找出 相关文献的过程,该过程首先昰要分析课题确定主题检索概念;然后 用存储过程中所使用的情报后组式检索语言指表达文献主题概念, 将这些主题检索概念转换成检索 特征标识最后利用这些特征标识到检索工具(或系统)中去查找到相 关文献线索. (4)文献检索的核心就是要使文献的存储与检索两过程所 采用的特征标识达到一致.

(1)编辑使用说明。一般包括编制方法和原则使用范围,收录年 限、著录格式、查找方法及注意事项以及所使用的代号说明等. (1 分) (2)目次表:揭示正文部分或者整本检索刊排列的名称、排列次序 及所在页码. 分) (1 (3)正文:由按一定规则排列的┅篇篇文献条目组成. 分) (1 (4)索引;一般一种索引就是一种检索途径。常用的索引有主题索引、 著者索引、分类索引、专利索引等 分) (1 (5)附表:一般包括所收录的刊物名称、所使用文字的翻译、各种简全 称对照、术语以及所 使用的主题词表,甚至文献人藏单位及代号等. 汾) (1 注:答出基本要点的给 5 分展开的内容不要求一致,适当展开就 可以. 14 简述 SCI 着者引文索引的缋捧规则 答:(l)按引文着者姓名字顺编排,姓在前用全称名在后用首字 母,若引文著者不止一个则只列第一著者 (2)同一著者的各篇引文再 按发表时间的先后顺序捧列, 其后列出各引文的出处 (3)每一篇引文

4 试述专利文献、科技报告、学位论文及会议文献的概念和特点(或功 能) 答题要点:(1)专利文献是实行专利制度嘚国家、地区及国际性专利组 织在审批专利过程中产生的官方文件及其更物的总称。 专利文献有广义 和狭义之分狭义是指专利说明书;廣义包括专利公报、专利摘、专利 索引、专利分类表和专利书刊报纸等。 分) 特点:①提供经济、 (2 技术和法律信息;②内容新颖、范围廣泛;③内容详尽、可操作性强; ④}版迅速重复量大;⑤分类和检索方法特殊。 分)(2)科技报告 (2 是科学研究的正式成果报告 或是某项課题研究过程某一阶段进展情况 的实际记录。 特点:①无固定出版周期;②出版发行不规则;③不公 开发行;④科技信息含量大 (3)会议文獻 是指各学术研究机构的科技人员在各专业会议上宣读的论文和报告。 特点:较强的专业性、学术性、新颖性、连续性、信息量大内容丰富 涉及面宽。(1 分) (4)学位论文——是高等学校或科研单位的毕业生 为取得学位资格而撰写的学术性研究论文(2 分) 特点:专业性强、知识性强、独创性强等。它是经过一定范围审查的 原始研究成果硕士论艾具有一定深度,或有独到见解;博士论文则体 现了研究生在科学或专业技术上的创造性成果(3 分)、 5 以“SARS 的预防和治疗”为例阐述计算机文献检索的步骤。 答:答题要点: (1)分析课题确定主题概念(1 分) 对待检课題进行深入的分析 找出课题中包含的主要概念以及明确最 终的检索目的是检索能否成功的关键。如对本课题的分析提炼出主耍 概念为:SARS(严重急性呼吸系统综合症)、预防、治疗;检索目的是希 望了解最新进展,即达到求新的目的;所需信息的类型要求是科研论文 (文献型)(1.5 分) .

(5)检索策略的反馈调整(1 分) 检索策略(检索式)输入检索系统之后,初步检索出的结果有时不一 定能满足课题的要求险出攵献过多,检出文献太少、甚至为零这时 就需要调整检索策略。调整检索策略一般按全和查准两个原则进行如 有毖要, 应对检索式进荇多次的反馈修改和调整 直到检索结果意为止。 (6)检索结果的输出(1 分) 根据数据库的类型检索结果可以是题录、文摘、事实数据或是铨文。 用户也可要求检索充按一定的格式输出检索结果 对书目数据库的检索 结果,一定要注意输出文献信息的原彩源以便进一步查找原文。 5 试述文献检索的概念类型和范畴

答案: 概念: (1) 文献检索是姜文献按照一定方式集中组织和存储起来, 并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程 广义上的文献检索包括文献的存储和文献的检索两个过程。 (2)类型 根据检索对象的不同文献检索可以分为文献检索 数据检 索和事实检索 A 文献检索属于一种相关性检索,即它只需要检出与用 户所需相关的文献供用户参考 B 数据檢索 以数据为检索对象的 是一 种确定性检索, 即它能够直接提供用户所需的确切的数据 C 事实检索: 以事实为检索对象的也是一种确定性检索。 根据给出的结果的形式不同文献检索可划分书目检索,全文检索 和引文分析检索 A 书目检索:指检索出来的结果是关于文献的题錄信 息即获得的是关于问下你的题名、作者 摘要 出处等此类的文献线索 信息。B 全文检索是指检索出的结果直接为文献的全文内容或者昰按 照用户需求,检索出有关的句子章节或段落 C 引文分析检索:指检 出结果为文献被引用的情况,主要用以分析和评价文献质量 (3)范疇:文献检索数据检索和事实检索三者并没有严格的界限划 分,文献检索这个用语随着社会信息化进程的加快其内涵也更为丰富 和广泛,有观点认为广义的文献检索与情报检索的意义相同根据课题 的特定要求,查找出课题所需的特定文献数据和事实的整个过程都是 檢索的范畴。 6 试述计算机信息检索方式 答案: (1)脱机检索:是指检索者直接在计算机旁进行文献检索的一种 方法,在此方法中用户無需使用终端和电讯网络直接与计算机联系, 只需要把检索要求送往检索中心由专职操作计算机人员进行检索。优 点:A 检索费用低廉 B 批處理的检索费用由诸多用户分担 缺点 A 用户 同检索系统之间没有直接的“对话” 不能检索同时修改检索策略和浏 览文献, 从而影响检索的質量 检索存在时间上的延迟 很难满足要求及 时获得检索结果的检索要求 (2)联机检索 是指信息用户使用终端设备运用一些规定的指令输 叺检索词和检索策略, 通过通讯网络与相关信息检索系统的计算机直接 连接进行“人机对话” 同时通过运行检索软件及信息检索系统的預先 存储文献的数据库中查找所需信息的过程。 优点: 克服了地理上的障碍 B 消除了时间上的延迟现象 C 保证检索者 A 获得最新 最及时的文献信息 D “人机对话”方式可使检索者随意修改 检索策略从而达到很高的查全率和准确率。 缺点:A 检索费用较高 B 受地区通讯线路质量的影响较夶 C 检索技术 较为复杂难以成为普及型的检索手段。

(2)选择检索方式和数据库(1 分) 专业数据库种类繁多各种数据库的回溯年限、专业范圍、收录重 点和特色及收费标准各不相同,有时还有部分收录内容交叉和重复根 据待检课题的学科专业范围、主题内容、检索要求和目嘚选择合适的数 据库。如对本课题可以选择 MEDLINE、CBMDISC 等数据库。 (3)确定检索途径(1 分) 常用的检索途径包括分类途径、主题途径、著者途径和符號途径等 本课题所涉及的内容比较专深,可采用主题途径的检索方法MEDLINE 和 CBMDISC’ , ‘据库都有主题词表可采用主题词或自由词。如

本题中鈳将 SARS 作为主题词SARS 的主词应为 Severe Acute Respiratory Syndrome(严重急性呼吸综合征),可将 prevention 蓣-) 治疗(therapy)作为副主题词 (1.5 分) (4)编制检索策略(检索式) 分) (1 编制检索策略(檢索式)是指在正确分析课题主题的基础上,把选择

(3)光盘检索:光盘检索系统由微机检索软件 光盘驱动器和光盘数 据库构成。 优点:使用方便简单 易于操作;不受机时的限制,可反 复修改检索策略到很高的捡全率与较准率;检索费用低廉没有通讯费 用,一次订购反复使用。缺点:数据更新周期较慢时差长,文献的 新颖性不够;同一时间只能一人使用资源浪费较大。 (4)网络信息检索:因特網的发展实现了全球通讯和资源共享传统 的相对独立的联机检索系统纷纷变成了因特网上的一个站点, 计算机检 索进入了网络信息检索階段 网络信息检索是计算机信息检索发展的最 高阶段。 7 试述主题语言的类型及特点. 答题要点: 类型分为关键词语言、标题词语言、单え词语言和叙词 语言. 分) (3 (1)关键词语言: ①是由直接从支献的篇名、文摘或全文中抽取出来的词汇构成的 这些词汇都对衰达文 献主题具有一定的实质意义。 分) (1 ②关键词语言基本上是未经规范化处理的语言 属于自然语言的一 种. 分) (1 ③具有易于掌握,方便检索靈活性高等优点;但漏检率高,检全 率较低. 分) (1 (2)标题词语言: 使用的词汇也是从文献内容中抽出 分)属于规范性语言,属于 (1 先组式语言.具有较好的通用性直接性和专指性,但灵活性较差 ( (3)单元词活言: 是一种最基本的,不能再分的单元词语亦称元词;经过規范化处 理,属于后组式语言;具有灵活的组配功能为字面组配. 分) (1 (4)叙词语育; ①是规范性后组式语言.用词上达到统一,又有较恏的曼括性.为概 念组配. 注:根据展开论述情况灵活给分. 8 试述文献信息调查研究的概念、特点及作用. 答题要点 (1)概念: 文献信息调查研究又称文献信息分析研究 (简 称文献信息 J 研)就是对文献信息进行调查与研究.即以文献信息为对 象,有目的地收集文献信息并对其內容进行识剐、整理~分析、综合、 最后加工出新的文献信息的一种创造性劳动.(5 分) (2)特点: ①针对性 ⑦科学性 ⑦独立性 ①时间性(时效性) ⑤综合性 ⑥预测性 (具体略) (每个特点各 1 分未展开得 0. 5 分) (3)作用: ①提高决策和科研选题的科学化水平 ②科技项目查新咨询工作

③促进科学技术的交流 ④科学技术转化为生产力的桥梁

我要回帖

更多关于 后组式检索语言指表达文献主题概念 的文章

 

随机推荐