以下为幻灯片页面截图,请点击左边“我要下载”按钮免费下载无水印完整文件
复习
信息获取的一般过程
定位信息需求
选择信息来源
确定信息获取方法,获取信息
评价信息
如何通过因特网获取信息
信息获取一般过程
When
Where
what
文献型
口头型
电子型
实物型
直接法
间接法
权威性
准确性
客观性
时效性
信息获取
典型案例
因特网信息的查找
常用的因特网信息检索方法
知道信息所在网页的地址或网络实名,可快捷地检索到结果
利用分类目录或关键词,在特定的搜索引擎中查找所需的信息
利用网上的在线数据库进行查询
http://www.iciba.com/(在线翻译)
搜索引擎( Search Engine )
搜索引擎是指专门用于因特网信息查找的网络工具
资料:搜索引擎是何时产生的呢?
就是在Internet上执行信息搜索的专门站点,它们可以对主页进行分类与搜索。如果输入一个特定的搜索词,搜索引擎就会自动进入索引清单,将所有与搜索词相匹配的内容找出,并显示一个指向存放这些信息的连接清单。
一、搜索引擎发展史
1990年以前,没有任何人能搜索互联网。万维网还没有出现,人们通过FTP来共享交流资源,但是由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便。
应运而生
1990年,加拿大一所大学的师生想到了开发一个可以以文件名查找文件的系统,于是便有了Archie。
这个系统被认为是现代意义上的搜索引擎的祖先。
由于Archie深受用户欢迎,美国一所大学于1993年开发了相似的搜索工具Gopher,不过此时的搜索工具除了索引文件外,已能检索网页。
当时电脑“机器人” 是指某个不间断地执行某项任务的软件程序。由于专门用于检索信息的“机器人”程序象蜘蛛一样在网络间爬来爬去,因此,搜索引擎的“机器人”程序就被称为“蜘蛛”程序。
随着互联网的迅速发展,一些编程者将传统的“蜘蛛”程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,就有可能检索整个互联网。
崭露头角
现代意义上的搜索引擎——大家现在熟知的Lycos出现于1994年7月。
飞速发展
趣味小资料:不经意中诞生的雅虎
同年4月,斯坦福大学的两名博士生,David Filo和杨致远共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心。从此搜索引擎进入了高速发展时期。
目前,互联网上有名有姓的搜索引擎已达数百家,其检索的信息量也与从前不可同日而语。比如最近风头正劲的Google,其数据库中存放的网页已达30亿之巨!
二、搜索引擎的工作原理
搜索引擎是对互联网上的信息资源进行搜集整理以供用户查询的系统,它包括信息搜集、信息整理建立索引数据库和用户查询三部分。
检索代理软件
数据库
database
搜索引擎的工作原理
元搜索引擎:辅助工具
三、搜索引擎的类型
全文搜索引擎:关键词检索
目录索引类搜索引擎:分类目录检索
搜索引擎按其工作方式主要可以分为:
小结:两类搜索引擎的比较
本课练习
搜索引擎将不断收集到的网页及网址以数据库的形式组织存贮。
查询时用户输入关键词,搜索引擎便会从数据库中检索与之匹配的相关记录,按一定的排列顺序返回给用户。
搜索引擎收集,整理信息,以分类目录的形式链接起来,供用户检索,
用户通过逐级层层点击浏览这些目录,寻找自己所需的站点信息。
可提练关键词的明确信息。基本原则是:构建关键词时,我们尽量不要用自然语言
某一类的主题信息
1、通过网络了解著名搜索引擎“yahoo”的诞生过程。
2、味精是调味料的一种,请问它的鲜味来自哪一种物质,它最早发现于什么汤中?
3、我们生活的城市扬州是个历史悠久的城市,在中国历史上,扬州曾有过三次鼎盛时期,请列出三个时期。
4、位居世界第二的高峰是什么?位居世界第二的洼地又是什么?它们之间的高低落差多少米?
课堂实践:因特网信息的查找
请将搜索的结果以word文件的形式上传至FTP服务器上。
1、全文搜索引擎(关键词索引)
使用自动索引软件来发现并标引网页,建立数据库。它的Spider自动在因特网上漫游,不断搜集各类新网址及网页,形成数以千万乃至亿万条记录的数据库;
它以Web形式提供给用户一个检索界面,供用户输入检索关键词(词组或短语等检索项),以其特定的检索算法找出相关记录,按相关度排序输出。
关键词 就是您输入搜索框中的文字
例1、1982年世界杯足球赛冠军得主是谁?
例2:地震又称地动、地振动,是地壳快速释放能量过程中造成振动,期间会产生地震波的一种自然现象。多少级以上的地震会造成破坏?
a)4.5级 b)5级 c)6级
关键词:
震级 造成破坏
例3:请问位居世界第二的高峰是什么?位居世界第二的洼地又是什么?你知道它们之间的高低落差是多少米?
全文搜索引擎的优缺点
优点:
收集、加工信息的范围广、速度快,能及时地提供新增信息给用户。
每个搜索引擎都提供了多种检索功能 ,有利于提高检索效率。
适合于检索特定的信息及较为专业、具体或类属不明确的课题。
缺点:一次检索输出的结果可能很多,但当中包含了许多重复、虚假的信息 ,因此要过滤一大堆与检索主题互不相干的检索结果。(建议在结果中进行二次检索)
2、目录索引类搜索引擎
一般采用人工方式采集和存储网络信息,是由专业人员在广泛搜集网络资源,进行加工整理,按照某种主题分类体系编制的一种可供检索的等级结构式目录 。
在每个目录大类及其子类下提供相应的网络资源站点地址,并附有简单的介绍。
用户能在目录体系的引导下,通过浏览目录,逐级查找,检索自己感兴趣的主题。
目录索引类搜索引擎
例: 查找上海的相关旅游信息
目录索引类搜索引擎的优缺点
优点:
查准率较高(查全率较低)。
适合查找综合性、概括性的主题概念,或对检索准确度要求较高的课题。
缺点:
专题指南的局限性在于其信息更新速度慢,跟不上网络信息的发展。
数据库的规模相对较小,收录的网页数量和深度都相对不足,比较容易遗漏交叉相关信息 。
3、元搜索引擎
元搜索引擎没有独立的索引数据库,在接受查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。
在这里,“元”(Meta)为“总的”、“超越”之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用
元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。
马虎网:http://www.mahuu.com
万纬搜索www.widewaysearch.com
下课了……