1、GOOGLE简仿/strong>
Google(www.google.com)是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin亿998广9月发明,Google Inc. 亿999年创立〿000广月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎〿8年至今,GOOGLE已经获得30多项业界大奖〿/p>
GOOGLE的成功得益于其强大的功能和独到的特点_/p>
GOOGLE支持多达132种语言,包括简体中文和繁体中文_/p>
GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘;
GOOGLE速度极快,据说有10000多台服务器,200多条T3级宽带;
GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜索结果;
GOOGLE的搜索结果摘录查询网页的含有关键字的内容,而不仅仅是网站简介;
GOOGLE智能化的“手气不错”功能,提供可能最符合要求的网站;
GOOGLE皿ldquo;网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页〿/p>
2、搜索入闿/strong>
要用GOOGLE做搜索,当然首先要进GOOGLE网站--www.google.com;不过,163.com和yahoo.com.cn使用的实际上也是GOOGLE搜索引擎,只是对搜索结果进行了编排,但无法提供一些特色功能,如图片搜索等〿/p>
第一次进入GOOGLE,它会根据你的操作系统,确定语言界面。需要提醒的是,GOOGLE是通过cookie来存储页面设定的,所以,如果你的系统禁用cookie,就无法对GOOGLE界面进行个人设定了〿/p>
GOOGLE的首页很清爽,LOGO下面,排列了四大功能模块:网站、图像、新闻组和目录服务。默认是网站搜索。现在进行第一次搜索实践,要查找所有关亿ldquo;易筋绿rdquo;的中文网站和网页。在搜索框内输入一个关键字“易筋绿rdquo;,然后点击下面的“google搜索”按钮(或者直接回车),结果就出来了〿/p>
搜索_ldquo;易筋绿rdquo;
结果:已搜索有关易筋经的中文(简使网页〿共约朿,930项查询结果,这是笿-10顿〿搜索用时0.12秒〿/p>
3、初阶搜紿/strong>
在上例子中,你已经知道了最基本的搜索,即查询包含单个关键字的信息。现在,进一步探讨多个关键字以及关键字间不同逻辑关系的查询〿/p>
3.1、搜索结果要求包含两个及两个以上关键孿/strong>
一般搜索引擎需要在多个关键字之间加丿ldquo;+”,而GOOGLE无需用明文的“+”来表示逻辑“丿rdquo;操作,只要空格就可以了〿/p>
示例:搜索所有包含关键词“易筋绿rdquo;咿ldquo;吸星大法”的中文网顿/p>
搜索_ldquo;易筋绿吸星大法”
结果:已搜索有关易筋绿吸星大法的中斿简使网页〿共约朿74项查询结果,这是笿-10顿〿搜索用时 0.24秒〿/p>
注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内〿/p>
3.2、搜索结果要求不包含某些特定信息
GOOGLE用减叿ldquo;-”表示逻辑“靿rdquo;操作〿/p>
示例:搜索所有包吿ldquo;易筋绿rdquo;而不吿ldquo;吸星大法”的中文网顿/p>
搜索_ldquo;易筋绿-吸星大法”
结果:已搜索有关易筋绿-吸星大法的中斿简使网页〿共约朿,150项查询结果,这是笿-10顿〿搜索用时 0.40秒〿/p>
注意:这里的“+”咿ldquo;-”号,是英文字符,而不是中文字符的“_rdquo;咿ldquo;_rdquo;。此外,操作符与作用的关键字之间,不能有空格。比妿ldquo;易筋绿- 吸星大法”,搜索引擎将视为关键字为易筋经和吸星大法的逻辑“丿rdquo;操作,中间的“-”被忽略〿/p>
3.3、搜索结果至少包含多个关键字中的任意一丿/strong>
GOOGLE用大写的“OR”表示逻辑“房rdquo;操作。假定你是布兰妮和批头士的歌迷,现在要查找所有关于布兰妮和批头士的中文网页〿/p>
示例:搜索包含布兰妮“Britney”或者披头士“Beatles”、或者两者均有的中文网页〿/p>
搜索_ldquo;Britney OR Beatles OR 布兰妿OR 批头壿rdquo;
结果:已搜索有关Britney OR Beatles OR 布兰妿OR 批头士的中文(简使网页〿共约朿1,300项查询结果,这是笿-10顿〿/p>
注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一欿ldquo;丿rdquo;查询〿/p>
3.4〿ldquo;+”〿ldquo;-”咿ldquo;OR”的混合查诿/strong>
混合查询涉及到逻辑操作符的顺序问题。一般而言,搜索引擎按照从左往右的顺序读取操作符号。如果只涉及“丿rdquo;操作咿ldquo;靿rdquo;操作,则不会产生顺序问题,搜索结果数量和关键字顺序无关,不过,具体搜索的结果顺序会视关键字的顺序而定。单纯的“房rdquo;操作也同样道理。但是,如果“房rdquo;查询和其他两种查询混合在一起,问题就复杂了。现在我们做这样的查询:“所有关于Britney或者Beatles、但是没有Madonna相关信息的中文网顿rdquo;〿/p>
搜索_ldquo;Britney OR Beatles -Madonna”
结果:已搜索有关Britney OR Beatles -Madonna的中斿简使网页〿共约朿6,200项查询结果,这是笿-10顿〿搜索用时0.23秒〿/p>
搜索_ldquo;-Madonna Britney OR Beatles”
结果:已搜索有关-Madonna Britney OR Beatles的中斿简使网页〿共约朿6,200项查询结果,这是笿-10顿〿搜索用时0.13秒〿/p>
搜索_ldquo;Britney -Madonna OR Beatles”
结果:找不到和您的查诿Britney -Madonna OR Beatles-相符的网顿/p>
搜索_ldquo;Britney OR -Madonna Beatles”
结果:找不到和您的查诿Britney OR -Madonna Beatles -相符的网顿/p>
可见_ldquo;房rdquo;操作的前后两个关键字必须是默认的“丿rdquo;查询,否则,搜索引擎将无法完成搜索〿/p>
3.5、用“+”咿ldquo;-”减少冗余信息
通常情况下,用一个关键字查询,会得到很多和查询目的不相关的冗余信息。我们总是希望,搜索结果的第一个条目中就包含所需要的信息〿ldquo;+”咿ldquo;-”很多时候就起到缩小搜索结果的范围,以提高查询结果命中率〿/p>
例:查阅天龙八部具体是哪八部〿/p>
分析:如果光甿ldquo;天龙八部”做关键字,搜索结果有20,300项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果〿/p>
(1)、如果你知道八部中的某一部,比如阿修罗,增加“阿修罿rdquo;关键字〿ldquo;天龙八部 阿修罿rdquo;的搜索结果就只有1,050项,可以很快找到全部八部〿/p>
(2)、如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录〿ldquo;天龙八部 佛教 -金庸”的查询结果为1,120项,可以迅速找到需要的资料〿/p>
4、辅助搜紿/strong>
4.1、通配符问颿/strong>
很多搜索引擎支持通配符号,如“*”代表一连串字符_ldquo;?”代表单个字符等。GOOGLE不支持通配符,只能做精确查询,关键字中皿ldquo;*”或耿ldquo;?”会被忽略掉〿/p>
4.2、关键字的字母大小写
GOOGLE对英文字符大小写不敏感,“GOD”咿ldquo;god”搜索的结果是一样的〿/p>
4.3、搜索整个句孿/strong>
GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号〿/p>
示例:搜索包吿ldquo;long, long ago”字串的页面〿/p>
搜索_ldquo;long long ago”
结果:已搜索有关long long ago的中斿简使网页〿共约朿6,500项查询结果,这是笿-10顿〿搜索用时 0.06秒〿/p>
4.4、搜索引擎忽略的字符和词汿/strong>
GOOGLE对一些网路上出现频率极高的英文单词,妿ldquo;i”〿ldquo;com”〿ldquo;www”等,以及一些符号如“*”〿ldquo;.”等,作忽略处理〿/p>
示例:搜索关于第一次世界大战的信息
搜索_ldquo;worldwar i”
结果_quot;i使用过于频繁,没有被列入搜索范围。已向英特网搜索worldwar i. 共约朿,370项查询结果,这是笿-10顿〿搜索用时0.17秒〿/p>
4.5、强制搜紿/strong>
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号〿/p>
示例:搜索包吿ldquo;Who am I ?”的网页。如果用“who am i ?”_ldquo;Who”〿ldquo;I”〿ldquo;?”会被省略掉,搜索将只甿ldquo;am”作关键字,所以应该用强制搜索〿/p>
搜索_ldquo;+who +am +i”
结果:已向英特网搜索+who +am +i. 共约朿32,000项查询结果,这是笿-10顿〿搜索用时3.68秒〿/p>
注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行〿/p>
5、进阶搜紿/strong>
上面已经探讨了GOOGLE的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西〿/p>
5.1、对搜索的网站进行限刿/strong>
“site”表示搜索结果局限于某个具体网站或者网站频道,妿ldquo;sina.com.cn”〿ldquo;edu.sina.com.cn”,或者是某个域名,如“com.cn”〿ldquo;com”等等。如果是要排除某网站或者域名范围内的页面,只需甿ldquo;-网站/域名”〿/p>
示例:搜索中文教育科研网站(edu.cn)上所有包吿ldquo;金庸”的页面〿/p>
搜索_ldquo;金庸 site:edu.cn”
结果:已搜索有关金庸 site:edu.cn的中斿简使网页〿共约朿,730项查询结果,这是笿-10顿〿搜索用时 0.23秒〿/p>
示例:搜索包吿ldquo;金庸”咿ldquo;古龙”的中文新浪网站页面,
搜索_ldquo;金庸 古龙 site:sina.com.cn”
结果:已在sina.com.cn搜索有关金庸 古龙 的中斿简使网页〿共约朿34项查询结果,这是笿-10顿〿搜索用时0.12秒〿/p>
示例:搜索新浪文教频道中关于鲁迅的信息〿/p>
搜索_ldquo;鲁迅 site:edu.sina.com.cn”
结果:已在edu.sina.com.cn搜索有关 鲁迅的中斿简使网页〿共约朿72项查询结果,这是笿-10顿〿搜索用时0.24秒〿/p>
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则_ldquo;site:”将被作为一个搜索的关键字。此外,网站域名不能朿ldquo;http”以及“www”前缀,也不能有任使ldquo;/”的目录后缀;网站频道则只局限于“频道吿域名”方式,而不能是“域名/频道吿rdquo;方式。诸妿ldquo;金庸 site:edu.sina.com.cn/1/”的语法是错误的〿/p>
5.2、查询某一类文件(往往带有同一扩展名)
“filetype:”,这是个尚在测试阶段的GOOGLE特色查询,不过功能已经非常强大,可以做很多意想不到的事情哦〿)
最重要的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前GOOGLE检索的PDF文档大约朿500万左右。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面〿/p>
示例:搜索关于电子商务(ECOMMERCE)的PDF文档〿/p>
搜索_ldquo;ecommerce filetype:pdf”
结果:已向英特网搜索ecommerce filetype:pdf. 共约朿5,500项查询结果,这是笿1-100顿〿搜索用时 0.44秒〿/p>
下面是某项搜索结果:
[PDF] www.ecommerce.gov/apec
文档类型: PDF/Adobe Acrobat - 一般文字档
Page 1. A Partnership of the Business Community With APEC Economies E-COMMERCE
READINESS ASSESSMENT GUIDE www.ecommerce.gov/apec Page 2. ...
www.ecommerce.gov/apec/docs/readiness_guide_files/readiness_guide_5.pdf - 类似网页
可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了〿/p>
搜索PDF文档还可以用“inurl:”语法。比如上例,也可以用“inurl:pdf ecommerce”。搜索结果数量大致相同,不过查询结果顺序则略有很大差别〿/p>
注意,上述查询均是对PDF内文的检索,“ecommerce”这个关键字是包含在PDF文档中的〿/p>
“filetype”的另一个强大用处则在图片搜索。下文将对GOOGLE的图片搜索功能作详细说明,此处只是略提一下。进兿ldquo;http://images.google.com/”,查找关于本拉登的JPG图片〿/p>
搜索_ldquo;Bin Laden filetype:jpg”
结果:搜索有兿Bin Laden filetype:jpg 的图片()。(试验版) 共约朿,630项查询结果,这是笿-20顿〿搜索用时0.14秒〿/p>
除此之外,我尚未发现其他的filetype用法。如果有谁知道,请给我发邮件。预先感谢〿)