搜索者容易犯的七个低级错误
这里描述了菜鸟们搜索时容易犯的七个低级错误,正是因为你经常犯这些错误,所以你总是得到无用的、荒谬的或者完全没有意义的搜索结果。而一旦你认识到这些错误,将很容易把这些小鬼从你的搜索工具箱中永远驱逐出去。
1:停用词Sputtering on ’’Stop Words’’
=======================================
一些搜索引擎会忽略这些词,当你把停用词输入搜索框时,不管网上有多少数量的相关文件,它们一个都不会找回来给你。
这些被叫做“停用词”(stop words),因为搜索引擎在它的数据库里碰到这些词时不会搜索。
为什么不搜么?因为停用词可能太常见了以至于无法搜索出有意义的结果,或者是语言中的副词、连词、介词,或者是’’be’’ 的变体如is、are、were、been等无意义的词,除非它们在一个短语中且有重要的名词和动词相伴。
如果你在一个搜索请求中使用了停用词,那么你得到大量毫不相关的搜索结果。比如,短语’’searching the Web’’ 包含了两个停用词,’’the’’ 和 ’’Web’’。虽然这还不算特别常见的词汇,但Web 在网络上实在是太常见了,使它事实上不能帮你搜索到什么有用的内容。
如果去掉停用词,’’searching the Web’’ 变成 ’’searching’’,这个关键词带给你的搜索结果会从搜索一个逃犯直到寻求启蒙。(quests for enlightenment)—如果你够幸运,当然也会得到一些关于“searching the Web”的搜索结果。
怎样辨别停用词呢?300个最常用的英文词汇基本上都是停用词,搜索引擎google在你的搜索关键词中含有停用词时,会把它忽略的每个停用词告诉你,就显示在搜索结果页最上边。你可以用一个含停用词 ’’web’’ 的关键词试一下。
2:布尔操作符Bungling with Boolean
=====================================
布尔操作符,象and、or 和not,能够使你的搜索结果更精确——如果使用正确的话。
问题在于布尔操作符看上去太简单了,似乎非常容易使用,这真的可能是一种误解。
按《The Extreme Searcher’’s Guide to Web Search Engines》的作者Ran Hock的说法, 各种搜索引擎对布尔符都有自己的支持方法,并非完全相同。比如,同样一种效果,有的搜索引擎只要用’’not’’,有的搜索引擎却要用’’and not’’才能达到。而且,有些搜索引擎要求布尔符必须是大写的,另一些就没有这种要求。
如果你真的想使用布尔符,请认真学习它的使用方法。
3:普通词Being Ever So Vulgar
==================================
Vulgar来自拉丁语vulgus, 意思是普通。象一些有教养的诡辩家,搜索引擎对普通词的搜索存在缺陷。不是因为它们妄自尊大或自命不凡。而是因为这些词太常见了,以至于出现在成百万上千万的网页中,使得它们事实上不能被用来帮你找到什么有用的内容。
比如说“weather”, 有成千上万的网站提供跟“weather”相关的信息,从地方天气预报到学术论文到气象学,
所以使用更多的关键词或更明确的关键词来搜索要比单单搜索’’weather’’好得多。 设计一个类似 ’’Cicely Alaska annual snowfall’’这样特殊的搜索关键词,会给你真正有用的结果。
4:寻找玫瑰,Looking for a Rose, By Any Other Name
===================================================
要小心使用多义词。 Kris Carpenter是Excite 的搜索服务主管,举了’’bond’’ 作为例子。我们不得不问自己,他们在找的信息是关于金融公债的、化学粘合剂的、还是大名鼎鼎的007邦德的?
最好的解决办法是,在搜索引擎之前先问自己这个问题,然后用短语代替多义单词作为关键词。
搜索引擎也很容易被同拼法异音异义的词迷惑,比如 ’’lead’’ ,发音LEED的时候, 意思是领导,发音LED的时候指的是一种金属元素。
如果可以,尽可能使用意义明确的同义词代替同拼法异音异义的字。例子可以看The Heteronym Home Page.
5:大写字母Committing Capital Offenses
========================================
搜索者的另一个问题是要不要在关键词中使用大写字母。
1:停用词Sputtering on ’’Stop Words’’
=======================================
一些搜索引擎会忽略这些词,当你把停用词输入搜索框时,不管网上有多少数量的相关文件,它们一个都不会找回来给你。
这些被叫做“停用词”(stop words),因为搜索引擎在它的数据库里碰到这些词时不会搜索。
为什么不搜么?因为停用词可能太常见了以至于无法搜索出有意义的结果,或者是语言中的副词、连词、介词,或者是’’be’’ 的变体如is、are、were、been等无意义的词,除非它们在一个短语中且有重要的名词和动词相伴。
如果你在一个搜索请求中使用了停用词,那么你得到大量毫不相关的搜索结果。比如,短语’’searching the Web’’ 包含了两个停用词,’’the’’ 和 ’’Web’’。虽然这还不算特别常见的词汇,但Web 在网络上实在是太常见了,使它事实上不能帮你搜索到什么有用的内容。
如果去掉停用词,’’searching the Web’’ 变成 ’’searching’’,这个关键词带给你的搜索结果会从搜索一个逃犯直到寻求启蒙。(quests for enlightenment)—如果你够幸运,当然也会得到一些关于“searching the Web”的搜索结果。
怎样辨别停用词呢?300个最常用的英文词汇基本上都是停用词,搜索引擎google在你的搜索关键词中含有停用词时,会把它忽略的每个停用词告诉你,就显示在搜索结果页最上边。你可以用一个含停用词 ’’web’’ 的关键词试一下。
2:布尔操作符Bungling with Boolean
=====================================
布尔操作符,象and、or 和not,能够使你的搜索结果更精确——如果使用正确的话。
问题在于布尔操作符看上去太简单了,似乎非常容易使用,这真的可能是一种误解。
按《The Extreme Searcher’’s Guide to Web Search Engines》的作者Ran Hock的说法, 各种搜索引擎对布尔符都有自己的支持方法,并非完全相同。比如,同样一种效果,有的搜索引擎只要用’’not’’,有的搜索引擎却要用’’and not’’才能达到。而且,有些搜索引擎要求布尔符必须是大写的,另一些就没有这种要求。
如果你真的想使用布尔符,请认真学习它的使用方法。
3:普通词Being Ever So Vulgar
==================================
Vulgar来自拉丁语vulgus, 意思是普通。象一些有教养的诡辩家,搜索引擎对普通词的搜索存在缺陷。不是因为它们妄自尊大或自命不凡。而是因为这些词太常见了,以至于出现在成百万上千万的网页中,使得它们事实上不能被用来帮你找到什么有用的内容。
比如说“weather”, 有成千上万的网站提供跟“weather”相关的信息,从地方天气预报到学术论文到气象学,
所以使用更多的关键词或更明确的关键词来搜索要比单单搜索’’weather’’好得多。 设计一个类似 ’’Cicely Alaska annual snowfall’’这样特殊的搜索关键词,会给你真正有用的结果。
4:寻找玫瑰,Looking for a Rose, By Any Other Name
===================================================
要小心使用多义词。 Kris Carpenter是Excite 的搜索服务主管,举了’’bond’’ 作为例子。我们不得不问自己,他们在找的信息是关于金融公债的、化学粘合剂的、还是大名鼎鼎的007邦德的?
最好的解决办法是,在搜索引擎之前先问自己这个问题,然后用短语代替多义单词作为关键词。
搜索引擎也很容易被同拼法异音异义的词迷惑,比如 ’’lead’’ ,发音LEED的时候, 意思是领导,发音LED的时候指的是一种金属元素。
如果可以,尽可能使用意义明确的同义词代替同拼法异音异义的字。例子可以看The Heteronym Home Page.
5:大写字母Committing Capital Offenses
========================================
搜索者的另一个问题是要不要在关键词中使用大写字母。


快速导航