圿ldquo;新科学家”(New Scientist)在线杂志上,公布了康奈尔大学的一个新研究成果,引人注目,也许与Google 收购Pyra 的动机有关〿br /> 这所大学的计算机科学宿Jon Klenberg 开发了一个计算机算法,能够识别一篇文章中某些文字皿ldquo;突发”增长,而且他发现,这些“突发”增长的文字可以用来快速识别最新的趋势和热点问题,因此能够更有效地筛选重要信息。过去很多搜索技术都采用了简单计算文孿词组出现频率的方法,却忽略了文字使用增加的速率〿br /> Jon 特别指出,这种方法可以应用到大量Weblog上,以跟踪社会趋势,这对商业应用也很有潜力。例如,广告商可以从成千上万的个人Blog 中快速找到潜在的需求风尚。而且只要Blog 覆盖话题范围足够大(实际上发展趋势确实如此),这项技术对政治、社会、文化和经济等领域也都会有实际意义了〿br /> 虽然Google 新闻的内部算法至今没有公开,但是人们猜测这种完全由机器所搜集的头条新闻应当不是Google搜索引擎中惯用的鸽子算法,很可能与这秿ldquo;突发”判断算法有关。如此说来,Google收购Blog工具供应商的举动确实还有更深层次的远见了〿br /> - NewScientist.com news, Word 'bursts' may reveal online trends - 还没有写完这些介绍,圿SlashDot 上也看到了很多有关这个发现的讨论 附:Google官方的站点设计指卿br /> * Make a site with a clear hierarchy and text links. Every page should be reachable from at least one static text link. 让网站有着清晰的结构和文本链接,所有的页面至少要有一个静态文本链接入叿br /> 批注:尽量不要用图片和JAVASCRIPT * Offer a site map to your users with links that point to the important parts of your site. If the site map is larger than 100 or so links, you may want to break the site map into separate pages. 为用户提供一个站点地图:转向网站的重要部分。如果站点地图页面超迿00个链接,则需要将页面分成多个页面〿br /> 批注:索引页不要超过100个链接:SPIDER只考虑页面中头100个链掿br /> * Create a useful, information-rich site and write pages that clearly and accurately describe your content. 用一些有用的,信息量丰富的站点,清晰并正确的描述你的信息〿br /> * Think about the words users would type to find your pages, and make sure that your site actually includes those words within it. 想像用户可能用来找到你的关键词,并保证这些关键词在网站中出现〿br /> 批注:少甿ldquo;最夿rdquo;_ldquo;最奿rdquo;之类的形容词,用用户最关心的词,比如:下载,歌星名字,而不是一些抽象名词〿br /> * Try to use text instead of images to display important names, content, or links. The Google crawler doesn't recognize text contained in images. 尽可能使用文本,而不是图片显示重要的名称,内容和链接。GOOGLE的机器人不认识图片中的文字〿br /> * Make sure that your TITLE and ALT tags are descriptive and accurate. 保证:页面的TITLE和ALT标记正确的精确描迿br /> * Check for broken links and correct HTML. 检查坏链并修正这些HTML错误〿br /> * If you decide to use dynamic pages (i.e., the URL contains a '?' character), be aware that not every search engine spider crawls dynamic pages as well as static pages. It helps to keep the parameters short and the number of them small. 如果你打算使用动态页面:链接中包吿quot;?,必须了解:并非所有的搜索引擎的机器人能想对待静态页面一样对待动态页面,保持动态页面的参数尽可能的少也会很有帮助〿br /> * Keep the links on a given page to a reasonable number (fewer than 100).