分析Google和百度搜索引擎的习惯问题

所属分类: 网站运营 / 网络创业 阅读数: 232
收藏 0 赞 0 分享

  Google搜索引擎习惯
  Google作为全球最大的多语言搜索引擎在发展历史过程中形成了自己的网页收录习惯,也建立起自己的一套标准。研究Goolge收录网页的习惯有利于更好迎合Google搜索引擎的口味,达到提高网页收录量和收录排名的目的。
  我们暂且不研究Google对其他语言的收录,就汉语而言,Google收录有以下特点:
  1、敏感度较高,反应较快
  Google对新建的网站具有较高的查知性,当然,新建的网站必须要有外部链接或者向Google递交过网站登录信息。否则,即使Google的搜索技术再厉害,一个只有站长一个人看得见的网站是很难被Google发现的。Google收录新建网站的两个途径是:第一,通过网站的外部链接;第二,通过向Google提交网站登录数据。一般而言,后者的收录速度相对较快,而前者则要视Google对新建网站的外部链接网站的收录频率而定。如果Google对外部链接网站的评价高、收录频率高那么其发现新站的速度也相应地高,新建网站被收录的日期就会被提前。
  2、并重相关性和重要性
  Google 使用 PageRank 技术检查整个网络链接结构,并确定哪些网页重要性最高。然后进行超文本匹配分析,以确定哪些网页与正在执行的特定搜索相关。在综合考虑整体重要性以及与特定查询的相关性之后,Google 才将最相关最可靠的搜索结果放在首位。这也是Google收录网页的特点之一。
  3、变化较快、机动性较高
  Google 漫游器会定期抓取 Web,将大量网页列入索引。稍后完成的下一次抓取会注意到新网站、对现有网站的更改以及失效的链接,并对内容的变化在搜索结果中加以调整。
  4、较重视链接的文字描述
  Google会将链接的文字描述作为关键词加以索引,所以我们在作友情链接时千万要仔细设计链接的文字描述,使之既符合网站的定位又不失相关性,以此博得Google的信任。
  5、较重视网页Meta标记的描述
  大多数时候Google显示搜索结果时会把网页的Description显示出来,并占有较重的篇幅。
  Google使用的技术:
  PageRank 技术:PageRank 能够对网页的重要性做出客观的评价。PageRank 并不计算直接链接的数量,而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的投票数量来评估该页的重要性。
  超文本匹配分析:Google 的搜索引擎同时也分析网页内容。然而,Google 的技术并不采用单纯扫描基于网页的文本(网站发布商可以通过元标记控制这类文本)的方式,而是分析网页的全部内容以及字体、分区及每个文字精确位置等因素。Google 同时还会分析相邻网页的内容,以确保返回与用户查询最相关的结果。
  百度搜索引擎收录习惯
  百度是全球最大的中文搜索引擎,对中文网页的搜索技术在某种程度上领先于Google,百度在某些方面与Google有相同或相似之处外它还有以下特点:
  1、较重视第一次收录印象
  网站给百度的第一印象比较重要,相对Google而言,百度搜索引擎的人为参与度较高,也就是说在某些层面上可能由人来决定是否收录网页而不是由机器来决定。所以,网站在登录百度搜索引擎之前最好把内容做得丰富点、原创内容多一点、网页关键词与内容的相关度高一点,这样才能给百度较好的初次印象。
  2、对网页的更新较敏感
  百度对网页的更新相对Google而言更加敏感,可能这与百度的本土性格有关。百度搜索引擎每周更新,网页视重要性有不同的更新率,频率在几天至一月之间。所以在百度的搜索结果中基本上都标明了收录时间。
  3、较重视首页
  百度对首页的重视程度要比Google高得多,这与上面提到的“较重视第一次收录印象”一脉相承。百度在显示搜索结果时也常常把网站首页显示出来,而不具体到某个内容页(当其认为不够重要时)。相对而言,其用户体验打了折扣,而增加了其“百度快照”的用户量。
  4、较重视绝对地址的链接
  百度在收录网页时比较重视绝对地址的收录,百度提供的网页快照功能也没有解析相对地址的绝对路径,不知这是百度技术的疏忽还是其偏好的一大体现。
  5、较重视收录日期
  百度对网页的收录日期非常看重,也是其搜索结果排名的参考点,被收录得越早排名会较高,有时甚至不考虑相关性地把它认为比较重要的内容放在首位,而点击进入之后才发现是早已过时的信息或者垃圾信息。这是百度需要改进的技术。
  百度使用的技术:
  百度使用以下技术:“一种互联网上镜像和准镜像网站的识别方法”,这个方法解决了搜索引擎对雷同信息的重复获取,节省网络资源和本地资源,提高系统服务的质量和效率;“一种基于词汇的计算机索引和检索方法”,该方法对一段连续的文字信息,经过词汇分析处理后,通过添加隐形词汇的手段,实现对基于词汇索引和检索系统的检索质量提升,使用户获得更加准确的检索结果;“一种使用快照的方式实现对网上信息进行记录和分析的方法”,该方法是通过对互联网上一个特定信息,多次进行快照的方式,将信息当时的状态进行保留。并通过对一系列快照信息的分析,得到有效数据,方便地得到网上信息的变动情况。
  首发http://www.ce36.cn/post/sexgfx.html,
更多精彩内容其他人还在看

美丽说、蘑菇街将抱团取暖 频繁转型盲目扩大产品线遇瓶颈

美丽蘑菇街是国内最大的女性时尚社区,致力于为女性用户提供最美丽的时尚购物体验,用最好的互联网技术为她们解决“怎么穿,哪里买”的问题,然后近期市场上频繁产出美丽说和蘑菇街将抱团取暖的消息,频繁转型盲目扩大产品线遇瓶颈
收藏 0 赞 0 分享

2016并购第一案 蘑菇街牵手美丽说

2016并购第一案,蘑菇街牵手美丽说,消息称,蘑菇街和美丽说这两个曾经的对手,已经握手言和,即将步入“婚姻殿堂”,需要的朋友可以参考下
收藏 0 赞 0 分享

新兴搜索引擎网站DuckDuckGo的崛起之路

这篇文章主要介绍了新兴搜索引擎网站DuckDuckGo的崛起之路,文中主要对DuckDuckGo在隐私政策方面的突出点作了介绍,需要的朋友可以参考下
收藏 0 赞 0 分享

杨浩涌卸任58赶集集团CEO 赶集十年落幕重走创业路

杨浩涌卸任58赶集集团CEO之前开了一场发布会,没有预想中的煽情,也没有太多的感伤言语,只是平淡的说会将重点精力放到二手车这场硬仗上,为了赶集整整奋斗了十年的杨浩涌,又怎么会放手得这么平静?详细内容请看下文
收藏 0 赞 0 分享

浅谈网站创业初期的一些误区及对加入孵化器的选择

这篇文章主要介绍了网站创业初期的一些误区及对加入孵化器的选择,摘自注明网络投资人Mikko Jarvenpaa与Brent Beshore的一些总结,很有借鉴价值,需要的朋友可以参考下
收藏 0 赞 0 分享

剖析Coding创办的众包开发平台网站码市

这篇文章主要介绍了Coding创办的众包开发平台网站码市,码市作为一个基于代码项目在线托管和合作的平台,与GitHub等的理念又有所不同,需要的朋友可以参考下
收藏 0 赞 0 分享

揭秘全球最大游戏直播网站Twitch的成功要点

这篇文章主要介绍了揭秘全球最大游戏直播网站Twitch的成功要点,鉴于Twitch的成功,国内的斗鱼和战旗等直播网站也纷纷以游戏直播为卖点抢占国内市场,需要的朋友可以参考下
收藏 0 赞 0 分享

剖析国内Docker容器提供商DaoCloud的创业亮点

这篇文章主要介绍了国内Docker容器提供商DaoCloud的创业亮点,Docker是时下最热门的服务器上的虚拟类技术,DaoCloud在国内服务商方面无疑走在了前沿,需要的朋友可以参考下
收藏 0 赞 0 分享

浅谈互联网创业的现状及成功案例共性

依靠Internet发家创业的确需要付出很大的努力,在互联网发展白热化的今天也是如此,从众我们也可以看到一些成功者身上留下的规律,这里我们就来浅谈互联网创业的现状及成功案例共性:
收藏 0 赞 0 分享

当初9亿都没卖的豌豆荚为何沦落到被阿里低价收购

豌豆荚是我们这些从塞班用到安卓手机的一代人的记忆,从没见过一个应用可以做到一直以用户体验为中心;从没见过一个应用市场完全不耍流氓;从没见过一个应用市场里面的应用不出错且是最新版。可在如今的互联网局势下,终于也要属于阿里了,未来是BAT的?不,未来是AT的
收藏 0 赞 0 分享
查看更多