13046685510

哪些内容是搜索引擎不认识的?

  如今的搜索引擎技术仍然停留在抓取文本内容、通过输入文本内容搜索后反馈匹配的搜索结果。由于技术原因,除此之外的内容,搜索引擎很难识别,甚至是无法识别。


搜索引擎无法知道图片说的是什么。


  虽然已经发展出了通过分析图片内容进行搜索的技术,但该功能仅仅局限于寻找类似图片,还未像文本搜索那样实用。具体可以参考现在的谷歌和百度的图片搜索功能。毕竟如今的图片搜索技术还未能突破从alt属性来判断图片主题的这个方式,否则搜索引擎没办法知道图片说的什么。


谷歌曾经尝试读取Flash中的文字,百度则不认Flash。


  Flash也是搜索引擎无法识别的内容,多年前谷歌曾经尝试抓取Flash中的文字内容作为搜索结果,但由于用户体验太差、识别率低、Flash中的文字多半是简短广告语等原因,于是放弃了。作为在技术上落后谷歌的百度,根本就没有尝试过这种技术,对于百度来说,Flash中的内容是什么,他们才不关心呢。


谷歌能认识简单Javascript,但百度直接跳过。


  谷歌能够识别简单Js代码中的文字,比如读取Document write代码中的文字,除此之外的Js谷歌无法识别。百度则根本无视Js。所以链接不要通过Js实现。


Frame内的页面是搜索引擎不抓取的。


  Frame就是框架,是一个页面套用另外一个页面的一种方式,有时候仅仅为了页面美观,但重要内容可别放到Frame中哦,搜索引擎可不会抓取Frame中的页面。


Cookies、Session等登录验证。


  Cookies和Session多用于登陆和验证,而搜索引擎自然无法主动注册一个账号并且自己去登陆,所以希望搜索引擎收录的内容绝对不能放置于Cookies和Session登陆验证的页面中。


7x24小时服务专线 130-4668-5510
官方微信 关闭