|
对网友来说,没有比 Google 将自己呕心沥血建好的网站拒之门外更让人郁闷的事了。的确,就目前 Google 所处的地位来说,将自己的网站登录 Google 搜索引擎成了站主们心中的头等大事。可有时就是天不随人愿,花好大代价建成的网站,谁见了都被迷得五迷三道,而让对面的 Google 看过来,它却不理不睬,搞得站主们心里直犯嘀咕:我到底哪儿得罪 Google 了?
其实在对待收录网站的问题上, Google 还是相当宽容的,而且从扫描技术上说它也是最全面的,不过万一你的网站得不到 Google 的赏识,不仿从以下几个方面找找原因(请首先确认 Google 的确没收录你的网站):
■ 网站设计是否搜索引擎友好
1 、纯 Java 网站
如果你的网站是用纯 Java 设计的,那么就要小心了,因为 Google 曾在一些场合明确表示过不会收录用纯 Java 技术制作的网站。
2 、 Flash 网站
如果你的网站大量使用 Flash ,例如首页为一个 Flash 动画,并且链接内嵌在 Flash 中,对这种网站 Google 是不太感冒的,而且一些搜索引擎( Google 、 Fast/AllTheWeb 等)虽然已能解读图象中的内嵌文字和链接,但并未正式使用在对内部网页的检索上。
3 、纯图象首页
目前许多网站(尤其是企业网站)将首页设计成仅包含图象的形象页面( splash page ),加上网站内容太少,因此常常造成无法成功登录 Google 。听听 Google 对此是怎么说的:“ We want to point users to content pages , not to doorways or splash screens ”。
4 、网页框架( frameset )
Google 可以检索使用网页框架结构的网站,但由于搜索引擎工作方式与一般的网页浏览器不同,因此会造成返回的结果与用户的需求不符,这是搜索引擎所极力要避免的,所以 Google 在收录网页框架结构的网站时还是有所保留的。如果你非用框架结构不可,可以将相关内容放在 <noframes></noframes> 标签中。
5 、动态网页
Google 是较早支持动态网页检索的搜索引擎之一,但有一定限度, Google 的解释是:“ because our web crawler can easily overwhelm and crash sites serving dynamic content we limit the amount of dynamic pages we index ”。
不过据我们观察, Google 现在对动态网页的支持很好。但如果动态网页存在回路( loop ),很容易将 spider 套住让它无法脱身,所以当你找不到其他无法登录 Google 的原因时,可以试着将动态网页改成静态 html 文件。
6 、网站内部链接
网页之间的链接最好是文字链接,其次是图象链接。虽然 Google 已能跟踪和解析 JavaScript 和 Flash 中内嵌的链接,但从搜索引擎友好的角度讲还是不要大量采用 JavaScript 和 Flash 链接。
■ 网站 / 网页访问是否正常
1 、网站访问速度
你也许想不到,网站访问速度太慢也是影响成功注册 Google 引擎的原因。这方面我们是有“血”的教训的。如果发现网站响应速度过慢,建议你赶快换一个主机。如果你对登录 Google 是认真的,多花些钱还是值得的。
2 、网页大小
虽然网页大小不是最关键的因素,但从搜索引擎友好的角度说,下载越快的网页被成功收录的几率也就越大。至于网页字节数多少合适没有一个正式的标准,一般说法是不超过 50K ,不过有一点是肯定的,如果你做一个 100 多 K 的网页,无论对搜索引擎还是普通浏览者来说都不是件好事吧?
3 、更改文件名
对网站进行调整时要注意,不要对网页文件名做过多地更改。当 Google 探测到用户点击的多数是无效连接时,会将你的网页从搜索结果中摘除。如果你必须大面积更改文件名,可以使用主机的 301 转发功能,将原来的链接指向新的文件(切记不要在原页面设置 META Refresh 转发)。
|