首页

Categories

Archives

Archive for the 'SEO' category

Google的数据更新正在进行中

从7月底开始,Google的数据中心似乎就开始了新一轮的更新,而这次更新应该是Google切换到BigDaddy以来的最近的一次大规模的更新,感觉上更新是以一种rollback的方式进行(或者是BigDaddy就是这样的架构),好像就像炒菜一样,不停的在反复,而在这个不断的反复过程中,最新的结果开始渐渐显露出来,而那些补充结果渐渐的变少了。

现在每一次的查询,都可能会得到不同的查询结果。这也许是每一次返回的结果都是源自于Google的各个不同的数据中心的原因。而查询的结果和你当前所在的区域也会有一定的关系。以“搜索引擎优化研究”这个关键词做查询,在北美得到的结果和Robin在中国得到的结果就完全的不同。

[tags]Google,Bigdaddy,数据更新[/tags]

加拿大的本地搜索引擎-TrueLocal.ca

splash_left.jpg8月29日,加拿大一家专注于本地搜索的搜索引擎TrueLocal.ca正式发布运行。

这家搜索引擎目前收录了1300万条本地商业的信息和5000万张本地网页。TrueLocal为用户提供从牙医诊所、比萨饼店、汽车代理商、便利店等等的本地信息。它自称为intelligent business phonebook。

TrueLocal的收入来源是这些生意登录的费用,这个费用也非常的低。

TrueLocal’s friendly design allows users to find exactly what they’re looking for in two clicks or less. TrueTarget, the local advertising solution, starts at only $1 per month for a businesses’ category and zip code, and guarantees placement at the top of search results.

在面对众多的搜索巨人的搜索引擎市场,TrueLocal能否以独特的市场切入获得成功,值得观察。

[tags]TrueLocal.ca,本地搜索,local search[/tags]

Masters of their Domains

Masters of their Domains 发表于Business 2.0 上的一篇有关域名投资的文章,值得一读,中文的译文在此《域名大师》。

Google的新专利

Google最近刚刚提交了一个新的专利申请

System and method for supporting editorial opinion in the ranking of search results.

Google提交的一些专利申请可以让我们看出对搜索结果排名的影响的因素,比如: anchor text、fresh content、themes、data history、link popularity、user behavior、 and domain-related information.

从最近的这个新的专利可以看出,Google开始从注重算法为主,向增加人工编辑的干预转移的趋向。Google努力向用户提供最准确地搜索结果,这个专利体现了Google为此而采取的方法之一。

尽管计算机技术的发展和人工智能的不断提高,搜索引擎的算法也在日益的智能化,但是,机器到底还是机器,无论算法多么的高明,还是无法满足每一个搜索查询的精确。而总是有人可以针对算法来欺骗机器。

解决这个问题的唯一办法就是加入人工的干预。

现在Google正在将人工的编辑审核的过程与计算机算法进行整合来提高搜索结果的质量。这项专利描述了如何确定哪些因素来增强搜索的结果。

积极的因素:网站被认定为提供了有用或者是权威性的内容(按照要搜索的内容)
消极的因素:网站被认定为提供了误导的信息或是过分的强调特别的主题(即搜索的内容)

Google似乎开发了一套半自动的系统来决定哪些是积极的因素、哪些是消极的因素,从而来决定哪些是“好”的网站,哪些是“坏”的网站,并根据“好”和“坏”来影响搜索结果的排名。

这项专利申请表明,具有丰富和准确的信息的网站将会在Google获得更好的排名结果,网站提供越有价值的信息给访问者,那么网站就会更具有权威性。可以看出,高质量的内容和内容的相关性依旧是最重要的因素。

[tags]Google,新专利,算法[/tags]

如何返回错误代码503

有时候为了进行网站的维护,需要较长时间的关闭网站,可以做一个网站正在维护的页面来显示。但是又担心搜索引擎的机器人会将这个页面进行索引,这时,可以让服务器返回一个503的状态代码,而不是200的状态代码,这样机器人就会知道回头再来试看看。

503(服务不可用)服务器目前无法使用(由于超载过停机维护)。通常,这只是暂时状态。
200(成功)服务器已成功处理了请求。通常,这表示服务器提供了请求的网页。

使用Apache服务器时,可以编辑一个shell命令为503.sh:

cat <<EOF Status: 503
Content-Type: text/html; charset=iso-8859-1
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 3.2//EN">
<html>
<head>
<title>503 - Service temporary unavailable</title>
</head>
<body>
<h1>503 - Service temporary unavailable</h1>
<p>Sorry, this website is currently down for maintainance please retry in a few minutes</p>
</body>
</html>
EOF

将下面的命令行加入到confiig中,重新启动服务器。

ScriptAlias / /path/to/your/503.sh/

[tags]503,googlebot[/tags]

Google的收录结果

从上个星期开始,就发现Google的收录结果突然有了很大的变化,整个情形好像回到今年初Google转换到BigDaddy时的情形。

昨天晚上11点左右,用site:domain.com来查询收录的结果时,每一次都有不同的结果返回,似乎Google正在做某种切换。因此,查询的时候可能从不同的数据中心提取到数据。现在的收录的结果都是一些旧的数据,而且有些都是已经不存在的页面,看来Google启用BigDaddy数据中心以后,对收录的结果和算法的更新还是在不断地进行。

[tags]Google,BigDaddy,SERPs[/tags]

AOL的数据是个宝

美国在线AOL前不久公布的(或者是无意泄漏)的三个月的用户搜索数据对于搜索引擎业界无疑是一个重磅的炸弹,因为AOL采用的是Google的数据库,因此,这些数据也代表了Google的排名结果。

AOL的数据对从事SEO的从业人员来说,无疑是个宝。这些数据很快就被应用到各种工具中。SEO Black Hat就用AOL的数据和overture的数据开发出一个估算点击率的工具,通过这个工具,你可以估算出在Google,Yahoo,MSN这三个主要的搜索引擎中的排名能够带来的点击率,但这个工具只能针对英文的关键词,对中文的关键词没有用。

[tags]AOL search data,google,yahoo,msn[/tags]

Google的最新的一些变化

自从Google开始使用BigDaddy以来,可以看到Google确实有了一些新的变化。以前,Google几乎是每一个月才来造访你的网站,排名的更新也是非常的慢。采用的新的算法和系统架构以后,几乎每天都可以看到排名的变化。虽然工具栏上的那个小绿条还是每三个月才更新一次,但是,Google每天都对网页的PageRank进行更新。

最近的这次技术更新,使许多网站受到了影响,很多网站因此流量下降了50%以上,有些甚至网站都被剔除在外,在这种新的游戏规则下,因该对自己的网站进行全面的调整,来确保适应新的算法。

1、继续寻求高质量的外部链接,外部链接依然是Google的网页评级的重要因素。因此,通过提交网站到分类目录、RSS feeds、新闻聚合等等的方式来获得外部链接,特别是来自高质量站点的外部链接。

2、在Google的站长工具(Google sitemaps)提交你的站点地图,以提高所有网页的收录。

3、确保你的网站有清晰的导航菜单,每一个网页都最好能有一个静态的链接地址,能通过不超过三层的链接可以找到。

4、去掉所有的欺骗的伎俩,现在的搜索引擎已经可以识别那些专门为搜索引擎而做的网页,像隐藏文字和隐藏链接、桥页,链接工厂等等。

除了在网页的搜索结果上的变化,Google上个月还更新了Google AdWords的发布页面的算法。这次更新使得许多广告商原来只要付5分或一毛的,现在得提高到5毛或一块,许多从事网上业务的商家受到严重的影响,甚至倒闭,但并非所有的广告商都受到影响,受到影响的主要有四类的网站:一页式的推销网站、联属网站(affiliate sites)、AdSense网站(特别是那些利用AdSense做套汇交易的网站),squeeze pages(一种未经你的许可获取你的联络信息的网页)。

新的发布页面算法给每一个发布广告的页面进行评分,因此,要是你的AdSense广告能够达到好的效果,你最好是:

1、提供相关的和实质性的内容
2、你的广告中链接的页面应该能够提供最有用或最精准的产品信息和服务。
3、尽量创作你的原创的内容

Google已经越来越智能化了,它每天都在学习,每天都在变化。SEO的工作不是去猜测搜索引擎如何工作,而是要如何通过搜索引擎能够提供给用户最有用的信息。

[tags]Google,AdWords,AdSense[/tags]

如何在几个主要的搜索引擎中获得好的排名

Google毫无疑问是在搜索引擎市场占据了绝对的市场份额,但是,其他的几个搜索引擎像Yahoo,MSN等都还是占有一定的比率,如果能在这些搜索引擎中获得好的排名,同样也可以为网站带来不少的流量。

如何在这几个主要的搜索引擎中都获得好的排名,这确实是一个比较困惑的问题,各个搜索引擎所侧重的方面各不相同,甚至有可能使你在Google获得好的排名的因素,却不能在Yahoo,MSN中获得好的名次,有时站长们不得不牺牲一些要素来保证在Google获得好的名次。

但是,不管怎样,搜索引擎的工作原理和排名的基本意义还是相同的,那就是要为搜索用户提供最符合要求的搜索结果。那么对于站长来说,一个最基本的适合所有搜索引擎优化的原则就是:高质量的内容、合理的网站结构、持续不断的更新。

每个搜索引擎都有自己的机器人在抓取网页,在服务器的记录中我们经常可以看到这些蜘蛛的名字国内的点这里)。因此网站的结构上要设计的利于这些蜘蛛的爬行,虽然这些蜘蛛总是会爬到你的首页,但它们也会尝试着爬网站内部的新鲜内容,因此,在首页提供这些内部网页的链接是有利于蜘蛛爬到你的内部网页。

搜索引擎的排名算法各不相同,但对网页的几个部分的关注还是一样的,只是权重可能有所不同。网页标题(Titles),标签(Tags),文本(Text),结构(Structure),链接(links),本地化(locality),搜索用户行为(search-user behaviours)等等。

下面是几个主要的搜索引擎排名的主要因素:

谷歌Google
:外部链接,网页的优化,网站结构利于搜索机器人,用户行为分析,导出链接,在其他Google服务中的索引,网页的历史

雅虎Yahoo
: 网页的优化,链接和链接的模式,网站设计,用户行为分析,在其他Yahoo服务中的索引

微软MSN
: 网页的优化,网站的设计,结构利于搜索机器人

[tags]ranking,Google,Yahoo,MSN[/tags]

Google的站点地图

Google的站点地图作为Google的一个和站长们交流的工具,我一直都没有搞懂它的作用到底是什么?

站点地图里的功能大部分都是那种可有可无的,看上去像是纯粹为了凑数的,我觉得唯一有用的就是Query Stats,可以查询到网站的哪些关键字在不同的地区是排名比较靠前的。

为了测试,这个博客我特意没有提交站点地图,但是收录的情况还是正常的。其他的提交了站点地图的站点可以看到的是每天Google都正常地下载了站点地图,可是它并没有按照提供的站点地图进行抓取。在找不到的URL中,Google Sitemaps列出了275个,根据的是7月19日的站点地图,而7月19日的站点地图中根本就没有那些URL了。

也许Google通过站点地图能够获得更多的信息来增强搜索的质量,但是,我们却绝少得到反馈。

[tags]Google Sitemaps,站点地图[/tags]