正在加载,请稍后……

Tag Archives: SEO技术

深夜,百度收录了我的新站

从域名注册的2007年12月12日的三天后也就是15日,百度的蜘蛛就已经开始在爬我的站了,但是直到今天才列出在百度的搜索结果里。site了一下,找到相关网页42篇,早晨继续site已经可以找到53个结果了,百度现在对于新站的审核越来越严格了,我的新站现在肯定还在百度的沙盒里,仍然在考察期,这段时间的表现非常重要。继续努力表现给百度看看。关注百度对于新站的考察及索引情况发展

其实并不是只有百度会k你的站

或许你看了我的题目不知道我要说的是什么,但是只要你坚持看完我的文章相信你就会知道我要说的是什么了。
相信众多和我一样的小站长每天都很关注百度的变化,时时都关心着自己的网站被百度收录了多少个页面,主要关键词的排名如何,是不是被做了降权处理,每天早晨site一下已经成为了打开百度之后最习惯的操作。说的开场白似乎有点多,但我今天要说的不是关于SEO的问题,而已关于域名安全的问题。这就要从我年初建的小站说起了。应该是在2007年的1月16日,如果我没记错的话,我注册了一个net的域名,当时是在im286找whirl代注的(不是ad哦)。域名注册商是enom,注册号了之后我可以随时push到自己的enom帐号,因此我又在enomcentral注册了一个直接账户,不是reseller账户。或许从这时起就注定我要犯下一个错误,就是太相信网络,太相信别人。
在之后的半年多的时间里,我的小站虽然没有大发展,但是每日的ip还是很稳定的,由于几乎都是我人肉采集,因此内容质量还是很好的,百度一直都很喜欢我的小站,期间IP也达到过5000ip的最高记录,平时就主要看那时什么东西是热门搜索了。由于我主要是做一些时效性比较强的话题,所以论坛的人气不是很高,大都是过客,虽然他们拿了东西就走,但是我也很理解,比较人家没有义务给你发帖,这段时间论坛也招募了几个版主,但是可能是因为人气的原因,也并不是经常发帖,只有我这个admin在孤独的发帖,灌水。事情的起因大概发生的十一值钱,由于当时盛传国际域名价格要上涨,因此我就在落伍联系了一个人帮我续费域名,因为我的域名是打算一直保留下去的,所以早续费也是续,而且当时还有优惠。正是这种思想毁掉了我辛苦半年的论坛,成功续费后一个月左右的时间,由于服务器更换了ip,因此我再次到enomcentral登陆,但是显示your account is disabled。会点e文的兄弟都知道这是什么意思,我的账户被封了。从那时起我不知道给enom发了多少邮件,打了多少电话,都没能解决问题,于是我放弃了,放弃的不只是辛苦半年的论坛更是自己坚持的毅力,看着ggad上停滞的数字,看着统计中稀少的ip,不知道我还应不应该坚持下去。
12月,我鼓足勇气准备重新开始,注册了新的域名zhanwai.com,这个域名是我自己用人肉想出来的,不知道大家觉得怎么样,我是很喜欢。原来论坛的数据我转移到了新站bbs.zhanwai.com,但是由于我已经无法控制原来的域名,因此原来的会员可能已经无法找到我的新站地址了,每隔段时间我就site一下曾经的域名,每隔段时间我就到enomcentral登陆下我的账户,但结果始终没有改变,到今天百度已经彻底把我原来的域名k掉了。而我的新站至今仍然无法博得百度的喜爱,但是我会坚持的。站外论坛一定会继续办下去的。
我写这篇文章就是希望告诉大家,不要只关注百度和谷歌,甚至用黑帽的手法进行SEO,你要记得关注你的域名,那是你做站的根本,做站的基础。切记切记!

如何给网站写robots.txt文件

今天查询网站收录情况的时候发现,百度居然把网站的打印页面收录了,太不人性化了,于是只好添加个robots.txt文件到服务器上。百度搜索了下robots.txt文件的写法,在这里整理分享给大家,也作为一种SEO的收藏。
robots.txt基本介绍
robots.txt是一个纯文本文件,在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。
当一个搜索机器人(有的叫搜索蜘蛛)访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那么搜索机器人就沿着链接抓取。
另外,robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。
robots.txt写作语法
首先,我们来看一个robots.txt范例:http://www.zhanwai.com/robots.txt
访问以上具体地址,我们可以看到robots.txt的具体内容如下:
# Robots.txt file fromhttp://www.zhanwai.com
# All robots will spider the domain
User-agent: *
Disallow:
以上文本表达的意思是允许所有的搜索机器人访问www.zhanwai.com站点下的所有文件。
具体语法分析:其中#后面文字为说明信息;User-agent:后面为搜索机器人的名称,后面如果是*,则泛指所有的搜索机器人;Disallow:后面为不允许访问的文件目录。
下面,我将列举一些robots.txt的具体用法:
允许所有的robot访问
User-agent: *
Disallow:
或者也可以建一个空文件 “/robots.txt” file
禁止所有搜索引擎访问网站的任何部分
User-agent: *
Disallow: /
禁止所有搜索引擎访问网站的几个部分(下例中的01、02、03目录)
User-agent: *
Disallow: /01/
Disallow: /02/
Disallow: /03/
禁止某个搜索引擎的访问(下例中的BadBot)
User-agent: BadBot
Disallow: /
只允许某个搜索引擎的访问(下例中的Crawler)
User-agent: Crawler
Disallow:
User-agent: *
Disallow: /
另外,我觉得有必要进行拓展说明,对robots meta进行一些介绍:
Robots META标签则主要是针对一个个具体的页面。和其他的META标签(如使用的语言、页面的描述、关键词等)一样,Robots META标签也是放在页面的<head></head>中,专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。
Robots META标签的写法:
Robots META标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。 content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。
INDEX 指令告诉搜索机器人抓取该页面;
FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;
Robots Meta标签的缺省值是INDEX和FOLLOW,只有inktomi除外,对于它,缺省值是INDEX,NOFOLLOW。
这样,一共有四种组合:
<META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>
<META NAME=”ROBOTS” CONTENT=”NOINDEX,FOLLOW”>
<META NAME=”ROBOTS” CONTENT=”INDEX,NOFOLLOW”>
<META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>
其中
<META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”ALL”>;
<META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”NONE”>
目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以限制GOOGLE是否保留网页快照。例如:
<META NAME=”googlebot” CONTENT=”index,follow,noarchive”>
表示抓取该站点中页面并沿着页面中链接抓取,但是不在GOOLGE上保留该页面的网页快照

百度的关键词排名分级制度

近期对于百度的关键词排名关注的比较多,因为我所运营的一个地方站最近刚刚成功进行了改版,因此比较希望获得相对较好的关键词排名。可是,我的网站已经改版了一个星期了,百度每天都来爬我的站,更新和收录都很好,但是主要关键词的排名收录的确实我改版之前的网站旧页面。而且排名也一直都在36名左右保持不变,这中现象已经不是第一次发生了,大家都知道百度很重视首页的关键词,首页在百度搜索结果中的权重是很高的,可是从我所遇到的现在分析来看,百度对于不同的关键词应该是有分级的,对于级别较低的关键词,主要是长尾关键词,更新速度很快,排名结果基本是自然排名,主要影响因素是与关键词相关的页面信息,对与外部链接看的不是很重,而对于在分级中级别相对较高的关键词,百度应该有另外一套程序来控制搜索排名结果的更新,这其中主要看重的应该是优秀而广泛的外部链接,该类关键词大都是相对较短的词汇,如电影、足球等等吧,百度这些搜索量大,长度较短的关键词搜索结果有严格的控制,想把这类关键词的排名进行提升是需要非常大的耐心和相当一段的时间,太过于着急的话反而会受到百度的惩罚,请大家切忌。

近乎疯狂的百度

最近百度似乎进入发作期了一样,疯狂的K站,而且只K不收,我的几个cn米做的站都没有收录,还有个org的也没有收,只收了一个前段时间免费注册的com,看来百度对于新加入数据库的域名的审核越来越严格和吝啬。既前阵子百度算法调整以后,最近似乎在主要关注网站的质量和权重,突出表现是很多采集或者利用其他方法在短时间内建起来的垃圾站都被K掉了,而且很彻底,大多数都没有再回复收录。
分析原因,我认为应该是来自用百度自身生存和发展的考虑,因为近段时间以来,谷歌的李开复似乎活动频繁,既推出超短域名g.cn以后又推出了google手机标准等一些列的动作,而且现在统计显示,谷歌在国内搜索引擎市场份额正在逐步提升,相信百度一定感受到了来自google的压力,因此必须提高自己的核心竞争力,只有拿这些垃圾站开刀了。其实,从一个用户的角度实用百度搜索引擎,确实可以真切的感受得到,现在百度的搜索结果中垃圾信息太多了,往往打开十几个链接都得不到自己需要的结果,如果我是李彦宏的话我也会考虑kick掉一些垃圾站来保证自己数据库的有效性和搜索结果的准确性,否则百度就会把大好的国内市场让给他人,百度将无法立足。
在这个过程中,我们也可以感受到百度的变化孩子逐步调整中,还没有打到稳定,我预计至少还得1个月以上的时间以后,百度才能回复到2个月以前的状态,相信那是众多站长期望的时候,不过大家关注的不应该仅仅是这个,而应该把主要经历投入的自己网站的建设当中,只要不是垃圾站,百度都会喜欢的,一个窍门告诉大家:百度关注的不是你站的主体,而是细节!