月存档: 09月 2008

WordPress博客的robots.txt写法及其利弊

如果你没有主动建立robots.txt ,那么在你的域名根目录下肯定是不存在robots.txt文件的。今天李是谁发现即使你的wordpress博客域名的根目录下不存在robots.txt,当你输入你的域名 /robots.txt(形如:yoursite.com/robots.txt)转到时,同样会出现robots.txt的信息,默认信息是所有搜索引擎都可以抓取所有内容。为什么会这样呢?李是谁也没弄明白,估计是wordpress后台那个隐私设置默认的吧。o(∩_∩)o…下面着重学习一下wordpress博客的robots.txt的写法及其好处和坏处。

一、robots.txt的写法:

1、最简单的开放写法

User-agent: *
Disallow:

允许所有蜘蛛访问,允许访问所有内容。Wordpress只要模板中链接设计合理,没有需要限制的特殊内容,推荐使用这种写法。

2、最简单的严格写法

User-agent: *
Disallow: /wp-*
#Allow: /wp-content/uploads/
Disallow: /*.php$
Disallow: /*.inc$
Disallow: /*.js$
Disallow: /*.css$
Disallow: /?s=

允许所有蜘蛛访问,限制以“wp-”开头的目录及文件,限制抓取.php文件、.inc文件、.js文件、.css文件,限制抓取搜索结果。

Disallow: /wp-* 会连同附件目录一起限制抓取,如果想让搜索引擎抓取附件中的内容,将第三行的 # 号注释去掉。注:Allow 不是所有搜索引擎都支持。

3、乐思蜀认为最合理的写法

User-agent: *
Disallow: /wp-admin
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /wp-includes
Disallow: /?s=
Sitemap: http://www.yoursite.com/sitemap.xml

允许所有搜索引擎抓取,逐一列举需要限制的目录,限制抓取搜索结果,并包含你的域名的sitemap.xml地址。

4、李是谁的写法(仅供参考o(∩_∩)o…)

User-agent: *
Disallow: /cgi-bin/
Disallow: /wp-
Allow: /wp-content/uploads/
Disallow: /category/
Disallow: /date/
Disallow: /page/
Disallow: /tag/
Disallow: */trackback/
Disallow: */feed/
Disallow: /*.php$
Disallow: /*.inc$
Disallow: /*.js$
Disallow: /*.css$
Disallow: /*.cgi$
Disallow: /*?*
Disallow: /?s=
Sitemap: http://www.baibudu.com/sitemap.xml
# BEGIN XML-SITEMAP-PLUGIN
Sitemap: http://www.baibudu.com/sitemap.xml.gz
# END XML-SITEMAP-PLUGIN

如果你在使用Google管理员工具,你可以登录后通过“工具 -> 分析 robots.txt”来检查文件有效性。

二、robots.txt的利与弊

1、好处

robots.txt可以制止不必要的搜索引擎占用服务器的宝贵带宽,如email retrievers,这类搜索引擎对大多数网站是没有意义的;再如image strippers,对于大多数非图形类网站来说其也没有太大意义,但却耗用大量带宽。

robots.txt可以制止搜索引擎对非公开页面的爬行与索引,如网站的后台程序、管理程序,事实上,对于某些在运行中产生临时页面的网站来说,如果未配置robots.txt,搜索引擎甚至会索引那些临时文件。

对于内容丰富、存在很多页面的网站来说,配置robots.txt的意义更为重大,因为很多时候其会遭遇到搜索引擎Spider给予网站的巨大压力:洪水般的Spider访问,如果不加控制,甚至会影响网站的正常访问。

如果网站内存在重复内容,使用robots.txt限制部分页面不被搜索引擎索引和收录,可以避免网站受到搜索引擎关于 duplicate content的惩罚,保证网站的排名不受影响。

2、坏处

robots.txt给攻击者指明了网站的目录结构和私密数据所在的位置。虽然在Web服务器的安全措施配置得当的前提下这不是一个严重的问题,但毕竟降低了那些不怀好意者的攻击难度。

比如说,如果网站中的私密数据通过www.yoursite.com/private/index.html访问,那么,在robots.txt的设置可能如下:

User-agent: *
Disallow: /private/

这样,攻击者只需看一下robots.txt即可知你要隐藏的内容在哪里,在浏览器中输入www.yourdomain.com/private/ 便可访问我们不欲公开的内容。对这种情况,一般采取如下的办法:

第一种办法是设置访问权限,对/private/中的内容实施密码保护,这样,攻击者便无从进入。

第二种办法是将缺省的目录主文件index.html更名为其他,比如说abc-protect.html,这样,该内容的地址即变成www.yourdomain.com/private/abc-protect.htm,同时,制作一个新的index.html文件,内容大致为“你没有权限访问此页”之类,这样,攻击者因不知实际的文件名而无法访问私密内容。

参考文章:

Wordpress博客robots.txt写法

为什么要使用robots.txt

菲尔普斯是怎样炼成的?

迈克尔·菲尔普斯已经被认为是历史上最伟大的全能运动员。那么菲尔普斯究竟是怎样炼成的呢?

迈克尔的教练说:修长的四肢和大大的手脚天生就是做游泳运动员的料,大手大脚就像是水中的桨。

李是谁说:游起来像鱼一样在水中划过,蹬腿动作非常有力,双腿好像装有发动机。

菲尔普斯说:我知道没有人比我训练更刻苦,以图为证:

天才=刻苦+偏执

谷歌免费天气预报短信

如题,一般人我不告诉他,地球人都不知道。

谷歌曾在奥运期间提供过最新的奥运赛况免费短信提醒服务,现在奥运会结束了,谷歌免费短信提醒变成了全国主要城市的天气预报。

想订阅吗?

想啊,想死了!那么请使劲砸这里http://www.google.com/sms/alerts

订阅后谷歌会在每天下午5点—7点时段给你发送今明两天的天气预报,灰常实用、灰常方便,所以说一般人我不告诉他。另外,谷歌还有一个新功能提醒服务,如果你订阅,那么当有新的免费服务上线谷歌就会发短信提醒你。

好名字啊,好名字!

成都衣冠庙立交桥下曾有一家小餐馆叫“客临顿”——不知道现在是不是已经改名叫“不食”。

成都有个饭店,挂着大红的招牌“今喜膳”——适合韩国料理店。

北京回龙观有条街上,一个饭馆叫“孙悟饭”——也许会有人冲进去问“有龙珠吗?”

一个包子店叫“莫闻味”——为什么不闻?包子有异味?

温州一家专卖盖浇饭的店,叫“饭•吧斯滕”——此店名曾被当地媒体评为最有创意的店名。现在已经是连锁店了。

一家卖卤品的小铺,大名“卤至深”——有气势!

成都有间西餐厅,名字叫“无饿不坐”——这不是引人犯罪嘛。

有家卖茶叶的店叫做“井茶局”——建议开在“无饿不坐”旁边,有震慑力。

曾路过一快餐店,名为“食客廊”——一眼看过去看不打紧,心里默念一遍,哎哟我的妈呀,不过好象生意还挺好。

“饭桶食吧”——很个性的饭店名,不知道进去吃饭的人多不多。

重庆南山上有家火锅店,名字很俗“猪圈火锅”。地方确实跟猪圈一样,但是奇怪的是生意非常好,在重庆还非常有名。——注意,人家“猪圈火锅”的拼音是写的“zhuquan”而不是“zhujuan”。

兰州的“白忙饭庄”——这个名字能博取同情、赚人眼泪。

一条小街上的粥店,叫“一家粥店”,往前走一点又有一家粥店,叫“又一家粥店”,再往前走一点有第三家粥店,叫“再一家粥店”——这三家估计是连锁。

一个路边小饭店,房间里当中有个树穿过屋顶,然后,店名就叫做“一棵树饭店”,随后,这条路上,就有了“两棵树饭店”、“三棵树饭店”——弄得人总想进去看看是不是真的有两棵树、三棵树。

还有,“七七七”饭馆旁边就是“叭叭叭”和“久久久”——莫非下面那家是“食食食”?

东莞某饮食店叫“汤.COM”——传统的汤,网络感的名,绝佳搭配!

“羊公馆”,“有鸡厨房”——特色鲜明,读起来也朗朗上口。

杭州西湖边,有一家小吃店叫“点线面”——点心、米线、面条?

有家面店叫“光卖面”,真的只卖面,而且味道好得不得了——想吃饺子勿进。

某蛋糕店叫“偶卖糕的”——“OHMYGOD(我的上帝)”的中文音译,这句话已经成为不少年轻人的口头语了吧。

在重庆沙坪坝三峡广场的一个角角里有个很小的店面,它有个很大的点牌在外面,写着“这里有家店”——光看位置是基本上找不到这家店的,但店名却弥补了这个缺点。

“柴火大队食堂”、“革命根据地”、“天马生产一队”——属于第一种,不过要注意饭店里的整体氛围和店名要吻合。比如“天马生产一队”里面包厢名就叫“果林组”、“农机组”等等。

“社会主义好”、“食客准备着”、“与食俱进”——属于第二种。从这三个名字就能发现,店名也要学会与时俱进呀。

有一家“十口鸟记”,知道卖什么的吗?卖酱鸭——十口鸟,“鸭”也。完全拆字游戏,但很有意思。

北京五道口有家韩国蛋糕店,用的是法文的名字,中文翻译叫“多乐之日”——值得细细品味。

某学校对面的小餐厅叫“布织道”——学生A:吃什么?学生B:不知道。所以就去吃布织道咯。

“我不在办公室就在家不在家就在咖啡馆”,也是一家咖啡馆的名字——全中国的小资都知道这句话吧。

油and米

北京奥运会主题歌《you and me》被一个网友中文译名为《油和米》,不仅音律契合,而且意境高深——表明中国对世界石油危机和粮食危机的密切关注,也表明中国政府借助奥运会倡导和平的决心。

(*^__^*) 嘻嘻……柴、米、油、盐、酱、醋、茶。。。

you and me 你按倒我。。。

李是谁的轿车

话说前些日子李是谁买了一个IBM笔记本,很是拉风o(∩_∩)o…吙吙。。。

今天又新购置了一辆轿车。

这是男人的轿车o(∩_∩)o…李是谁自己的car