分类文章存档: 技术工具

8个棒极了的谷歌服务

1、代码搜索

谷歌代码搜索为程序员迈向成功提供了一把利器。在谷歌代码搜索中,可以使用正则表达式进行精确搜索,同时你可以提交自己的代码和别人分享。

2、趋势搜索

Google 趋势会分析一部分 Google 网络搜索以计算用户输入的字词被搜索的次数,并将其与 Google 上随时间推移的搜索总量相比较。然后Google用按线性比例绘制的搜索量图表向用户显示结果。这个功能对各大站长非常有用。也可以和谷歌热榜一起使用。

3、在线翻译

该服务的宗旨是“让谷歌说您的语言”,在翻译的时候,你可以在“翻译文字”语“翻译网页”两种方式中任选其一。百不度经常用到这个服务,因为英语是我心中永远的痛。

4、在线办公

只需注册一个谷歌帐户,就可以像使用微软office一样进行文档编辑处理。

5、短信搜索

想立即开始使用Google (谷歌)短信服务? 发送”帮助” 到106696999。该服务是完全免费的,不过对您发送的上行短信,运营商可能会收取相应的短信发送费用。另外,我前些天介绍了一个免费接收谷歌短信天气预报的文章,真的非常棒,要不试一试。

6、Google Earth

这是Google基于三维地图定位技术推出的一项个性化服务。用户几乎可以浏览到世界的任何角落。有了它,足不出户,便可以跨越千山万水,游遍全球。

7、Picasa 网络相册

 相册空间为1G,并且支持外链(这个很棒),功能很强大,我就不多说了,自己去看看吧。

8、Google reader

这是一个阅读器,对于没有电脑又没有使用rss客户端的朋友来说,这是一个非常棒的工具,可以帮助你随时随地阅读你感兴趣的文章(当然要有电脑能上网)。这是李是谁每天都在使用的服务。o(∩_∩)o…

加www与不加www

如果www.yoursite.com和yoursite.com都可以同时访问你的网站的话,那么说明两者都同时解析到了主机上,百不度发现绝大多数网站都能用yoursite.com访问同一个网站,就像baibudu.com可以访问百不度一样。

按照常规的使用习惯,用户上网的时候都是在前面加www的,当然不加www更方便。如果两者都解析到了同样内容的网站,就会牵涉到一个网址规范化问题——搜索引擎挑选最好的URL网址作为真正网址的过程。

如果存在网址规范化问题应该怎么版呢?为了这个问题我们应该做好两件事:

1、网站内部在链接到其他网页,尤其是主页时,只使用一种URL。不管是包含www或不包含www的,自始至终只使用一个版本。这样搜索引擎也就明白哪一个是规范化的主页网址。

2、你没有办法控制别的网站用哪一个URL链向你的主页。所以你应该在你的主机服务器上,把所有可能成为主页网址的URL,做301永久重定向到你所选择的主页URL版本。

也就是说,你应该把下面这几个网址:

http://yoursite.com

http://www.yoursite1.com(如果你同时绑定了多个域名的话)

http://yoursite1.com

做301永久重定向到这个网址

http://www.yoursite.com

百不度已经将baibudu.com重定向到www.baibudu.com o(∩_∩)o…

如果你要使用.htaccess做重定向的话,你可以看这里.htaccess是什么?如何建立?

.htaccess是什么?如何建立?

.htaccess是什么?

.htaccess叫分布式配置文件,它提供了针对目录改变配置的方法——在一个特定的文档目录中放置一个包含一个或多个指令的文件, 以作用于此目录及其所有子目录。并且子目录中的指令会覆盖更高级目录或者主服务器配置文件中的指令。一般来说,如果你的虚拟主机使用的是Unix或Linux系统,或者任何版本的Apache网络服务器,从理论上讲都是支持.htaccess的。

如何建立.htaccess?

在我们使用的windows(瘟到死)主机上创建.htaccess文件是很困难的。写文件倒很容易,你只需要在文字编缉器(例如:记事本)里写下适当的代码。困难的是文件的保存,因为.htaccess是一个古怪的文件名,其实它并没有文件名,只有一个由8个字母(htaccess)组成的扩展名,而在windows系统中这是无法接受的文件名。因此,这里有3个方法可以实现。

方法一:保存文件的时候将文档保存成名为“.htaccess” (包括引号)或者htaccess.txt亦或者1.htaccess。再将其上传到服务器上,之后直接使用FTP软件来重命名。

方法二:保存文件的时候选择文件—>另存为,保存类型选所有文件,然后文件名输入.htaccess ,这样就OK啦o(∩_∩)o…。

方法三:直接在你的Unix或Linux虚拟主机上建立。

favicon.ico是什么?有何作用?

favicon.ico是什么?

首先favicon是Favorites Icon的缩写,中文意思是网站头像或者是网站徽标,其次.ico是文件后缀名。如果你使用的浏览器是FireFox或者IE7的话,在你的地址栏和标签中都会出现白不读的网站徽标,如果你又将白不读加入收藏夹的话,那么收藏夹中也会有。当然,根据浏览器的不同,Favicon显示也有所区别,不过李是谁发现,火狐和IE显示没有区别。同时你可以将收藏夹中的favicon拖曳到桌面以建立到该网站的快捷方式。另外,FireFox支持动画格式的favicon。

favicon.ico的作用(好处)

1、一个简洁美观的favicon是网站、博客的面子,在标签浏览器(Firefox、IE7)中它可以比 title 更醒目,让读者很容易的识别出您的网页,从而增加网站流量。

2、favicon可以给人一种很专业的观感。

3、favicon可以在一定程度上减轻服务器的流量带宽占用。为什么这样说呢?一般为了提高网站的可用性,我们都会为自己的网站创建一个自定义的404错误文件,在这种情况下,如果网站没有相应的favicon.ico文件,每当有用户收藏网站/网页时,Web服务器都会调用这个自定义的404文件,并在网站的错误日志中记录,显然这是应该予以避免的。

WordPress博客的robots.txt写法及其利弊

如果你没有主动建立robots.txt ,那么在你的域名根目录下肯定是不存在robots.txt文件的。今天李是谁发现即使你的wordpress博客域名的根目录下不存在robots.txt,当你输入你的域名 /robots.txt(形如:yoursite.com/robots.txt)转到时,同样会出现robots.txt的信息,默认信息是所有搜索引擎都可以抓取所有内容。为什么会这样呢?李是谁也没弄明白,估计是wordpress后台那个隐私设置默认的吧。o(∩_∩)o…下面着重学习一下wordpress博客的robots.txt的写法及其好处和坏处。

一、robots.txt的写法:

1、最简单的开放写法

User-agent: *
Disallow:

允许所有蜘蛛访问,允许访问所有内容。Wordpress只要模板中链接设计合理,没有需要限制的特殊内容,推荐使用这种写法。

2、最简单的严格写法

User-agent: *
Disallow: /wp-*
#Allow: /wp-content/uploads/
Disallow: /*.php$
Disallow: /*.inc$
Disallow: /*.js$
Disallow: /*.css$
Disallow: /?s=

允许所有蜘蛛访问,限制以“wp-”开头的目录及文件,限制抓取.php文件、.inc文件、.js文件、.css文件,限制抓取搜索结果。

Disallow: /wp-* 会连同附件目录一起限制抓取,如果想让搜索引擎抓取附件中的内容,将第三行的 # 号注释去掉。注:Allow 不是所有搜索引擎都支持。

3、乐思蜀认为最合理的写法

User-agent: *
Disallow: /wp-admin
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /wp-includes
Disallow: /?s=
Sitemap: http://www.yoursite.com/sitemap.xml

允许所有搜索引擎抓取,逐一列举需要限制的目录,限制抓取搜索结果,并包含你的域名的sitemap.xml地址。

4、李是谁的写法(仅供参考o(∩_∩)o…)

User-agent: *
Disallow: /cgi-bin/
Disallow: /wp-
Allow: /wp-content/uploads/
Disallow: /category/
Disallow: /date/
Disallow: /page/
Disallow: /tag/
Disallow: */trackback/
Disallow: */feed/
Disallow: /*.php$
Disallow: /*.inc$
Disallow: /*.js$
Disallow: /*.css$
Disallow: /*.cgi$
Disallow: /*?*
Disallow: /?s=
Sitemap: http://www.baibudu.com/sitemap.xml
# BEGIN XML-SITEMAP-PLUGIN
Sitemap: http://www.baibudu.com/sitemap.xml.gz
# END XML-SITEMAP-PLUGIN

如果你在使用Google管理员工具,你可以登录后通过“工具 -> 分析 robots.txt”来检查文件有效性。

二、robots.txt的利与弊

1、好处

robots.txt可以制止不必要的搜索引擎占用服务器的宝贵带宽,如email retrievers,这类搜索引擎对大多数网站是没有意义的;再如image strippers,对于大多数非图形类网站来说其也没有太大意义,但却耗用大量带宽。

robots.txt可以制止搜索引擎对非公开页面的爬行与索引,如网站的后台程序、管理程序,事实上,对于某些在运行中产生临时页面的网站来说,如果未配置robots.txt,搜索引擎甚至会索引那些临时文件。

对于内容丰富、存在很多页面的网站来说,配置robots.txt的意义更为重大,因为很多时候其会遭遇到搜索引擎Spider给予网站的巨大压力:洪水般的Spider访问,如果不加控制,甚至会影响网站的正常访问。

如果网站内存在重复内容,使用robots.txt限制部分页面不被搜索引擎索引和收录,可以避免网站受到搜索引擎关于 duplicate content的惩罚,保证网站的排名不受影响。

2、坏处

robots.txt给攻击者指明了网站的目录结构和私密数据所在的位置。虽然在Web服务器的安全措施配置得当的前提下这不是一个严重的问题,但毕竟降低了那些不怀好意者的攻击难度。

比如说,如果网站中的私密数据通过www.yoursite.com/private/index.html访问,那么,在robots.txt的设置可能如下:

User-agent: *
Disallow: /private/

这样,攻击者只需看一下robots.txt即可知你要隐藏的内容在哪里,在浏览器中输入www.yourdomain.com/private/ 便可访问我们不欲公开的内容。对这种情况,一般采取如下的办法:

第一种办法是设置访问权限,对/private/中的内容实施密码保护,这样,攻击者便无从进入。

第二种办法是将缺省的目录主文件index.html更名为其他,比如说abc-protect.html,这样,该内容的地址即变成www.yourdomain.com/private/abc-protect.htm,同时,制作一个新的index.html文件,内容大致为“你没有权限访问此页”之类,这样,攻击者因不知实际的文件名而无法访问私密内容。

参考文章:

Wordpress博客robots.txt写法

为什么要使用robots.txt

谷歌免费天气预报短信

如题,一般人我不告诉他,地球人都不知道。

谷歌曾在奥运期间提供过最新的奥运赛况免费短信提醒服务,现在奥运会结束了,谷歌免费短信提醒变成了全国主要城市的天气预报。

想订阅吗?

想啊,想死了!那么请使劲砸这里http://www.google.com/sms/alerts

订阅后谷歌会在每天下午5点—7点时段给你发送今明两天的天气预报,灰常实用、灰常方便,所以说一般人我不告诉他。另外,谷歌还有一个新功能提醒服务,如果你订阅,那么当有新的免费服务上线谷歌就会发短信提醒你。