为什么要使用中文URL本文不再赘述了,具体原因请参见小弟写的《做“最懂中文”搜索引擎优化岂可不用中文URL》。这一次,我们用最新版的wordpress(3.0.1)来亲自体验一把中文URL,至于为什么要用wordpress这个cms来做例子,理由很简单:她拥有众多美轮美奂的模板以及全球超过百万的狂热粉丝,具备强大到变态的插件,只要安装几个插件几乎就能满足一般站长的需求,而且她的整站编码都是国标码utf-8,兼容现在所有主流搜索引擎,使用中文URL不会有出现乱码的危险。
1. 在官网下载最新版的wordpress,版本为3.0.1,下载到本地进行安装。需要注意一点的是,新建立的数据库编码要选择utf-8,其数据库整理最好选择utf-8_general_ci,以免产生不必要的乱码问题。
2. 安装好后,进入后台,选择左侧“设置”里的“固定链接”选项,如下图
点击后,会弹出固定链接的设置,不必理会那些默认设置,直接点选“自定义结构”,如图所示
此时,在自定义结构右侧的文本框内,就是你的中文URL生成规则,这里我写的是/archives/%category%/%postname%,这个规则的具体意思就是,内容页路径是在archives这个目录下,采用分类中文名称以及文章标题中文名称相结合的构造,这样写的好处就是,文章分类可以填写长尾关键词,而文章标题又可以重复一次该长尾关键词,这样就可以在URL上优化关键词,比英文路径要友好的多。
此后内容页的链接都会是以此种形式出现:archives/%e6%9c%aa%e5%88%86%e7%b1%bb/%e6%88%91%e6%98%af%e4%b8%ad%e6%96%87%e8%b7%af%e5%be%84。这只是在地址栏里出现的地址,大家不必担心,因为程序无法识别纯中文,只能是通过用base64_encode函数编译过的中文编码,当url的参数传入程序内部,程序再经过base64_decode进行反编译,这样就能还原中文了,当中文URL的页面被搜索引擎收录后,快照的效果如下图,并不会出现乱码。
我们知道搜索引擎是可以识别具有一定规则性网址的,低权重网站即使做了robots.txt也不能被大规模的收录,其原因应该是搜索引擎通过具有规则的路径进行了限制,而如果采用中文路径,既可以满足无规则路径的需求,又能够在URL上出现关键词,是一举两得的办法,我相信这绝对是一次有益的尝试。