Archive for February, 2009
New Template
由 chys 发表于 2009 年 02 月 17 日默认的模板宽度控制在 800 以内,我想现在 800×600 该淘汰得差不多了吧;而且中文也显示得极为丑陋,于是决定换了这个。基于 Bingo 的 Gmail-Press 模板,稍作修改而成。他原来的版本貌似有一些 bug,比如 CSS 中 sidebar 过宽导致 tag cloud 溢出侧边栏。
像现在这样直接 ssh 上远程主机,用任何喜欢的编辑器直接改 PHP 改 CSS,感觉一切尽在我的掌控之中,甚合我的 geek 味口。
另外,改模板的时候经常遇到的一个问题就是服务器上资源文件(CSS、JavaScript、图片等)修改以后,浏览器不会自动刷新(除非用户强制刷新或者清缓存),这些改动经常要延后很多天才能体现出来。
在主站里,我把文件的最后修改时间加到 URL 里,然后用 Apache 的 ReWrite 模块把它映射到真正的文件。
WordPress 里不太方便这样做,所以目前的方法是:每修改一次,就将 wp-themewp-content/themes 下的主题目录改一个名字…… Any better solution?
标签: blog
五笔字型
由 chys 发表于 2009 年 02 月 14 日“用五笔能避免提笔忘字” 绝对是谬论。不仅如此,我还要说:虽然五笔是一种完全的形码,但是用它会打出同音的别字……
大致了回忆一下自己近期用五笔打过的别字,几类:
- 字形和编码都相似的,例如 “校”(suq)和 “样”(sud);
- 字形相似,编码迥异的,例如 “大”(dddd)和 “八”(wty);
- 读音相似,编码迥异的,例如 “程”(tkgg)和 “成”(dnn);
- 有一个字相同的无关词组。例如,“容器”(pwkk)和 “容易”(pwjq)。
我知道自己打字的别字率高,但是以前至少还是坚信第三条不会发生,然而我错了。在写上一篇《传教士》的时候,就把 “自始至终” 打成了 “自始自终”。(“自”=thd,“至”=gcff;这两个字对我是同音的,不好意思。)
打拼音的时候:
心里想的东西 => 句子(心中默念) => 拼音 => 屏幕上的字
打五笔的时候:
心里想的东西 => 句子(心中默念) [=> 字形] => 编码 => 屏幕上的字
熟练使用五笔以后,字形这一步会省掉,完全成了条件反射。如果这时候嘴里在轻轻地念的话,错到同音字的机会大增。
虽然我是小学时就学了五笔,到现在用了十二年,我对有人说要推广五笔以在电脑时代传承汉字文化的说法更不敢恭维,反而认为它更具破坏性。
五笔将汉字大卸八块的方式是饱受诟病的。最有名的大概就是 “礻衤犭牜” 四个部首。最具想象力的是牛字旁,竟然被拆成了一撇加提手旁(丿扌)。
王永民(五笔的发明者)把个人的一些错误笔顺带进了输入法。典型的是右上角的点和右下角的撇的顺序颠倒,例如 “戈”、“成” 等字,在五笔里最后一划都是撇。
(Update: 查了一下发现:在传统直行书写中,这也是正确的;汉字改横行以后这几个字公认的笔顺改为最后写右上角的点。)
某年(2000 左右),新闻 30 分曾报导称小学教学里的笔顺将作修改,以与计算机使用的顺序(显然就是指五笔)一致。这种拍脑袋决策简直和三只小猪有一拼,好在后来因为反对太多没有实施。
(Update: 以上都指五笔 86 版。98 版要合理一些,但使用不广。)
提到五笔,插播一条旧闻:
王永民因为发明五笔字型获得了专利,然而二十多年过去了,购买授权的公司全部来自境外(包括香港、台湾),这着实荒谬。因为在国内,十多家公司强行将他告翻,理由包括:“我们是国有企业,绝对不可能把钱交给王永民,他是私营个体户。” 更甚的是,之后还因为 “诽谤” 其他公司盗用自己的专利被判赔偿。在遭受这两起破天荒的败诉以后,王宣布将出国定居永不回国(后被劝阻)。
标签: CJK
百度究竟有没有遵守 robots.txt?
由 chys 发表于 2009 年 02 月 07 日百度号称自己严格遵守,有人说他们根本不遵守[1][2][3]。
07 年参加百度之星比赛的时候,复赛题之一就是处理 robots.txt 协议。我当时想,他们的题几乎都是从自己的应用中来的,既然出了这道题,就算遵守得不好,应该也不是完全忽略的吧。后来跟一个他公司的工程师 “座谈” 的时候,便问起这个,他答道:“当然遵守啊。我们最痛苦的就是很多网站的 robots.txt 写得极不规范。”
前几天,我在自己的 robots.txt 里加了禁止百度抓取的指令(现在去掉了),后来在 log 里观察到一条来自百度的访问:
61.135.168.173 – - [05/Feb/2009:08:36:47 -0700] “GET blog.chys.info/robots.txt HTTP/1.1″ 200 66 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
也就是说,百度在知道这个域名以后,首先抓走了 robots.txt,然后没有再抓。看来它还是遵守了。
当然,遵守得是否严格、及时是另一个问题。淘宝显然就对此极不放心,他们为百度写了两条 “Baiduspider” 和 “baiduspider”。然而,按照协议规定,user-agent 是大小写不敏感的!
================= 我是一条分隔线 ===================
另一个问题是:我有一个域名,如果我有权在它的根目录下创建 robots.txt,那么我应该也会有权创建 .htaccess(假设服务器是 Apache 的话),反之亦然。禁止服务器接受来自某个机器人或某些 IP 的连接,比依靠机器人本身的 “良知” 可靠多了。
参考文献
[1] 百度真的遵守 Robots.txt 协议吗?
[2] [9/18]百度遵守robots.txt协议吗?
[3] 百度不遵守robots.txt协议
标签: internet
算是知道 IE 有多气人了
由 chys 发表于 2009 年 02 月 01 日以前就注意到 Wikipedia 为其他所有浏览器准备了一套 CSS,为 IE 准备了四套(5.5 以前、5.5、6、7 各一套)。原来还想:IE 真的有这么矬么?也许是维基那帮人过于完美主义,以至于一两个象素的差别都不放过吧。
但是,经过今天自己调了两小时 CSS,我相信了 IE 对标准有多么漠视。以我对 CSS 的一知半解,连 padding 和 margin 的区别才刚搞清,会用的属性显然只能是极常见的,不可能涉及到什么高级技巧。
结果,现在主页左边和上面的两个菜单,几个主流浏览器(IE、Firefox、Konqueror、Opera、Safari、Opera)都试了,只有 IE 不能达到预想的效果,尤其是左边的菜单差得有点多。XHTML 和 CSS 都通过 W3C 的测试,我想我大概有理由相信问题不在自己身上。
于是,我决定放弃 IE,打上一个反 IE 的标签。
幸好,我不是在为某公司工作,所以你丫不支持标准我可以拉倒。
ps. Firebug 真是好东西
标签: IE
