Nov 19, 2007

《崇拜》

瞟了一眼专辑的封面,我直接坐到了地板上。。。。女鬼。。

听完里边的歌,我又爬了回来。。。。这才是我熟悉的梁静茹啊

如上所述,不贴图了。

Jul 29, 2007

我也说Live Spaces改版

不记得Live Spaces出来多长时间了,反正我一直没用,究其缘由,就是太大 太慢太耗资源。据说有位可怜的仁兄,一次没事儿就点MSN上的小黄花,没一会儿 就死机了。后来我就管Live Spaces叫“活着的空间”。

背靠微软这棵大树,活着的空间一直活得都不错。可是国内的互联网就这个德 行,要不隔三岔五的搞出点儿动静,大家就容易忘记它还活着。最经济(成本最 低,又最吸引眼球)的办法自然就是改版了。我记得活着的空间改过好多次,可 改来改去,就是没见长进,还是一样的大腹便便。

讲到这里,我得把事儿叉得远点,说说去年我在ATC的经历。

去年暑假在ATC,我帮着mentor试验几个信息检索(IR)的算法。这需要很多 文本数据,于是我就和“活着的空间”干上了。开始mentor想直接从storage组那里 拿数据,这事儿讲讲停停,愣没进展,到了9月份,终于黄了。我只好开始自己准 备一只爬虫。

首要任务就是区别通过哪些地址可以访问活着的空间。这就折腾了我一个下午。 结果如下:比如您给自己的空间起了个名字叫“活着谁怕谁”,那么根据我的不完 全统计,当在地址栏中输入下边任意一个字符串,您都会被带到您的空间

  • 活着谁怕谁.spaces.live.com
  • 活着谁怕谁.spaces.msn.com
  • www.活着谁怕谁.spaces.live.com
  • www.活着谁怕谁.spaces.msn.com
  • spaces.live.com/活着谁怕谁
  • spaces.msn.com/活着谁怕谁
  • www.spaces.live.com/活着谁怕谁
  • www.spaces.msn.com/活着谁怕谁
  • spaces.msn.com/members/活着谁怕谁
  • www.spaces.msn.com/members/活着谁怕谁
  • ……
我一直想把这些情况整到一个正则表达式里判断,还和一个员工讨论了好一会儿。 最后他成功地使我放弃了这个愚蠢的想法。我还发信给Spaces组的人问这件事, 结果似乎他的情报还没我的全面。

知道了地址,接下来就是要找出我需要的内容。计算机不像人,没有有效的办 法自动从网页中分离出文章、评论……我前前后后试验了好多办法,包括 MetaWeblog API什么的,可是都不能满足我的需求。

就剩下一条路了。我打开活着的空间的网页源码,登时昏了过去。各种广告、 列表、文字统统混在一起,还夹杂着无数JavaScript(连读取个时间列表都要使 用JavaScript,可以想见访问速度该有多慢了),完全没有结构可言。发表时间 和文章还好判断,标签里含有一个特殊的id;评论就莫名其妙了,包含它的标签 没有特殊记号。好吧,它丑陋我也丑陋。我从一个带有特殊name的标签开始,一、 二、……,数到第n个div标签,再把里边的内容抠出来。

Redmond的网络结构比较复杂,我一度想搞出一个比较灵活的结构来适应它。 最终我在北京的Tech Leader给了我一个很重要的建议:在这个研究项目里,一个 辅助工具的内部技术结构是否先进完全不重要,关键是“it works”。这是我在那 里学到的最重要的东西之一。

我花了两天时间做各种准备,第三天晚上干了个通宵,终于把爬虫搭起来了。 乖乖,美国的网络就是不一样,四只虫子,下载速度稳定在600KB/s以上。 Mentor很满意(多好的苦力啊),我却有点担心,毕竟600KB/s是狠了点儿。“谁 让那帮家伙不给我们数据的!不要紧,再开4个,爬死他们!”我心软了,到最后 也还是没开。

就这么爬了几天。

我琢磨着Redmond那帮家伙也不是吃白饭的,他们肯定已经发现,某台机器没 日没夜的在活着的空间上瞎转悠,拼命抓数据。可查来查去却发现这个IP是自己 人。为了让这个空间活得更好些,我估计他们采取了相当温和的手段,限制了那 IP的带宽。因为等到我离开的时候,爬虫的平均速度已经掉到了150KB/s以下。

我离开没多久,就听说活着的空间改版了。我再次打开那令人生畏的网页源 码,发现其中一个标签的id起了变化。问了下mentor,爬虫果然歇菜——认不出发 布时间了。

而现在,活着的空间又要改版。我真为我的爬虫担心,要是Redmond的那些家 伙把什么东西换掉,爬虫又要歇菜了。不,说不定在这次改版前,它已经歇菜了。

Jul 3, 2007

新球拍

断断续续唠叨了一年,终于搞定了这件事。特别感谢TT前版大的建议。然后么,当然是上pic。

底板:红双喜狂飙王H-WL

正手:狂飙III

反手:拍里奥CJ8000

Jun 22, 2007

一人得道,鸡犬升天

在我得道前夕,我的台灯灯管坏了,我的拖鞋断了,我的鼠标左键开始连击了……他们都升天了。 God,我的凉鞋居然还在家里……它不是升天的,它是我带回去的。 你们就不能消停消停,让我顺心的毕业吧。

Jun 16, 2007

“期中”考试

“自然如不能被目证那就不能被征服” WC·丹皮尔 最初,人们尝试用魔咒, 来使大地丰产,来使家禽牲畜不受摧残, 来使幼小者降生时平平安安。 接着,他们又祈求反复无常的天神, 不要降下大火与洪水的灾难; 他们烟火缭绕的祭品, 在鲜血染红的祭坛上焚燃。 后来又有大胆的哲人和圣贤, 制定了一套固定不变的方案, 想用思维或神圣的书卷, 来证明大自然应该如此这般。 但是大自然在微笑——斯芬克司式的笑脸, 注视着好景不长的哲人和圣贤, 她耐心地等了一会—— 他们的方案就烟消云散。 接着就来了一批热心人,地位比较卑贱, 他们并没有什么完整的方案, 满足于扮演跑龙套的角色, 只是观察、幻想和检验。 从此,在混沌一团中, 字谜画的碎片就渐次展现; 人们摸清了大自然的脾气, 服从大自然,又能控制大自然。 变化不已的图案在远方闪光; 但它的景象不断变幻, 却没有揭示出碎片的底细, 更没有揭示出字谜画的意义。 大自然在微笑—— 仍然没有供出她内心的秘密; 她不可思议地保护着, 猜不透的斯芬克司之谜。
——1929年9月于多塞特郡希尔费尔德
---------------------- 郁闷的分界线 -----------------------
上回说到的第三座大山就它了:读后感,2500字,手写。 P.S. Google一下,不巧发现了这么位仁兄,hand。

May 29, 2007

Google面试手记

毕业论文完成重要Milestone,三座大山推翻了一座半,轻松一下,上来除除草。

话说这第一座大山,就是密码工程的期末考试。推翻了之后发现是一座小山,郁闷了,早知道就不使那么大劲儿了。第二座大山,自然就是毕设了,30页纸啊。说是五月底,可是具体的deadline到现在还没定下来,我现在最怕的就是信箱里突然出现一封“接上级紧急通知,……”的信。还有一座大山嘛,下回再表。

扯完闲话,回到正题。幸得fairfox大牛的推荐,我坐直升飞机进了面试。二面之后已经有三个星期了,渺无音讯,不知死生。当然我也管不着,成事在天,在这儿只能发发感慨。

  1. Google太有米了,面试地点选在人民广场旁边的一家涉外宾馆,怎么说呢,这电梯里按钮的排列是L, 1, 2, 3, ...
  2. 既然说面试,最重要的当然是面试题了。本就不该多嘴的,何况还签了保密协议呢。以我自己做TA的经验来看,能不能答出最优方案绝对是次要的。有些解法那是相当巧妙啊,事后知道了我直想吐血。如果你常逛IQ、Algorithm等版,很多奇形怪状问题的答案事前全都知道,那可不一定是好事,这很容易限制思路。如果我是面试官,我看中的肯定是面试者的思考能力。你不知道最佳答案那正好,在慢慢思考优化的过程中,就可以考察你的逻辑思维能力。如果你什么问题都瞬间答了出来,我又怎么知道这是思考的结果呢,还是原来就知道呢?话说回来,如果真的知道答案该怎么办呢?当然是一点一点慢慢的吐出来。(哈哈,我太不厚道了)
  3. 尽管如此,做不出题来还是很令人沮丧的。我面了两次,就郁闷了两次。好在Google的面试官都很nice,尽管他们出的题目不都是如此。
  4. 等待面试也是很有意思的,碰到好多熟人,瞻仰了好多大牛的名字。初到这种陌生的环境中,大多数的男生都要比女生拘谨。比如一边空的床沿,只坐了一个角(试试看,不太稳当吧)。像我这种靠在枕头上闭目养神的,一看就知道是老油条了(我去了三次,中间那次被放了鸽子)。

感慨完毕,继续搞我的归约去。

May 19, 2007

春眠不觉晓

瞌睡停不了

Mar 31, 2007

买了个MX400III

碰巧在mrong那里听了一下,当场就被镇住了,一时冲动,立马在京东上买了个。

到底是有牌子的东东,果然比我原来那个后挂式的耳机要强多了,音色明显亮,低音也很厚实清晰,相较之下我的旧耳机就显得有点儿混浊。窃以为耳塞更容易做些,毕竟可以把耳洞全堵上,耳机要想做到这一步非闷死人不可。照此原理继续下去,应该往脑袋里扎针通电的效果最好,有条件并且不怕疼的同学可以试试。

赶紧测试了一下,依旧听不出ogg-3和flac半点儿的区别,我的耳朵就那么好哄么。。。不,也许是我的笔记本声卡太次了,如果能换一个好的……怎么冲动不起来了?

Mar 8, 2007

久违了

谁还记得上一次看到这两位同学是什么时候?

Feb 14, 2007

《我去2000年》

找这张专辑的时候是冲着那些花儿和白桦林去的。记得好像是高三的时候,年段里搞班级合唱,我们班选的就是白桦林。虽然最后是带着不太爽的心情唱完的,但歌确是好歌。似乎张老师还十分欣慰地说,我们会喜欢这首歌,说明我们尚保持一颗正常的大脑,没被考傻。(万幸,不知道我有没有机会考傻一次。)

一听之下大惊失色,原来其他歌完全就不是这一路的。有几首我都不知道怎么形容,叛逆,矛盾,又或者是颓废和麻木。听得我浑身上下不自在。嘿,搞不好以后的我也是这样。不过如此歌词居然能公开发行,看来文化部有时也蛮开明的(还是说,没听清失误了?!)。

那些花儿和白桦林就不用多说了吧,个人推荐:旅途,在希望的田野上,召唤。剩下的有几首太黯淡了,听着像什么就是什么吧。苦闷的时候翻出来听听,你就会发现,这世界上的同道人可不是一个两个。

Feb 7, 2007

伤城

不得不说,情节确实比较老套,讲的是一个在灭门惨案中侥幸逃脱的孩子长大成人后疯狂复仇的故事。

但是剧情的设置还是很精巧的,看前半截的时候,一直都在琢磨着,到底会如何发展。故事也一直波澜不惊的进行着,直到徐静蕾也被扔进了那个厨房。这让我一度以为不是梁朝伟干的。可事实最终还是,梁朝伟被复仇的快感冲昏了头。徐静蕾当下虽然幸运的逃过了一劫,但已经没有什么分别了。

  • 徐醒来之后,问:“你爱过我吗?”梁:“爱过。”徐笑:“你说谎。”
  • 梁平静地听金讲完整个经过,“……我忽然觉得她是不是仇人的女儿已经不重要了,她和我的父母兄妹一样,都是我的亲人。”
  • 梁再回到病房,徐已经被白布盖住了。床前摆着戒指。梁举枪。

人与人之间心灵的距离,真不知道应该如何去跨过。真是个伤心的城市。

Jan 26, 2007

开个庆祝晚会

宽敞的大礼堂里坐满了人,大家个个都是春风满面,谈论着,不时迸发出一阵阵笑声。舞台前暗红色的幕布徐徐向两端拉开,台上正中央架着两只话筒,左边是一张一米见方的演讲桌,上边摆着两束鲜花。这时,一帅哥携一靓女步上舞台,两人都是盛装,一派喜庆的气氛。观众席上嘈杂的声音渐渐平息下来,一阵掌声响起。

(啪啪啪……)

那两人缓步来到话筒前,一口字正腔圆的普通话拉开了晚会的序幕。

男:尊敬的各位领导、

女:亲爱的各位来宾,

合:大家晚上好!

(啪啪啪……)

男:(转向女)哎,你知道吗,2006年,也就是去年的年末,发生了一件相当意外的事情。

女:(好奇状)咦?这是什么事儿呢?

男:这件事儿说大不大,说小不小;说它平凡无奇可它事关全局,说它影响深远可又没啥稀奇;说它是件好事可有人叫苦连天,说它是件坏事又有人喜闻乐见。

女:(撒娇状)别卖关子了,到底是怎么回事啊?

男:台湾地震,把光缆绷断了。

女:(恍然大悟状)呀,这可是大事件啊。

男:可不是,有关部门马上就采取果断行动,多方配合,各司其职,一面向民众解释原因,一面加紧朝出事海域派出维修船,经过一个月的努力,愣是没全修好。

女:(惋惜状)这太不幸了。一定带来了很多不便之处吧?

男:是啊,我们可怜的jupiteye同学,因为连不上blogger,已经长达一个多月没有写博了。

女:(担心状)那他还健在吧?

男:确实还活着。况且组织还没有抛弃他,当他回到家后惊奇的发现,原来blogger是可以连上的啊!

女:(高兴状)啊,太好了。终于可以除草了。

男:说到这里,今晚我们在此欢聚一堂,就是为了热烈庆祝2007年jupiteye首次成功登陆blogger。

女:为了庆祝这一历史性的时刻,jupiteye同学作出了一个重要的决定,将在这里宣布。

男:好。下面,就让我们用最最热烈的掌声,请出今晚的主角。

啪啪啪啪啪……

掌声中,一人大步流星走上舞台,径直来到演讲桌前。他调了调话筒,从上衣口袋里摸出一张巴掌见方的讲演稿。

“谢谢,谢谢大家。那么现在,我就隆重的宣布——散会!”

(啪啪啪……)