《我看见的世界》读后感

副标题: 李飞飞自传
原作名: The Worlds I See: Curiosity, Exploration, and Discovery at the Dawn of AI

2024年11月开始阅读这本书,12月底读完本书。

本书作者是是“人工智能教母”,美国三院院士李飞飞,作者在书中介绍了自己的家庭、求学和科学探索经历;按照时间线穿插介绍视觉研究和人工智能的科学史;最重要的故事线是李飞飞的视觉和人工智能研究。

英文书名更能反映本书的内容,worlds既包括视觉研究的世界,也包括李飞飞看见的世界;副标题的curiosity,exploration对应她的求学、人生选择、科研探索;discovery at the dawn of AI突出了视觉研究对Ai发展的贡献。

整理书中特别受触动的几个内容:

  • 在美国遇到了“第二父母”萨贝拉老师,帮助他成就美国梦。
  • 在科学抱负和现实(加入公司早点赚钱)之间的选择
  • 李飞飞的科学探索经历,特别是创建和推广ImageNet图像集的艰辛历程,和神经网络算法互相成就,一起开启了第四次工业革命——人工智能的时代。
  • 人生路上的选择、运气、机遇和坚持

如果只总结一个阅读收获,那就是坚持自己的选择。这在书中有多处阐述,比如李飞飞的父母选择移民美国,李飞飞选择追寻自己的科学梦,而父母即使经济拮据也选择无条件的支持她,“这不是你的选择,这是我们全家的选择”;李飞飞不顾别人的质疑创建并在行业内推广ImageNet数据集,努力结合运气,为人工智能的起飞发挥了不可磨灭的贡献。

美国求学路上的恩人:萨贝拉老师

李飞飞的高中老师萨贝拉先生,借款给李飞飞父母,帮助他们摆脱经济困境;更重要的是担当了“父母”和“启蒙导师”的角色,指导李飞飞的学习和人生重要选择。只可惜萨贝拉先生因病去世,无缘见证自己的“女儿”的人生成就。

跟随鲍勃(当时我还称他为萨贝拉先生)学习的经历依然历历在目,它提醒着我,一位老师可以在年轻人的生命中留下无比深刻的烙印。
在帕西帕尼高中的数学课上,我不安地向鲍勃求助,从此我们的生命开始相交,我的移民生活得以改变。现在,我们两个家庭横跨美国,三代人之间依然保持着紧密的联系。鲍勃是我的老师、我的知己、我的朋友;在我几乎无法表达自己的时候,他是我的救命稻草。
关于这个国家,让我学到最多的就是与萨贝拉一家的交往。
我对这个国家最深刻的理解不是来自新闻,也不是来自某个论战家的专栏文章,甚至不是来自教科书,而是源于有幸结识萨贝拉一家。他们是我在这片土地上最珍视的人道主义典范,他们闪耀着人性的光辉,在我看来,这才是真正的美国精神。

本科毕业,面临科学抱负与现实生活之间的抉择

李飞飞本科毕业后,去普林斯顿大学读研究生,选择专业时,纠结是选择自己喜欢的物理专业,还是选择潜在报酬更丰富的金融类专业,以减轻父母的经济负担。

李飞飞妈妈的建议很简单,什么是你真正想要的!追求自己热爱的,不要考虑其他因素。

当时网络经济正在蓬勃发展,盛况空前,拥有数学头脑和名校学位的人成了金融界热切追捧的对象,甚至像我这样学物理的,也受到了华尔街的大力招揽。他们承诺免除我们的债务,结束干洗店的劳累,在母亲的健康状况日益恶化的情况下为我的家庭提供保障。而对我的唯一要求就是放弃科学。
“飞飞,这是你想要的吗?”
“你知道我想要什么,妈妈。我想成为一名科学家。”
“那还有什么好说的呢?”

普林斯顿大学的教授们常说,研究生学习不仅仅是另一个学术里程碑,更是一个转折点,代表着从学生到成为真正科学家的第一次转变。研究生学习将把激情转化为旅程,将兴趣转化身份,将这段教育经历锤炼为事业、声誉和生活的基础。这种看法令人鼓舞,让我所面临的问题变得明确,但同时也让它变得更加费解。我知道自己想成为一名科学家,但究竟是什么样的科学家?究竟是为了什么目的?我怎么才能找到答案呢? p137

在研究生期间,李飞飞经常反思,自己是否应该放弃科研,赚钱支持父母,因为科研领域竞争激烈,薪酬低廉;“我每天都在追求自己的梦想,这让我觉得自私至极,甚至过于鲁莽”,”父母为了我才做出这么大的牺牲”。
在此压力下,她去参加麦肯锡面试并轻松获得正式职位;并将自己的艰难选择告诉母亲,一边是自己梦想的科研工作,一边是立刻就能摆脱困境的企业岗位。但李飞飞母亲,告诉她,全家都在支持她追求她的梦想,不论贫穷还是富有,这都是全家的选择。
这就是无条件的家庭支持啊。

“飞飞,你一直在说自己走的路很‘自私’,就好像你追求科学是在牺牲我们一样。”
“这从来就不是你一个人的路。从一开始,这就是我们全家的路。不管你是注定要成为科学家、研究员,还是其他我没有办法想象的职业,也不管你能不能从中赚到钱,从我们的飞机离开上海的那一刻开始,我们全家就一直在为这个目标努力。”
“我再说最后一次:我们走到这一步,不是让你现在放弃的。”
她是对的。她总是对的。这一次,不知什么原因,我终于听进去了她的话。我再也不会质疑自己的道路了。

科研经历:创建ImageNet超大规模图像集

李飞飞的科研经历,是本书最有趣和跌宕起伏的内容,其中多次遇到挑战,并在努力和运气的加持下,逐渐破解。出乎所有人的预料,ImageNet为人工智能的发展做出了巨大贡献。

作者选择视觉研究课题,之前的视觉研究已经有数十年,但是都没有成功,但视觉研究即将复苏,借住人工智能的东风。

李飞飞在博士阶段,研究算法对图像的识别效果,当时只做了101个分类。

整个行业都将精力放在算法上,而李飞飞认为训练和判断算法优劣的数据集,同样重要,甚至更加重要——因为没有多少人投入在这个方向上。

李飞飞成立自己的课题组后,决定创建大规模ImageNet图像集,基于一篇论文和WordNet文字集合的启发,他们最终锁定了2.2万个有实体对象的名词,暂定为每个名词寻找1000张不同的照片,总共是2000万张照片。

这是探索的冲动,面对别人的质疑,开启一场巨大的赌博,不论是对需要科研业绩的李飞飞老师还是需要成功毕业的学生邓嘉。

李飞飞坚信,ImageNet 正是计算机视觉所需要的,也是同行研究者所忽略的课题。

ImageNet可能注定要失败,但无论结果如何,这个项目的目标都是值得追求的。

李飞飞的祖师爷认为“你们在这个想法上投入得过多了”,“科学的诀窍是跟随着你的领域一起成长。不要太超前。

开始工作后,他们发现无论多么努力,完成项目需要大量的标定工作,计算需要15年之久。这是第一个重大挑战。

我承担的风险比我意识到的更大,而现在回头已经为时太晚。

一筹莫展之际,邓稼的同学建议使用亚马逊刚刚推出的众包服务——“土耳其机器人”,利用互联网招募成千上万的标注员进行标定工作。经过不断自动化标注工作,以及后续斯坦福大学的资金支持,耗时一年多,ImageNet图像集项目终于完成。

新的挑战是,辛苦创建的项目并没有得到学术界的重视,反而被忽略了。批评者对这个数据集不屑一顾,同行对其兴趣寥寥,ImageNet要走向无人问津的境地。

为了推动ImageNet,李飞飞和合作者搞了一个计算机视觉领域的竞赛,利用ImageNet超大数据集评估和筛选优秀的视觉算法。

但结果让人大失所望,竞赛只是证明现有的大多数算法都难以应对ImageNet,并没有产生突破性的算法。

“也许这个数据集太超前了,也许吉滕德拉是对的,你的跨越幅度太大了。但这并不意味着ImageNet是错的。”
有时候,假设需要一些时间才能赢得所有人的认同。

2012年的竞赛,一个古董级算法“卷积神经网络”横空出世,将准确率一次性提高了10%,震动整个行业。ImageNet大规模图像集、卷积神经网络(算法)和GPU(算力),互相成就了彼此,共同开启了深度学习的时代。

科学总是以一种耐人寻味的方式打破预期,即便那些与之最接近的人也始料未及。
2012年ImageNet挑战赛的冲击波仍在回荡。对像我们这样痴迷于计算机视觉的人来说,这是一个分水岭,全世界都开始认识到,比赛结果不仅仅是对图片理解的转折点,更是对一切事物理解的转折点。在这个曾经鲜为人知的竞赛中,AlexNet展示了大规模数据集、高速图形处理器和深度分层神经网络三者近乎神奇的组合。这种组合是一幅蓝图,其应用范围注定要远远超出计算机视觉领域。世界各地的实验室都在构建更加丰富的分层网络,与此相对应的,一个新的名字正在流行——这不仅仅是机器学习的时代,更是深度学习的时代。
一种全新的范式正在诞生。

在此基础上,李飞飞实验室创造了一种图片说明识别技术,谷歌也在同期开发了类似的技术,这就是早期的”文本生产技术”。

之后科研走上了快车道,针对人工智能中的负面冲击,比如性别和种族歧视,李飞飞强调“以人为本”,而这也是高校科研领域要解决的“公共利益”事件,因为企业更强调商业收益。

跳出本书看人工智能的发展,现在是2025年1月,过去人工智能快速发展十几年,特别是过去这几年的快速发展,ChatGPT和相关投资带动了整个美国经济。

人生路上的选择、运气、机遇和坚持

每个人的人生路上,都要很多的选择,既要看运气和机遇,又要相信自己的选择并为之努力。过早放弃的人无法获得属于自己的成功,当然也有无数坚持梦想但无法成功的人。

父母选择移民美国,一切从零开始;
在美国遇到萨贝拉夫妇,帮助他解答学习和成长的疑惑;
父母无条件的支持李飞飞的科学梦;
ImageNet赶上了人工智能即将腾飞的时代,和GPU算力、卷积神经网络算法一起震惊了科学界;这三者缺一不可,成就彼此。
甚至创建ImageNet的时候,正好亚马逊开发了众包平台,可以在一年内完成原本计划十年才能完成的工作。

很多时候,努力前进,享受过程即可;至于结果,就交给运气。这让我再次想到《在峡江的转弯处:陈行甲人生笔记》中的那句话:

生活有其自身的逻辑,那些不经意间播下的种子,那些没有企图的浇灌,说不准在什么时候会有一阵春风拂过就出土了。

2024-12-22 整理大部分内容
2025-1-1 重新梳理一遍,发布。