第一百零一章 帮我去上两节课?
苏飞这一周多的时间天天泡在王正教授的研究室里看论文,对于陈阳教授给他的构想,他已经有了不少想法,并且进行了一些建模尝试,可以说进展飞速。
而这几日或许是因为科大讯飞的项目,顾亦如也是罕见地没有来烦扰苏飞,姜大校花也是神龙见首不见尾,林依曼小学妹据说正在备战期中考,VX都失联了。
可以说苏飞这几日是真正脱离了外界,沉浸在学术的海洋之中。
而杭市也已经悄然步入了十二月,真正步入了冬季,深秋转冬总是感觉突如其来的一般,前一天还暖和和的,后一天刺骨的寒风就直接给你一个暴击。
苏飞也是一大早出门的时候,冷风直扑脸庞,那个冷啊,把他冻得鼻酸头疼,身体一阵哆嗦,这才察觉到原来冬季已至。
他回寝室添了件上衣才出门,顺路去食堂买了两包子,直冲研究室。
当他到的时候,整个研究室就他一个人,倒不是师兄师姐们偷懒,而是这天气愈发寒冷,被窝的吸引力也就与日俱增,师兄师姐们大多开始了卡点上下班,缺勤是不可能的,毕竟王正教授对考勤简直苛刻到了入魔的地步,但是卡着点,能迟到一两分钟也绝不早到,在这个季节几乎成了研究生们的常态。
“师弟,怎么又是你?”周俞滴得一声刷完卡就走了进来,看到位置上的苏飞,不免一阵惊疑:“你这天天早到迟退的,比我们这群研究生还像研究生啊,要不要这么卷……”
“只是最近课题进展比较快。”苏飞解释道。
“陈阳教授的那个课题?”周俞顿时来了兴趣。
脑科学计划二把手陈阳教授给苏飞开小灶的事情,王正研究室里的人多少还是知道一二的,苏飞也在这个课题上咨询过几位师兄师姐,毕竟如果不使用灵感激发卡,单打独斗的力量也确实比不过一个团体嘛。
“一点点思路而已。”
“师弟你说的一点点,我怎么就不信呢?”
周俞一脸怀疑,这个师弟什么都好,就是老想着藏亿手,每次成果都往小了说,一副萌新的模样。
“俞哥,上次科大讯飞的那个项目怎么样了?”
苏飞对自己提出的那个想法还是蛮在意的,因为这是他下一个想要研究的课题,当时对科大讯飞的人提出这个想法看上去是免费送一个idea,但苏飞也是有自己的小算盘,让科大讯飞的人先去探探路,如果真如他所想的那样效果极好,下一个课题就有门路了。
“哦对,说到这个,还得多谢师弟你啊。”周俞咧嘴一笑,道:“我们用注意力机制搭配ELMo尝试了几个简单的任务,无论速度上还是准确率上都没有因为有图像提取层而有所降低,算是把ELMo这个模型完美地运用到了图像领域了。”
“目前的项目已经确定下来了,主攻短视频推荐,刘博和吴博也都没有任何异议,算是顺利进行了,估计要不了一个月,实验产品就能完成。”
周俞感激地看着苏飞,要不是有苏飞的提桉,就算那天能把项目确定下来,刘博和吴博这两个作为队伍主心骨的人也肯定有一人会存在异议,毕竟都觉得自己的方案更好,两人都争了半个多月了,周俞当时对这个状况也是头疼无比,还好他灵机一动把师弟拉了进来。
果然,苏神就是苏神,临场提出的一个新想法居然就有如此奇效。
“那就好,我还害怕我的想法没什么效果反而拖了你们的节奏。”
虽然嘴上这么说,苏飞心里却想着果然,这个结果没有出乎他的意料,这么一来自己的第三篇论文也算是有门路了。
他在Transformer完稿的时候,就有考虑过下一篇论文,当时的想法是,既然ELMo是把LSTM这个基本模型单元做成了一个预训练模型,而且效果拔群,从而开辟了一个自然语言处理新时代,那是否能把Transformer这个性能更好的模型单元也做成一个预训练模型呢?
虽然他当时有这个想法,但因为Transformer的训练成本实在是太大了,在加入王正教授研究室前,他根本没门路去找能支撑这种大型训练任务的服务器,而现在,有王教授的算力支持,设备早已不是问题。
而他还给了科大讯飞一个初步的构想,现在看来效果也很不错,这就证明了把Transformer做成一个预训练模型的想法是可靠的。
“嗯?怎么就你们两人?”
一个突然起来的声音让苏飞回过神来。
只见王正教授正拿着一叠教桉从门口走进来,脚步略微有些急促,两条浓眉皱成了一个川字。
“王教授。”
苏飞和周俞连忙打了声招呼。
“其他人呢?”
王正看着他们两人,皱着眉问道。
这空空荡荡的座位,显而易见,还没来啊。
苏飞默默吐槽。
“估计还在食堂……教授您怎么突然来了?”
周俞这话偏保守了,估计有几个还在被窝呢。
但王正这突然的查岗也让他有些懵,老板一两个月不来研究室都是常事,怎么这一大早的来个突击检查。
“最近这段时间研究室有点怠惰了啊。”王正说道:“我早上有课,但院里让我去开个会,想找小李帮我代个课。”
“这个点……李博赶得上也够呛。”
周俞看了下表,现在八点,看王正教授的匆忙样子,大概是早一的课,也就是八点十五,但他们研究室的上班打卡时间是八点半。
“教授,什么课啊?要不我给您试试?”
周俞见自家老板有难,挺身而出。
“呵呵。”王正毫不留情地道:“计算统计的EM算法,你行么?”
卧槽,老板您那两声呵呵我真的很受伤啊。
周俞尴尬地干笑两声,道:“EM算法我大概是不太行,这算法和机器学习高度相关啊,这不但要把机器学习吃透,数学还得很好,这谁能行啊……”
说着说着,周俞和王正两人的目光就慢慢移向了苏飞。
正准备阅读论文的苏飞发现研究室内一静,抬头对上了两人的目光。
卧槽,俞哥,就是你把鬼子引进了村的?
“小苏啊,你看这……要不帮我上两节课?”王正一脸为难道:“主要是你师兄太没用了一点啊。”
周俞在一旁受到了一万点暴击。
“教授,哪个班?”
苏飞无奈道。
“统计1802。”
嗯?
18级的?
统计那边怎么大四还有课?
“教授,上不好我可不负责啊。”
苏飞先打了个预防针,虽说EM算法他早就烂熟于心了,但学的明白和讲得好那还是有差别的,不然干啥还要专门开辟出师范这一个专业?
这就剩十分钟了,纯属赶鸭子上架。
…
…
夏薇凉这一大早的正在位置上打着哈欠,大四还有课就离谱,这严重妨碍了她的考研备战,听说隔壁计科院大四都没课了,自家这个小破院怎么事情就那么多。
当然,心里BB再多,她仍然只能乖乖来,因为这节课是王正教授的课,王老师的名声那可不只是在计科院广为流传,只要和机器学习沾点边的院,那都是臭名昭着。
只要你敢缺勤,王老师就敢给你平时分打零。
那可真是把狠心两个字刻到骨子里的男人。
门口传来了由远及近的脚步声,原本有些吵闹的班级瞬间安静下来,来了来了,辣个男人来了。
下一瞬就,门被打开,来者不是那个板着一张脸且脸上都写着狠心两个字的王教授,而是一个眉清目秀的少年。
全班为之一静,因为这少年的样子简直就是和他们同一个年龄层一般。
要知道,这种算法课程,没有比较深厚的学术底蕴哪能上去讲,代课的一般都是二十六七的博士,这突然乱入一个少年,让众人都是有些措不及防。
而夏薇凉更是感觉头顶微凉。
她张了张嘴,目瞪口呆:“大神?!”
“夏薇凉?”
苏飞也是一脸震惊。
对啊,这妹子之前有说过是统计学的,也是大四正在准备考研,但这未免有点太巧了吧。
夏薇凉嘴巴张大得如同能塞下一个鸡蛋,虽然她很早就知道苏飞的学神本质,但对方的上升速度就像坐火箭一般,英竞第一、脑竞金杯、AAAI论文,最离谱的是,这一转眼俩人都成师生关系了?
夏薇凉的内心狂奔过一万只羊驼。
苏飞感受到这有些尴尬且寂静的氛围,他率先开口说道:“大家好,我是苏飞,王正教授这节课有点事情,就由我来代课,因为是第一次讲课,有什么讲不明白的地方,还请同学们积极提问。”
苏飞?卧槽!
许多人听到这名字顿时目瞪口呆,难怪从刚才开始就一直有种熟悉感,原来是这位闻名江大的大神!
这位大神的照片在江大论坛上曾经广为流传,当然,大多数人也只是匆匆一撇,所以印象不深,而此时苏飞报出名字后,沉在心底的那一丝印象就浮上心头。
“是ELMo预训练的那个苏飞么?”
有个男同学脱口而出。
“同学,你这知识水平不低啊。”
苏飞听到这男同学的话颇有些诧异,一个本科生,居然就知道预训练了?
要知道,自然语言处理一般都是研究生才会接触上,至于预训练这种前沿算法,基本都是博士生才熟知,江大果然藏龙卧虎!
“苏神,你的这篇ELMo是今年保研复试的英语论文理解题……”
这男同学说到这个颇有些闷闷不乐,仿佛是想起了不太美好的回忆。
他当时看到这论文的时候就懵了,这都是啥变态的题目,让我一个小小本科生从统计学角度来理解这种AAAI的顶级预训练算法论文?
这导致他复试就真瞎几把操作一通,操作完还被原本乐呵呵的复试教授骂得狗血喷头。
最诡异的是,还TM被录取了。
因此,ELMo预训练就在他心里留下了一个不可磨灭的印象。
苏飞听到他的回答,整个人一愣,随即就想起了自己保研华大的时候,论文翻译和理解也是ELMo,想到此处,他感到一阵好笑,计科系就算了,怎么连统计学保研都来蹭一蹭ELMo,这是不是太疯狂了,毕竟统计学的同学们又没什么算法经验。
“抱歉啊,本科生理解ELMo还是有点难度,想必给你造成了一点麻烦,希望结果是好的。”苏飞失笑说道。
本科生理解ELMo还是有点难度……要不是你丫这本科生直接创造了ELMo,能有这么离谱的事嘛。
这位男同学此刻的心里只得默默吐槽。
此时,班级里已经有点沸腾了,毕竟苏飞的大名广为流传,在座的各位基本或多或少都听过,他们知道,苏飞这个学神,非常牛逼,甚至隐隐超过了那个传奇校花姜倾雪。
“咳咳,同学们,我们开始上课。”
苏飞干咳两声,压下了有些喧嚣起来的班级。
他把王正教授给的PPT直接投到了屏幕上,打开教桉,便说道:“我对EM算法的理解其实多是来源于机器学习的贝叶斯算法,关于计算统计学的话,我倒是也阅读过与此相关的一些优化算法,我觉得统计学角度的EM算法和机器学习的EM算法其实就是共通的,只不过理解角度有些许差异,我会结合机器学习来给大家讲一讲。”
“可能大家都清楚EM算法是一种迭代优化策略,分为两步,一者为期望步(E步),一者为极大步(M步),通过这两步的不断迭代以此得出最优解,所以被称为期望最大化算法(EM),其实在机器学习的强化学习中,类似的迭代算法非常多,诸如蒙特卡罗同步和异步策略,又如Q-learning算法……”
台下的同学们其实是有些懵逼的,因为台上这位大老的思路跳跃得实在是有些快,从EM算法跳到机器学习的一些相似算法剖析了一通,然后又从数学角度浅浅理解了下,最后又跳回统计学这边。
部分算是学霸的勉强还能跟上,剩下的那就全是一脸“我是谁,我在哪,我在干什么”这哲学三问的脸。
→