阅读设置(推荐配合 快捷键[F11] 进入全屏沉浸式阅读)

设置X

50 虚假与真实(1 / 2)

第50章50虚假与真实

周一清晨,闹钟响了,许瑷达迷迷糊糊哼了一声,往梁思宇怀里蹭。她眼皮沉得睁不开,全身都酸,不想上班,不想起床,只想再睡个回笼觉。“睡吧。“梁思宇亲亲她的脸颊,把侧睡抱枕塞进她怀里。现在算法已经挺稳定了,他和科恩去也差不多,就让她休息一天吧。她发出一声模糊的哼唧,继续睡了下去。

他轻吻她的发丝,把被子拉好,设置了十点半的闹钟,下楼后先交代厨师帮她准备brunch,才取过自己的早餐。科恩咽下最后一口咖啡,询问道:“Ada不舒服?”梁思宇摸摸鼻子:“有一点,今天我们去就行。”科恩看着好友的表情,内心翻个白眼。

天,他真不想猜到发生了什么,但Ned和之前完全“两模两样”,Ada要真的身体不适,他绝不是这个样子。

下午实验结束,科恩搭上丹尼的肩膀,约他一起晚饭。他跟梁思宇告别:“我晚点回去,帮我问Ada好。”他可不想被两个好朋友秀一脸。

可惜,许瑷达倒是盼着他回来,她本来想三个人一起商量下后续研究计划的,不过,先探探梁思宇的想法也好。

吃过晚饭,她主动提议:“Ned,我们商量一下新学期的计划吧?”梁思宇倒来两杯冰椰子水,坐到她对面。

许瑷达开门见山:“下学期,我们可以把硬件换成sEMG,数据精度更高。这方面我会和科恩再确认一下。”

“至于药物影响,我想先做阿得拉,参与者招募更容易。你怎么想?”梁思宇却对曲唑酮更感兴趣。

这种药物既有助眠作用,又有镇痛功能,还能改善情绪,在截肢患者中使用率更高,明显更具有研究价值。

他再次感到一丝异样,她好像,真的有点着急。上学期,她流感没好全,就急着要补数据。

他了解她的科研品味,她肯定能看出曲唑酮更有研究意义,只是为了求快,她才想选阿得拉。

到底是为了什么呢?她不是那种图一时虚名、短暂浮利的人。“Ada,“他犹豫了一下,握住了她的手,“我总感觉,你今年好像有点着急,你在担心什么?”

“或者,是我感觉错了?不管怎么样,你愿意和我聊聊吗?”许瑷达心情复杂,他向来细心,又了解她的喜好,总能在细枝末节上察觉些什么。幸好,他绝不会想到重生这么离谱的真相。她嘴角微微一动,不过,在这件事上,她倒也不单单是为了“快速出成果”,而是有其他考量,这甚至是她上辈子都没有用过的方法。她干脆地承认:“是,阿得拉的研究价值确实不如曲唑酮。但是,我想顺带验证一个新算法,从根源上解决数据稀缺性的问题。”“你是想同时完成一篇方法学论文?用这个数据集来做验证?”梁思宇马上明白了她的意思,她这是想一石二鸟,用一个数据集完成双重目的,发表两篇不同性质的论文。

不过,他也有不解之处:“等等,让我想想,RNN的迁移学习在其他药物上并不一定适应吧?这个算法不具有普适性吧?方法创新在哪里?”许瑷达摇摇头:“不是你想的这种,是一种更激进的方法改进。我是想用GANs(对抗网络)训练一个肌电数据的生成器。”她放慢语速,“我想证明,少量真实数据加大量生成数据,就能训练出有效的算法。”

“什么?!“梁思宇目瞪口呆。

他花了十几秒钟来消化这句话,眉头慢慢皱紧。不,这不是激进,这简直是颠覆。照他看来,这完全不符合实证研究的基本原则。

许瑷达试着解释,GANs(对抗网络)需要训练两个互为对手的AI模型。一种是生成器,基于普通的sEMG信号生成受阿得拉影响的信号,一种是判别器,来分辨这个信号到底是伪造器生成的还是真实信号。两个模型互相攻防,迭代多次后,生成器产生的数据达到“以假乱真"的水平一一判别器很难鉴定其真伪。

这时候,就可以用少量真实数据加大量生成数据来训练算法,从根源上解决特殊参与者训练数据不足、数据收集困难的问题。“思路上我明白了,"梁思宇非常犹豫,“可是,这有点像一种数字游戏。”“用虚拟生成数据来训练运动控制算法?怎么确保它们和真实数据一致?”他点破自己的担忧:“判别器不能分辨,也许不是虚拟数据足够仿真,而是你的判别器不够聪明呢?”

许瑷达点头:“所以,我们还是要招募阿得拉的使用者,收集真实数据。你就当我的GANs算法在搭便车,做不出来也没损失,对不对?”“到时候,如果用它生成的虚拟数据和真实数据训练出来的算法一样好,你是不是可以承认,我的方法是有效的?”梁思宇叹了口气,听她这意思,是准备私下完成,才向导师汇报,可见她自己也知道成功率不高。

这是刚发表一年的新算法,万一算法本身有问题呢?况且,她完成了算法,也得投稿啊,审稿人那一关呢?他觉得这个做法真的很冒险。他劝道:“Ada,你也得想想投稿的问题,审稿人恐怕会觉得这方法不够严谨。起码,医学期刊上,据我所知,没有人会接受虚拟数据。”她有些不舒服,微微提高了音量:“那是你们既傲慢,

上一章 目录 +书签 下一页