督抚小说

162 网络的重参数化(第2页)

实际上,马斯克没有对这件事情抱有特别大的希望。在他看来,孟繁岐上次给出的方案已经好到非常离谱了。

在这个大家才刚开始复现DreamNet,还没把残差的原理和一些变种搞明白的时间点,孟繁岐已经针对各种不同平台的其他运算设备,做了相当多的实验。

从而通过优化算子结构,调整特定计算过程的方式,将这个核心的骨干网络参数量减少了接近十倍。

运算快了这么多,性能却没什么变化,这已经非常不得了了。

马斯克有这一问,也是私下里的随口一提。

但他名头太大,以往自己做的事情又太疯狂,导致孟繁岐听着他那颇为低沉,有磁性的声音之时,当了真。

还真以为这是个非常严肃认真的需求。

“自动驾驶的热度确实也快起来了,我专门针对这方面做点优化工作,也不算亏。”

孟繁岐一边利用着重生优势开始抄底一些车企的股票,一边开始着手实现一个巧妙的加速并且节省内存的方式。

();()  这个新的优化办法叫做网络结构的重参数化。

这半年来,视觉方法性能的突飞猛进来自于孟繁岐提出的残差方法,也就是将y=F(x)变为y=F(x)+x。

这里的写法比较简便,将一系列复杂的操作,抽象归纳为F(),在实际运算过程中,这个F()还是比较复杂的,往往需要算上好一会。

但在计算的时候,就有一个问题了,原本y=F(x)运算开始的时候,就不再需要继续存储x这个变量了,因为它已经在参与F(x)的运算。

在运算过程当中,它会变成其他的中间变量,然后最终变为我们所想要的y。

可在残差办法当中,y=F(x)+x,x这个原始的输入,是不能够舍弃的。

必须有空间一直被占用着,用来存放这个x,因为它还等着最后加上去呢。

在比较复杂,分辨率比较高的任务当中,这个变量的大小是相当可观的。

这种情况有没有办法可以规避?规避之后,残差方法带来的性能提升能不能不要被影响?

答案当然是肯定的,完全可以做到。

孟繁岐准备实现的这种结构重参数化,其最核心的思想就是模型训练和实际使用推理的分离。

首先构造一系列结构(一般用于训练),并将其参数等价转换为另一组参数(一般用于推理),从而将这一系列结构等价转换为另一系列结构。

在现实场景中,训练资源一般是非常丰富的,可以在大型的服务器上得到。

而推理的时候,计算资源往往会比较有限,因此大家更在意的是推理时的开销和性能。

想要训练时的结构较大,具备好的某种性质,比如性能特别好,准确率特别高。

但在推理的时候,则把结构变小变快,同时在数学上等价于大型的结构。

孟繁岐的这个新办法,就提供了这种可能,他相信,重参数+移动端网络的算力削减,将会成为自动驾驶领域的一大催化剂。

请勿开启浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。

陨落星辰:  华娱之开局给周董上上对抗  主宰:虫族崛起  火枪洗明路  全职法师之魔法天赋  大明:我杨宪,真的治扬!  大唐第一逆子  我以道种铸长生  当场怒喷哥哥,这解说不想干了?  明日方舟之铁与血  天骄退婚,我提取词条修行  无限超神:抬头看见云霄天庭  纵目  海贼:阿卡姆肄业的小丑巴基  神秘复苏之我没有外挂  异常魔兽见闻录  前任都是天后,我火了  自遮天世界开始  你是我的满世欢喜  什么叫世界名帅啊  

热门小说推荐
锦绣人生[快穿]

锦绣人生[快穿]

下一本小奶龙寻亲记专栏求预收本文文案每一个故事中,除了有万众瞩目的主角,还有着无数不受人重视的配角。他们普通平凡,或许只有几行字的描述,或许连姓名都不为人知,只是简单一个代号,或许谁也不会...

开局聊斋打铁十五年

开局聊斋打铁十五年

国之将亡,必有妖孽。大唐天佑四年时,本应该覆灭的唐朝却不知为何得以续了两百年余年,可自此之后,妖魔纵生,天下大乱。自乱世而来的秦白能够通过打铁垂钓烹饪刺绣行医等获得各类神通,即修行诡异法门纸人赶尸符咒蛊虫又历经一个个熟悉但诡异的故事,板桥客栈倩女幽魂画皮河神青蛇画中仙,西游降魔...

家师太彪悍

家师太彪悍

李青石本来以为师父是个假装江湖高手的骗子,后来才知道原来是个贼牛掰的穿越者各位书友要是觉得家师太彪悍还不错的话请不要忘记向您QQ群和微博里的朋友推荐哦!...

捡个大佬再闯末世

捡个大佬再闯末世

前世的黎歌是中部基地二把手,沈煜年让她夺取丧尸皇晶核,她做的完美无缺。可被推入那场漫天大火的人是她,笑她蠢的是沈煜年和白穗,救她的是被设计的丧尸皇。末世之初她重生到了同名同姓的白穗小跟班身上,稀有的...

众神世界

众神世界

世界中心的奥林波斯山上,众神之王宙斯紧握雷霆之矛,笑看诸界。他的面前,众神如林。北方的白银之厅,至高王座上的奥丁手持天界之枪,俯视世间。他的眼中,无尽风雪。南方的尼罗河畔,掌舵太阳船的阿蒙,目光落在...

每日热搜小说推荐