手机浏览器扫描二维码访问
几个在实验室的师兄都点开链接,打算观摩一下周昀的独门秘籍。
就连刚刚趴下的邱彦都重新坐直了身子。
几人了看了一会儿,都不由发出感叹。
“我愿称之为——研究生新手入门宝典!”
“确实,我们那时候要有这东西,得少走多少弯路,不说别的,就这装环境,那时候就卡了我一两个月,
学怎么用github又是一两周,学会怎么找文献又是一两周,各种杂七杂八的东西学下来,半个学期就过去了,
而且这玩意儿又没有系统性的教程,都是自己一点点上网找的,不过你们这倒是好了,有周昀这东西,能省下不少时间。”
“对你们有帮助就行,如果别人有需要的话直接给就好了,只是别让人拿着我的东西去收费就好,看完觉得有帮助给我点个Star呗。”
“点了,要我说,你这玩意儿迟早得火!”
“那借你吉言了。”
短暂的吵闹过后,实验室又恢复了平静。
周昀看着屏幕上的实验记录,第一次感觉有些棘手。
能够支撑模型运行的核心代码他上周就写完了,然后设置了几组实验,跑了六天,今天刚好出结果。
只是这结果,有些不尽如人意。
在选择股票相同的情况下,甚至还没有之前那个只能接受数值和文本数据的阉割版模型效果好。
这就是AI领域的问题之一,模型完全是黑盒的,你永远不知道你的数据在模型里是怎么变化传输的,可能某一行代码出了问题,就会导致各种奇奇怪怪的问题。
不过还好,周昀在写代码的时候加入了大量的调试代码,因为每跑一次实验需要的时间太长了,
甚至这次他并没有用到所有的数据,只用了其中的一部分,跑一组实验就得一周,这还是64张H100的显卡集群的情况下,
如果用上全部的数据的话,虽然时间上不会是简单的倍乘关系,但至少也得两周。
但这也就是第一次训练时候需要大量数据才要这么久,等第一次训练好了,后续的再有新的数据,就不需要从头训练,只需要利用新的数据微调就行。
现在他就在看输出日志,观察到底是在哪一个环节出了问题,为了衡量模型的效果好坏,
他在数据预处理,数据融合,模型训练,结果输出这几个方面设计了几个指标。
经过观察,他大概确认了最为可能的一个原因。
数据融合异常。
因为模型接受的数据是多种模态的,所以在预处理之后还有一个数据融合阶段。
根据实验日志来看,问题就出现在了这一阶段。
原本的数据融合算法在只有两种模态数据的时候,效果很好,但是当数据的模态数量逐渐上升,
一些原本没有发现的bug逐渐显现出来,这也是导致最终效果不如原来模型的最为重要的原因。
当然,也可能是因为过拟合,数据泄露,这种普遍性的问题,只不过仅根据这次的输出日志来看,可能性不大。
“嗯......特征维度贡献方差过大?”
划动滚轮的手指停下,周昀敏锐地看到了一条异常的输出。
说人话就是,模型在融合信息的时候没有一个轻重缓急,对所有模态的数据都一视同仁,平等对待了所有输入。
林哲,你姐姐为了你已经变成扶弟魔了,她的追求者都被吓跑了,你想让她变成老姑娘吗?林哲默默的在心中自语如果这就把他们吓跑了,那如果我亮出给姐姐准备的上百亿的嫁妆,他们是不是都该吓死?这是一个重生者苦尽甘来的轻松生活故事,诚恳希望读者大佬们进来品鉴。...
预收和无惨同居的日子,无惨x原创女主预收当无惨重回平安京,无惨水仙,大正鬼王x病弱人类按照收藏数量决定开文顺序!已有完结离开鬼杀队后我和鬼王在一起了日呼x无惨,放心食用!有兴趣的姐妹可以点进...
关于这个道长就是在修仙老爹死后,给我留下一把骨扇,还有穷追不舍的猛鬼。新死的怨魂,入土不安的干尸,妄图靠鬼发财的活人,有人求我有人畏我。我真的只是一个平平凡凡的小道士。...
关于文娱绑定老六系统后我火爆全网林南溪重生后意外绑定了老六系统,任务完成就能获得丰厚奖励。咦,完成任务还能变美变有钱?本想低调直播闷声发大财,没想到这个老六系统却让她包揽热搜。一首掀起了全网结婚热潮,竟一举解决了国家生育率低迷问题。一曲让自诩甜歌女王的超一线明星发誓自此不再唱歌。无数天王天后日夜蹲守在林南溪门外,只为求歌...
各位书友要是觉得东京开局捡到隔壁大姐姐还不错的话请不要忘记向您QQ群和微博里的朋友推荐哦!...
...