个机灵鬼,其实我刚才也正有此意。”



“现成的大模型不用白不用,说干就干!”



郭长征也点头同意了这个提议。



“跑一次看看,正好摸摸这个比赛数据集的特征分布底细。”



这里需要给非专业人士解释一下。



为什么用训练了五千个类别的通用模型,可以直接去预测只有一千个类别的子数据集?



因为在深度学习中,用海量数据喂出来的模型“见多识广”。



它在底层网络中已经学会了提取通用的图像特征,比如轮廓、纹理、色彩组合。



这种通用的特征提取能力,完全可以直接套用到子集数据的分类任务上。



但直接这么做,预测精度必然会存在误差,成绩会差一些。



原因很简单,模型最终输出的是五千个选项的概率。



在面对这五万张只有一千种标准答案的验证图片时,通用模型依然会按照五千个类别的范围去预测。



一旦它把图片分类成了比赛规定的一千个类别之外的选项,按照赛制就会被判定为错误。



它还需要时间去针对这一千个特定的类别重新训练,才能做到精准得分。



楚一航没管那么多,直接在终端里输入调用tenrflo框架的命令。



回车键敲下。



隔壁机房的散热风扇转速瞬间飙升,噪音穿透了玻璃门。



屏幕上开始滚动运行日志。



钟柏盯着显存占用率的监控面板。



“集群的显存占用直接拉满了。”



“九章平台对ad显卡的调度策略真够暴力的。”



叶言看着进度条。



“处理五万张图片,传统算法少说得跑个两三天。”



“我看这进度,估计一顿饭的功夫就能出结果。”



楚一航往后靠在椅背上。



“这就叫算力碾压。”



十分钟过去。



终端屏幕上的滚动日志停了下来。



最后一行输出了一串统计数据。



钟柏揉了揉眼睛,指着屏幕上的数字。



“我是不是看花眼了?”



叶言凑过去,一个字符一个字符地念出来。



“-1准确率:402。”



“-5准确率:805。”



楚一航保持着靠在椅背上的姿势,摸下巴的手停住了。



郭长征立刻推开钟柏,自己握住鼠标,点开测试代码的日志文件。



他快速检查着数据加载流程和对比逻辑。



“没有发生数据泄露。”



“这个模型的训练集里,不包含这些验证集的数据。”



郭长征得出结论。

本章未完,点击下一页继续阅读

(2/3)

章节目录

带着手机重生,目标科技教父所有内容均来自互联网,零点小说网只为原作者没钱又任性的小说进行宣传。欢迎各位书友支持没钱又任性并收藏带着手机重生,目标科技教父最新章节