第18章 结果提交

    第18章 结果提交 (第2/3页)

在了已经训练了很久的分类模型上,又跑起了检测赛事的数据。

    检测任务是分类任务的进阶,在你的程序分辨出这张图片的类别之后,更进一步的操作就是用矩形框把该物体的位置在图片中位置给圈出来。也就是后来大家熟悉的人脸上的框框。

    再进一步就是分割了,不采用矩形框这样大的,规则的图形,而是像素级别地把某个物体的细致轮廓在图片上表示出来,也就是一种类似自动抠图的操作。

    当然了,不论是检测还是分割,都是需要人工去标注训练集的原始答案的。

    IMAGENET-2013的检测赛道数据集不算太大,一共接近40万张图片,共区分200类。这种进阶类型的数据,标注起来要辛苦很多,因此数据量和分类不可同日而语。

    不过,相比2012年的5717张,区区一年的时间,已经是百倍的巨大飞跃了。

    “没想到时间竟然会这么多。”孟繁岐记得这时候的检测大多数还是基于传统HOG,LBP的办法,在13年的这个数据集上mAP最高也就0.225左右。

    自己既然来得及完成论文上的实验,自然要抽空去降维打击一下这些老古董方法。

    每个参赛队伍在各任务上有三次提交的机会,孟繁岐只需要一次就够了。

    参与竞赛的队伍往往会训练好几个版本的模型,然后做一些排列组合的集成,分多次提交,以确保自己的结果不会被一些不稳定的因素影响。

    这也是追求更高性能的一种办法,因为谁也无法保证自己的哪一次结果在位置的数据上性能最好。

    有时候第一名和第二名,就差在毫厘之间,可能只是小数点后的两三位。

    只是孟繁岐完全没有这个必要这么做。

    余下的时间也来不及再做什么,孟繁岐本想11号就早早把结果提交,多一事不如少一事。

    但唐璜却阻拦他,说英雄总要最后一步到场,才显得特别戏剧化。

    “这提交也不是实时显示的,而是14号统一公布结果。”孟繁岐指出了这么一个尴尬的问题。

    “额..”唐璜只得强撑着解释道,“虽然其他人看不到,但主办方不是看得到嘛。在最后关头,给他们一点小小的中国震撼!”

    -------------------

    大洋彼岸,斯坦福大学

    (本章未完,请点击下一页继续阅读)