机器学习的战略(6)--end to end

端到端学习 end-to-end Learning

这个也是吓人. 读书人, 相煎何太急.

end-to-end的一端是原始数据, 另一端是想要的结果. 比如也许从一张眼底照片+FFA直接给出眼底激光应该打哪里, 或者说中文直接给出翻译好的英文字幕. 从一端到另一端中间本来是有很多研究过程在里面的,

  • 中文语音->音频信号增强降噪->音节提取->转成文字->翻译->英文字幕,
  • 眼底照片+FFA->数微血管瘤, 渗出->形成糖尿病视网膜病变诊断->分期->判定新生血管->规划激光点位置->开打

每个环节都有一堆PhD论文, 有一堆临床经验, 现在突然有一部分问题可以直接跳过中间环节, 从一端直接获得另一端的结果. 有时候学术研究也堪比柯达胶卷, 明明自己很努力也没做错什么, 整个领域突然就废了.

不过好在目前还不是所有的问题都可以end-to-end, 而且也不是end-to-end就效果很好. 有些问题加个中间环节反而可以更有效.

课程中的例子是: 门禁的人脸识别, 一种是直接从图像->身份ID的end-to-end, 另一种是图像->标记出人脸->剪裁图片人脸放大居中->身份ID. 后者的效果更好. 另一个例子是从X光片看儿童发育, 直接从图像->年龄的效果不如图像->提取分离骨骼图像->骨骼尺寸->年龄, 而且其中骨骼尺寸->年龄是可以从正常值的统计得出的.

是否使用end-to-end

优点: 完全来自于数据, 机器学习"总结"出来的规律是客观数据所反映的, 不是人想象出来的, 用不着讨论是"木火土金水"还是"金木水火土" 用不着太多手工设计.

缺点: 需要大量大量大量大量的数据. 排除了手工设计的组件. * 手工设计组件并非坏事, 人类的推理归纳还是对知识的扩展有很大意义. * 而且, 从我做发明的经验来看, 很多公司要求避免使用比较"黑箱"的深度学习方法, 大概很难查错吧.

是否用end-to-end的关键在于, 已经拥有的data数量是否已经可以 足够 反映出问题的复杂性. 足够的定义就只好靠经验和实践了.


参考资料: