为什么要读论文
- 积累基础知识:综述或者经典论文中的 Related Works 可以帮助了解该领域一些主要的技术栈,Related Works通常会介绍一些经典的算法论文。
- 获取新方向和新思路:跟上该技术领域内的最新发展思路,对解决当前算法存在问题提供指导。
- 面试:面试会提问该领域技术的新方向,工作时需要不断接收新思路的熏陶和培养
- 复现:提升编程能力,模型训练经验以及框架熟悉程度
读哪些论文
- 综述:了解该方向经典的发展历程,帮助补充必要的基础知识,熟悉一些关键算法和技术栈,可以在实践中验证效果;快速找到可落地方案。如:读细粒度综述论文,了解细粒度识别的发展历程和技术方向,比如基于细粒度目标检测,注意力机制等。
- 代表性论文:该领域最关键的技术论文(常用,高频);可以从综述或者其它算法的Related Works中获得,通常有开源代码,帮助快速可靠地落地。如:目标检测框架中的RCNN(代表两阶段网络),Yolo,SSD(代表单阶段网络)。
- 前沿论文:了解该领域的发展方向,科研必备;在工业中采纳新想法,帮助解决积累的问题。如:目标检测最近在发展Anchor Free方向,意义是不需要提前预置锚点框,减少调参,能够从视觉特征出发更好的学习边界框。
论文获取渠道
- 顶会:CVPR, AAAI, ICCV等,尤其是Oral(现场口述,特别精彩)。
- 谷歌学术https://scholar.google.com
- 关注VALSE & Webinar:VALSE,视觉与学习青年学者研讨会,是中国大规模的学术研讨会议,每年举办,讲解各路论文算法和年度进展等;Webinar平时直播视频算法讲解http://valser.org/portal.php?mod=list&catid=6,回放https://www.iqiyi.com/u/2289191062/videos。
- Papers with Codehttps://paperswithcode.com:整理大量论文以及复现或原作者代码;方便一边看论文一边实验。
- 咨询大佬,避免跑偏。
怎么读论文
- Origins:来源有一定的引导性,比如腾讯,阿里,华为的研究院,Google Brains,FAIR等大型研究机构,清华、北大、浙大、中科大、斯坦福、麻省理工,它们的论文是顶尖的,算法思路上有很大创新,易读、易复现,或者有开源代码可以实践。
- Abstract:看主要的创新点是否符合寻找的方向以及是否感兴趣,避免浪费时间;通常会提到创新点以及效果(准确率、AP等)
- Introduction:快速读,主要在复述对比算法的问题,帮助你认识以前的或者正在使用的算法存在什么问题,提出创新点
- Related Work:如果不了解经典的相关算法,可以找出来读;如果已经了解了,可以选择跳过;
- Our Work(重点):主要在对新算法涉及的创新点做详细分析和介绍,通常会包含很多公式和伪代码,看里面的关键词来确定思路,可以尝试复现
- Experiments:积累训练算法的经验,数据准备,怎么调参,如学习率怎么设置,优化器怎么选择,迭代步数是多少等,再看实验结果在哪些指标上领先,确定是否要复现论文。
- 如果能力可以,每天读1到2篇paper,如果基础薄弱,可以限定时间,但是不能太长,比如1周读一篇,不要死抠,要及时询问。
- 如果论文中涉及的数学知识不了解,那就先大概过一遍,主要看论文的理论思路,如果觉得论文很感兴趣,那就回头去查公式。
怎么写论文
- 多读:要想写论文,首先要有一个观点,充分掌握前沿思路,算法目前的发展方向,为什么要往这个方向发展,自己是否要往这个方向做,如果不做,是否有其它方向的创新点;没有完美的算法,只有更优秀的思路,充分总结问题,找出解决方案。
- 多记:边读论文边在旁边注释自己的思考和想法,以及与看过的其他论文思路上的相通性和不同点。
- 多写:参照通用的经典论文格式,把自己做的实验写成一个“paper”;记录实验思路和结果,这会提升写paper的熟练程度和水平。
- 多讨论:与同组或大牛讨论自己的思路和实验方法,总结经验和问题。
学习建议
- 精读经典论文
- 跟进最新论文
- 整理关注论文
- 复现领域论文
- 写作论文
入行准备
- 对AI发展的认识:在AI兴起之前,传统的实现方法也有必要去了解。
- 基本的数学基础:概率论,线性代数,微积分
- 计算机基础算法:不是所有算法都要用神经网络实现的,要结合QPS要求,数据量,稳定性。
- 神经网络基础
- 编程语言基础
- 极大的热情
求职面试
- 简历:论文,比赛,实习,github,项目,涉及的知识点(训练过哪些模型,有没有用到数据增强,模型调优,模型测试,对比实验,有没有上线)。
- 基础知识:基础算法,经典机器学习算法等。
- 面试技巧:自我介绍,面试话术
- 把握内推机会,务必抓好提前批内推时间
未来发展
- CV
人脸识别:挖掘更健壮的算法,扩展适用场景
商品识别:新兴领域,业务场景不断挖掘,落地潜力巨大
服装:电商,博主,设计师等都会用到
设计:设计师,房地产商等,行业属性很强
财务:每个企业都需要财务审核,票据审核,都可以AI化 - NLP
- Data Science
- CV与NLP对比:CV落地场景比较多,发展历史久远,理论知识发展更快,如果想积累实践经验,可以选择CV。