开始机器学习知识的学习,差不多已经有一年的时间。这期间看了很多教材和书籍,有些深入进行了学习,有些书(比如深度学习领域著名的西瓜书)则看不下去。机器学习其实也有许多方向,比如强化学习、计算机视觉、自然语言处理等等,如果每个方向都学习的话,普通人也没有那么多精力。
在经过一年的泛泛的学习之后,决定将计算机视觉作为我的主攻方向,主要也是因为我对计算机图像这个领域比较感兴趣。在网上搜索了一些资料,以及推荐书单后,决定选择《Deep Learning for Computer Vision with Python》作为认真研读的一本书,目前已经差不多看完了第一部: Starter Bundle,觉得非常不错,推荐给有志于从事计算机视觉方向的朋友。
首先需要说明的是,这本书目前还没有中文版,好在作者没有使用生僻的词汇,用词遣句也比较简练,配合着Google翻译,读起来还算顺利。在公众号后台回复“计算机视觉”可以下载本书的电子版。
由计算机视觉专家Adrian Rosebrock编写的《Deep Learning for Computer Vision with Python》被评为当前最好的深度学习和计算机视觉资源之一。Google 的 AI 研究员和 Keras 库的作者Francois Chollet对于本书做出过这样的评价:
这本书分为三个bundle:
Starter Bundle - 这部分的内容比较基础,包括从零开始实现回归算法、深度神经网络和卷积神经网络。对于完全没有机器学习基础的人而言,可以从实例中学习到深度学习的基础知识。如果有一定的深度学习知识背景,也可以学习到在实际中如果应用深度学习(主要是图像分类),加深对深度学习的理解。
Practition Bundle - 这部分的内容在Starter Bundle基础上更进一步,探讨的是在实际中可能会碰到的问题及解决之道,比如提高识别的精度、模型选择、超大数据集,最后引入了几个大型的、复杂的网络模型。
ImageNet Bundle - 这部分更多的关注于实战,前半部分是在ImageNet数据集上训练各种复杂的网络,后半部分则是解决实际生活中的问题,包括表情检测、车辆识别、年龄预测等等。完成这部分的学习之后,想必你的实战能力会提高一大截。
如果你对在计算机视觉(图像分类、对象检测、图像理解等)中应用深度学习有兴趣,那这本书再好不过了。
在这本书中,你将能够:
- 理论和实践并重地学习机器学习和深度学习的基础内容
- 学习先进的深度学习技术,包括对象检测、多GPU训练、迁移学习以及生成对抗网络等
- 复现最前沿的论文成果,包括ResNet、 SqueezeNet、 VGGNet以及其他存在于 ImageNet 数据集中的成果
这本书最吸引我的地方在于,书籍兼顾了理论和实践两者之间的平衡,对每一个深度学习理论,都会有一个关联的Python实现来帮助你巩固对其的理解和学到的知识。书中有详细的代码,且代码都有比较详细的说明,对Engineer非常友好。
我在学习的过程中,都会尝试着输入代码,加深对代码的理解。你可以访问:https://github.com/mogoweb/aiexamples获得我的代码。
在公众号后台回复“计算机视觉”可以下载本书的电子版。