2006 年,Geoffrey E. Hinton 等人发表了一篇论文(),展示了如何训练能够以最高的精度(98%)来识别手写数字的深度神经网络。他们将这种技术称为“深度学习”。深度神经网络是我们大脑皮层的(非常)简化的模型,由一堆人工神经元层组成。当时一致认为训练深度神经网络是不可能的注,并且大多数研究人员在 20 世纪 90 年代后期放弃了这种想法。这篇论文重新激发了科学界的兴趣,不久之后许多新论文证明深度学习不仅是可能的,而且取得了令人振奋的成就, 这是其他机器学习(Machine Learning ,ML) 技术没办法企及的(借助于巨大的计算能力和大量的数据)。这种热情很快扩展到机器学习的许多其他领域。
十年后,机器学习征服了整个工业界,如今它已成为高科技产品的核心,为你的网 络搜索出来的结果排名,为智能手机的语音识别提供支持,推荐视频,甚至有可能驾驶你的 汽车。
或者你的公司可能拥有大量数据(用户日志、财务数据、生产数据、机器传感器数 据、热线统计数据、人力资源报告等),如果你知道去哪里查找,你非常有可能会挖掘出一些隐藏的宝藏。通过机器学习,你能够实现以下甚至更多任务():
无论出于何种原因,你已经决定学习机器学习并将它应用到你的项目中。好主意!
随着一系列的技术突破,深度学习推动了整个机器学习领域的发展。现在,即使是对这项技术几乎一无所知的程序员,也能够正常的使用简单有效的工具来实现能够从数据中学习的程序。这本畅销书通过具体的示例、简单的理论和可用于生产环境的Python框架(Scikit-Learn、Keras和TensorFlow)来帮助你直观地理解并掌握构建智能系统所需要的概念和工具。
在本书中,你会学到一系列能够迅速使用的技术,从简单的线性回归到深度神经网络。全书中大量的代码示例和练习帮助你学以致用。你只需具备编程经验即可入门。
深入研究神经网络架构,包括卷积网络、循环网络、生成对抗网络、自动编码器、扩散模型和转换器。
使用TensorFlow和Keras构建和训练用于计算机视觉、自然语言处理、生成模型和深度强化学习的神经网络。
本书分为两大部分:第一部分主要基于Scikit-Learn,介绍机器学习的基础算法;第二部分则使用TensorFlow和Keras,介绍神经网络与深度学习。此外,附录部分的内容也很丰富,包括课后练习题解答、机器学习项目清单、SVM对偶问题、自动微分和特殊数据结构等。书中内容广博,覆盖了机器学习的所有的领域,不仅介绍了传统的机器学习模型,包括支持向量机、决策树、随机森林和集成方法,还提供了使用Scikit-Learn进行机器学习的端到端训练示例。作者尤其对深度神经网络进行了深入的探讨,包括各种神经网络架构、强化学习,以及怎么样去使用TensorFlow/Keras库来构建和训练神经网络。本书兼顾理论与实战,既适合在校学生,又适合有经验的工程师。
最常见的学习算法:线性和多项式回归、逻辑回归、k 最近邻、支持向量机、决 策树、随机森林和集成方法
最重要的神经网络架构:用于表格数据的前馈神经网络,用于计算机视觉的卷积网络,用于处理序列的循环网络和长短期记忆网络(Long Short-Term Memory, LSTM)、用于自然语言处理(以及更多方面)的编码器 - 解码器和 Transformer, 以及用于生成学习的 自动编码器、生成对抗网络(Generative Adversarial Network, GAN)和扩散模型
如何使用强化学习构建能够最终靠反复实验学习好的策略的智能体(例如游戏中 的机器人)
注意:不要仓促地跳入深水区:虽然深度学习无疑是机器学习中非常令人兴奋 的领域,但你应该首先掌握基础知识。此外,大多数问题都能够正常的使用 更简单的技术来很好地解决,例如随机森林和集成方法(在第一部分讨 论)。深度学习最适合解决图像识别、语音识别或自然语言处理等复杂问 题,它需要大量数据、计算能力和耐心(除非你可通过预训练的神经 网络,正如你将会看到的那样)。
所有代码都已更新为最新的库版本。特别是,第3版为Scikit-Learn 引人了许多新功能(例如,特征名称的跟踪、基于直方图的梯度提升、 标签传播等),还介绍了用于超参数调整的Keras Tuner 库、用于自然语言处理的 Hugging Face的Transforer库,以及Keras 的新的预处理和数据增强层。
第15章现在分析芝加哥公共汽车和铁路乘客数据而不是生成的时间序列,并介绍ARMA模型及其变体。
为了适应所有新内容,一些内容已移至网上,包括安装说明、内核主成分分析(Principa Component Analysis,PCA)、贝叶斯高斯混合的数学细节、TF Agents和以前的附录A(练习题答案)、附录C(支持向量机数学)和附录E(额外的神经网络架构)。
Aurélien Géron是机器学习方面的顾问。他曾就职于Google,在2013年到2016年领导过YouTube视频分类团队。他是Wifirst公司(法国领先的无线互联网服务供应商)的创始人,并于2002年至2012年担任该公司的首席技术官。2001年,他创办Ployconseil公司(一家电信咨询公司),并任首席技术官。
今天我们将这本书赠送给新老读者,想要的朋友只需要在后台输入关键词“机器学习实战(第三版)”即可参与抽奖!幸运的朋友将会获得这本书!