四、音视频机器学习基础

引言

在前一章中，我们对基础音视频的关键技术工具，进行了详细介绍。其中，不少地方需要用到机器学习相关的处理手段。可见结合机器学习尤其是深度学习模型的优秀能力，来强化现有音视频工程的各方面，已逐步成为主流趋势。

因此，需要我们对机器学习这个大类技术族，有初步的认知。

整个机器学习（ML）的发展历程中，总有不一样的想法和更先进（或特色）的方法论被各路探索者们提出来。而深度学习（DL [Deep Learning]）作为机器学习（ML [Machine Learning]）的实现手段之一，最初的概念早在上个世纪就已经被 Hinton、Bengio、LeCun 等学者提出。受到近年来快速增长的计算机算力和大数据云建设，而得以真正落地。

如果回顾机器学习的发展会发现，过程中通常是多条路线方法论并行的。在历史上（现认为 2019 至今属于第三次高峰），前两次小高峰都是伴随着计算机硬件技术的突破，而带来的飞跃性变革。从单层感知器模型（Single-Perception）到多层感知器模型（Multi-Perception）再到深度信念网络（Deep Belief Network），直至今天百花齐放的 DL。整个历史中的每一次迭代，更像是多次多维度的技术积累准备齐全后，才应运而生的。

本章节主要整理说明了，当下机器学习至 2019 年前的发展简史，并阐明了部分算法的必要基础概念。只给出核心原理，不包含理论证明和推导过程。

关键字：机器学习分类、深度学习、激活函数、损失函数、最优化算法、模型结构速览

目录

results matching ""

No results matching ""