四、音视频机器学习基础

引言

在前一章中,我们对基础音视频的关键技术工具,进行了详细介绍。其中,不少地方需要用到机器学习相关的处理手段。可见结合机器学习尤其是深度学习模型的优秀能力,来强化现有音视频工程的各方面,已逐步成为主流趋势。

因此,需要我们对机器学习这个大类技术族,有初步的认知。

整个机器学习(ML)的发展历程中,总有不一样的想法和更先进(或特色)的方法论被各路探索者们提出来。而深度学习(DL [Deep Learning])作为机器学习(ML [Machine Learning])的实现手段之一,最初的概念早在上个世纪就已经被 Hinton、Bengio、LeCun 等学者提出。受到近年来快速增长的计算机算力和大数据云建设,而得以真正落地。

如果回顾机器学习的发展会发现,过程中通常是多条路线方法论并行的。在历史上(现认为 2019 至今属于第三次高峰),前两次小高峰都是伴随着计算机硬件技术的突破,而带来的飞跃性变革。从单层感知器模型(Single-Perception)到多层感知器模型(Multi-Perception)再到深度信念网络(Deep Belief Network),直至今天百花齐放的 DL。整个历史中的每一次迭代,更像是多次多维度的技术积累准备齐全后,才应运而生的。

本章节主要整理说明了,当下机器学习至 2019 年前的发展简史,并阐明了部分算法的必要基础概念。只给出核心原理,不包含理论证明和推导过程。

关键字:机器学习分类、深度学习、激活函数、损失函数、最优化算法、模型结构速览

目录

Copyright © Since 2021 李述博 (Arikan.Li) , All Rights Reserved all right reserved,powered by GitbookLast Updated: 2024-03-22 18:02:17

results matching ""

    No results matching ""