三、音视频常用基础算法
引言
音视频中最为重要的组成部分,即是音频处理和视频处理。
音频处理应用到的基础理论,来源自:数字信号处理(Digital Signal Process)、数字合成音效(Digital Audio Effects)、语音识别(Voice Recognition)等领域。视频处理应用到的基础理论,来源自:数字信号处理(Digital Signal Process)、计算机图形学(Computer Graphics)、计算机视觉(Computer Vision)等领域。
这些学科在工程中或多或少的交叉使用,甚至本身大都为交叉学科,但最为核心的始终只有两个,即数字信号处理(DSP)和计算机图形学(CG)。所以,在正式开始学习音视频工程技术之前,首先需要回顾部分基础算法的工程特征。
本章节主要对此简单梳理,并结合伪码和 C/C++/Python/GLSL等 工程汇总说明。可以做为最小集合的背景算法知识字典,供开发过程中查阅回顾使用。
关键字:傅立叶变换、滤波算法、区域检测、光流补正、冗余控制