FastMNMF及改进
FastMNMF及改进
FastMNMF
FastMNMF是一种基于矩阵联合对角化的MNMF的加速算法;后者在前一篇笔记中已经简略描述,是一种对NMF在音频应用上的多通道扩展。
MNMF
回顾MNMF的音频建模,MNMF认为一个音源\(s_{jfn}\)由多个表现为复高斯分布的成分\(c_{kfn}\)组成。
\[
s_{j f n}=\sum_{k \in \mathcal{K}_j} c_{k f n} \quad \text { avec } c_{k
f n} \sim \mathcal{N}_{\mathbb{C}}\left(0, w_{f k} h_{k n}\right)
\]
这些成分相互独立,因此源被定义为:
\[
s_{j f n} \sim \mathcal{N}_{\mathbb{C}}\left(0, \sum_{k \in
\mathcal{K}_j} w_{f k} h_{k n}\right)
\]
被观测信号被定义为源的线性组合:
\[
x_{ifn}=\mathcal{N}_{\mathbb{C}}\left ...
波束形成
波束形成
空间协方差矩阵 SCM
在多麦克风语音处理里,我们把每一个频点 \(f\) 上、在同一时刻 \(t\) 采集到的 \(\mathbf{M}\) 路复数
STFT系列表示为一个列向量:
\[
\mathbf{y}(t, f)=\left[\begin{array}{c}
Y_1(t, f) \\
Y_2(t, f) \\
\vdots \\
Y_M(t, f)
\end{array}\right] \in \mathbb{C}^{M \times 1}
\]
其空间协方差矩阵SCM定义为:
\[
\mathbf{\Phi}(f)=\mathbb{E}\left[\mathbf{y}(t, f) \mathbf{y}(t,
f)^{\mathrm{H}}\right] \in \mathbb{C}^{M \times M}
\]
有时也需要每一帧的局部SCM:
\[
\hat{\boldsymbol{\Phi}}_y(t, f)=\frac{1}{2 w+1}
\sum_{t^{\prime}=t-w}^{t+w} \mathbf{y} ...
从北京的四种毒蛇开始
从北京的四种毒蛇开始
众所周知,北京目前确认的毒蛇四种,分别是短尾蝮,华北蝮,西伯利亚蝮和虎斑颈槽蛇。前三种都属于蝰科亚洲蝮属;而虎斑颈槽蛇属于游蛇科剑蛇属。
关于文中的数据,原本先了解一下,但过于复杂以至于放弃了,所以没有标记注射类型(实际上是开始查的时候不知道存在多种类型,而又不想再确认)。
短尾蝮 Gloydius brevicaudus
似乎是北京分布最广的毒蛇,出现在低海拔的山区。据说,它分布的海拔上限为1100m。成年短尾蝮的体长一般在60-70cm,有一个快速缩短的尾端,尾部可能呈现粉红色。
短尾蝮似乎是一种伏击型猎手,会在草丛中蹲一天守株待兔。但它遭遇威胁时,会首先发出警告信号。它会将身体盘成S形,头部抬高,颈部膨胀,同时发出“嘶嘶”的声音,试图吓退攻击者。但这一点可能跟一般印象中的蛇的体弯行为(Body-bending
behaviour, BBB)不同\(^{[1]}\)(下图为乌苏里蝮,并非短尾蝮):
在春秋季节,短尾蝮主要为昼行性,而炎热的夏季则转为夜行性。据说,炎热的夏季,短尾蝮喜欢在凉爽的黄昏到夜间从石缝里爬出来活动\(^{[2 ...
NMF及语音分离
NMF及语音分离
这一部分在之前的笔记中曾经有过讨论,在这里重新整理,补充缺失的内容。
非负矩阵分解 NMF基本原理
数据通常表示为矩阵形式:
字典学习,低秩近似,因子分析,潜在语义分析等方法,通常会将/将矩阵分解为字典矩阵和行为矩阵的乘积,以实现降维,拆分(源分离),插值等工作。
非负矩阵分解要求:
数据 \(V\) 以及因子 \(W,H\) 具有非负的值。
因子 \(W\)
的非负性确保了字典的可解释性,因为模式 \(w_k\) 和样本 \(v_n\) 属于相同的空间。
因子 \(H\)
的非负性倾向于生成基于局部特征的表示,因为禁止使用减法组合。
具体来说,给定一个\(F\times
N\)的非负矩阵\(V\),寻求分解:
\[
V \simeq WH
\]
其中,\(W \in \mathbb{R}_{+}^{F \times K},
H \in \mathbb{R}_{+}^{K \times N}\)。选择\(FK+KN\ll FN\),以实现降维的目的。
NMF的优化
\(W\)和\ ...
Kalman滤波:线性卡尔曼滤波,扩展卡尔曼滤波,无迹卡尔曼滤波
Kalman滤波:线性卡尔曼滤波,扩展卡尔曼滤波,无迹卡尔曼滤波
部分公式为使用标准写法。
Introduction
滤波是在对系统可观测信号进⾏测量的基础上,根据⼀定的滤波准则,采⽤某种统计量最优⽅法,对系统的状态进⾏估计的理论和⽅法。讲点的滤波理论包括维纳(Wiener)滤波和卡尔曼(Kalman)滤波。前者使用频域方法,后者使用时域状态空间方法。
相比于Wiener滤波方法,Kalman滤波只基于时域中的量,不仅可以对平稳的一维随机过程进行估计,也可以对非平稳的、多维随机过程进行估计,同时Kalman滤波算法是递推的,便于在计算机上实现实时应用。
最早Kalman提出的滤波理论只适用于线性系统,此后研究者将其扩展到非线性系统下。其中扩展Kalman滤波(EKF)将非线性系统一阶线性化,再利用Kalman滤波。其问题在于线性化过程中产生的误差。无迹Kalman滤波(UKF)以UT变换处理均值和协方差的非线性传递,计算经济较高。除此之外,为了提升计算效率,平方根滤波和UD分解滤波也逐渐被提出。,
线性Kalman滤波
射影定理
由\(m\times ...
空洞卷积,多尺度特征融合,大核卷积
空洞卷积,多尺度特征融合,大核卷积
空洞卷积和空洞空间金字塔池化(ASPP)
空洞卷积
第一项系统使用空洞卷积的工作可能是Fisher
Yu在2016年的工作。作者使用这种卷积处理图像分割任务。在文献中,作者将其称为膨胀卷积dilated
convolution,与本文中使用的空洞卷积atrous
convolution同义。后者名称来源于法语的à trous.
相比于一般的卷积,作者强调了其能够扩大感受野的同时不损失分辨率和覆盖的能力。
在数学上,如果将一般的卷积协作:
\[
(F * k)(\mathbf{p})=\sum_{\mathbf{s}+\mathbf{t}=\mathbf{p}}
F(\mathbf{s}) k(\mathbf{t}) .
\]
则空洞卷积可以被写作:
\[
\left(F *_l k\right)(\mathbf{p})=\sum_{\mathbf{s}+l
\mathbf{t}=\mathbf{p}} F(\mathbf{s}) k(\mathbf{t}) .
\]
其中\(l\)被称作空洞率 dilati ...
电子系统课程报告
电子系统课程报告
report_fr
放大器
在本节中,我们的总体目标是设计一个音频放大器。技术规格如下:
- 输入信号 \(v_e(t)\)
为音频信号,带宽在 \(20\,\mathrm{Hz}\)
到 \(20\,\mathrm{kHz}\) 之间;
- 电路输入电阻 \(R_e =
100\,\mathrm{k\Omega}\);
- 负载为阻抗 \(R_L = 4\,\Omega\)
的扬声器;
- 当输入信号为 \(100\,\mathrm{mV}\)
时,输出功率应为 \(20\,\mathrm{W}\);
- 电源为对称电源,电压为 \(V = \pm
15\,\mathrm{V}\)。
在本报告中,首先阐明将运算放大器与 B
类功率放大器结合的方案局限性,然后介绍运算放大器与 AB
类功率放大器结合的方案,后者基本满足要求。这对应原题第2和第3部分,将讨论若干方案变体。
方案2:运算放大器 + B
类功率放大器
我们构建了如上电路,其中运算放大器被替换为 AD820。
随后进行仿真,测量输入电压、运算放大器输出 ...
锁相环 Phase Locked Loop, PLL
锁相环 Phase Locked Loop, PLL
简介
锁相环(Phase Locked Loop,PLL)是一种用于同步信号的电子电路。
它可以将输入信号的相位与参考信号的相位进行比较,并通过反馈控制来调整输出信号的频率和相位,使其与参考信号保持一致。
原理
锁相环一般由一个相位比较器,一个低通绿农其和一个由电压控制的振荡器(VCO)组成。
正弦信号 正弦信号的一般形式为:\(v(t)=V \sin (\phi(t))\)
频率固定时,信号可以写做:\(v(t)=V \sin
\left(\omega_0 t+\varphi\right)\)
如果信号频率可能随时间变化,信号可以写做:\(v(t)=V \sin \left[\left(\omega_0+2 \pi f(t)\right)
t\right]\) 对于两个频率不变,如果他们的\(\omega_0\)相等,则有它们的相位差为常数。
\[
\phi(t)=\phi_1(t)-\phi_1(t)=\left(\omega_0
t+\varphi_1\right)+\left(\om ...
Génération de signaux 信号发生器
Génération de signaux
信号发生器
简介
信号发生器(Générateur de
signal)是一种能够自主产生特定电压波形(如正弦波、方波、锯齿波等)的电路,其核心工作原理基于振荡器(Oscillateur)。
一个完整的振荡系统(Système
oscillant由两个关键组件构成:
主动元件(Élément
actif):提供能量的源头,如晶体管或运算放大器,用于放大或补偿能量损耗。
被动反应元件(Élément passif
réactif):通常由电感(L)、电容(C)或电阻(R)组成,用于储存和释放能量,控制频率特性。
这两者之间形成能量的转移和反应,从而维持持续的振荡。
两类常见的振荡器:
线性振荡器(Oscillateurs
linéaires/sinusoïdaux):如RC、LC或石英振荡器,产生的是连续波形(例如正弦波)。
弛张振荡器(Oscillateurs à
relaxation):例如施密特触发器或多谐振荡器,输出的是非连续的波形(例如方波、锯齿波),原理是能量储存与突释放的循环
...
filtre 滤波器
filtre 滤波器
概述
滤波器用以选择性地通过或阻止信号的频率成分,以及删除信号中的噪声。
按照频率响应特性,滤波器可分为低通(Filtre passe-bas)、高通(Filtre
passe-haut)、带通(Filtre passe-bande)和带阻(Filtre
coupe-bande)滤波器。
按照不同的技术,可分为电子滤波器和机械与物理滤波器。
> 图为表面声波滤波器(SAW
Filter)。当一个射频信号加在左侧交指电极上时,会激励出沿压电材料表面传播的表面声波。表面声波在材料表面传播的波长满足公式\(\lambda =
c/f\)。由于电极之间的间距固定(决定了某一波长),只有特定频率的声波能有效激发与接收,因此实现了对信号频率的窄带选择性滤波。不符合频率条件的信号将不会有效传播或被转换,从而被抑制。
理想滤波器是指不引起信号失真的滤波器,其作用仅是放大或延迟信号,而不改变信号的频谱结构。
理想滤波器在现实中不存在!
滤波器的传递函数
在频域上,滤波器的传递函数\(H(f)\)是输入信号\(X(f)\)和输出信号\(Y( ...