夸下海口!暑假自学量子场论!
虽然是用纸笔更顺手,但是在网上发出来感觉会能坚持更长时间?(没有的事之前多次实践已经证明了这点了)新借口:web随时可以翻看!(但是这种东西有什么翻看的必要吗网上的wiki不是更方便查)
大概是跟着王正行的『简明量子场论』来的,同时也参考了佟大为(x)的量子场论讲义,也有在看Peskin的大厚本就是了。
这里的内容大概是三种场的正则量子化,路径积分之后的内容请见Part2了。(为什么要这样做的因为这里太长了编辑和渲染都太麻烦了所以后面内容新开一个)
先放一个平直空间的度规在这里:(注意符号规则喵)
$$ g_{\mu \nu}=diag(1,-1,-1,-1) $$
据说可能会用到的群论知识
SO(N)群:特殊正交(Special Orthogonal)——保持实空间矢量长度不变。$O^T O = I$。转动群可以用正交座标系下的行列式为1的NxN正交矩阵来表示。
SU(N)群:特殊幺正(Special Unitary)——保持复空间矢量长度不变 $\psi \to e^{iU} \psi , \ U^\dagger U = I$
以上的“特殊”表示行列式为1,保证变换后仍为右手系。
(额啊typecho居然没做内联latex公式的支持居然还要用插件,头疼(没错我就是喜欢用MathJax,尽管它js脚本大渲染慢不可复制但我依然爱它(x))(KaTeX?真不熟))
从粒子到场
先来复习一下粒子体系的作用量原理。根据体系的自由度,我们可以选取若干广义坐标$q_1 ... q_i$,并结合广义坐标的时间导数$\dot q_1 ... \dot q_i$构造标量实函数拉格朗日量$L(q,\dot q)$.作用量$S=\int_{t_1}^{t_2}Ldt$为洛伦兹标量,在坐标变换下保持不变。根据作用量原理可以得到体系的运动方程,即欧拉-拉格朗日方程$\frac{d}{dt}\frac{dL}{d\dot q_i}-\frac{dL}{d q_i}=0$。
而从有限个自由度的分立粒子体系到无限个自由度的连续分布的场,上面这些东西该如何变形呢?在上面我们用坐标来描述粒子,那对于场,我们好像就只有场量了。把场量$\phi(x^\mu)$看作是系统的正则坐标,时空坐标$x^\mu$则是系统不同自由度的指标。系统的拉格朗日密度$\mathcal{L}(\phi , \partial_\mu \phi)$则是场量和其时空微分的函数。
于是作用量为$S=\int d^4 x \mathcal{L}(\phi,\partial_\mu \phi)$。
下面再来仔细看看作用量的变分。设坐标的改变$x^\mu \to x'^\mu=x^\mu + \delta x^\mu$,将此视为坐标变换,于是体元的变化可以用雅各比行列式来描述:$d^4 x \to d^4 x'=d^4x J$,其中$J$为雅各比行列式$J=\frac{\partial x'}{\partial x}=det(g^\mu_\nu + \partial_\nu \delta x^\mu)=1+\partial_\mu \delta x^\mu$
于是可以得到作用量的变分为(注:下面推导中,$\bar \delta \phi = \phi'(x)-\phi(x), \delta \phi = \phi'(x')-\phi(x)$)
$$ \begin{aligned} \delta S & = S'(x')-S(x) \\ & = \int \mathcal{L}'(x')d^4 x' - \int \mathcal{L}(x)d^4 x \\ & = \int [J(\mathcal{L}'(x')-\mathcal{L}'(x))+\mathcal{L}'(x)J-\mathcal{L}(x)] d^4x \\ & = \int (\partial_\mu \mathcal{L}\delta x^\mu + \mathcal{L} \partial_\mu \delta x^\mu+\frac{\partial \mathcal{L}}{\partial \phi}\bar \delta \phi + \frac{\partial \mathcal{L}}{\partial \partial_\mu \phi}\partial_\mu \bar \delta \phi)d^4 x \\ & = \int \left [\partial_\mu (\mathcal{L}\delta x^\mu + \frac{\partial \mathcal{L}}{\partial \partial_\mu \phi} \bar \delta \phi)+(\frac{\partial \mathcal{L}}{\partial \phi} -\partial_\mu \frac{\partial \mathcal{L}}{\partial \partial_\mu \phi})\bar \delta \phi \right ] d^4 x \end{aligned} $$
上式中的两项,分别对应着场的欧拉-拉格朗日方程和Noether定理。欧拉-拉格朗日方程$\frac{\partial \mathcal{L}}{\partial \phi} -\partial_\mu \frac{\partial \mathcal{L}}{\partial \partial_\mu \phi} = 0$不再赘述。下面我们来看看Noether定理。
在上式中,场发生的连续变换$\phi(x) \to \phi'(x')$除了要满足欧拉-拉格朗日方程外,若要使作用量不变,则存在一个与此变换对应的守恒流$j^\mu = \mathcal{L}\delta x^\mu + \frac{\partial \mathcal{L}}{\partial \partial_\mu \phi} \bar \delta \phi$,满足$\partial_\mu j^\mu = 0$。此即Noether定理。
将$\partial_\mu j^\mu = 0$对全空间积分,于是有$\int d^3x \partial_\mu j^\mu = 0 \Rightarrow \int d^3 x \frac{\partial}{\partial t}j^0 + \int d^3 x \nabla \vdot \vec{j} = 0$,“物理地”认为流在无穷远处为0,于是有$\int d^3 x \frac{\partial}{\partial t}j^0 = 0$。令$Q=\int d^3x j^0$,则有$\frac{\mathrm{d}}{\mathrm{d} t}Q=0$,即Q为守恒量。
再补充些关于能动量张量的事情。若我们考虑一个空间平移$x^\mu \to x^\mu-\epsilon^\mu$,场的变化有$\phi(x) \to \phi (x) + \epsilon^\mu \partial_\mu \phi(x)$(注意这里的符号,是由于此处为主动变换而非坐标变换(被动变换)),同样的拉格朗日密度的变化为$\mathcal L \to \mathcal L + \epsilon^\mu \partial_\mu \mathcal L$,于是$j^\mu = \left( \frac{\partial \mathcal{L}}{\partial \partial_\mu \phi} \partial_\nu \phi - \mathcal{L} g^\mu_\nu \right ) \epsilon^\nu \equiv \mathcal T^{\mu\nu}\epsilon_\nu$,我们可以这样构造出一个
$$ \mathcal T^{\mu\nu}=\frac{\partial \mathcal{L}}{\partial \partial_\mu \phi} \partial^\nu \phi - \mathcal{L} g^{\mu\nu} $$
称为能动量张量密度(从这里可以看出,能动量密度本质是时空平移变换下的守恒流,说明着时空平移下的能动量守恒)
好了,场论大致的理论基础就已经构建完了。可以发现,上面所有的东西都离不开拉格朗日量/密度,所以现在问题的关键就转变为:如何构造拉格朗日密度。
作为算符的场及广义动量
如上节所言,在场论中,我们将场量$\phi$视为广义坐标。在量子力学中,我们将坐标和动量视为算符,他们满足相应的对易关系。于是对应的,在量子场论中,很自然的,场量$\phi$和广义动量$\pi$则为算符,他们也将满足相应的对易关系。
标量场
实标量场
现在,我们来考虑一个简单的描述自由粒子的标量场。
拉氏密度与Klein-Gordon方程
拉格朗日密度为
$$ \mathcal{L}=\frac{1}{2}(\partial^\mu\phi\partial_\mu\phi-m^2 \phi^2) $$
通过欧拉-拉格朗日方程可以推得
$$ (\partial^2+m^2)\phi=0 $$
这个方程被称为Klein-Gordon方程。
该方程有平面波解
$$ \psi_\boldsymbol{k}(x,t)=\frac{1}{\sqrt{(2\pi)^32\omega}}e^{-i(\omega t-\boldsymbol{k}\vdot\boldsymbol{x})} $$
其中$\omega=\sqrt{\boldsymbol{k}^2+m^2}$。具有正交归一关系$\int d^3x~ \psi_\boldsymbol{k} i \overleftrightarrow{\partial_0} \psi_\boldsymbol{k'} = 0,~ \int d^3x~ \psi_\boldsymbol{k}^* i \overleftrightarrow{\partial_0} \psi_\boldsymbol{k'} = \delta(\boldsymbol{k}-\boldsymbol{k'})$
正则量子化
根据拉格朗日密度可以算出场的正则动量$\pi=\frac{\partial \mathcal{L}}{\partial \dot \phi}=\dot \phi$。于是场的哈密顿密度为$\mathcal{H}=\pi\dot\phi-\mathcal{L}=\frac{1}{2}\left [ \dot \phi^2+(\nabla \phi)^2+m^2\phi^2\right ]$
根据量子力学的正则量子化流程,有正则对易关系
$$ \left [ \phi(\boldsymbol{x},t), \phi(\boldsymbol{x'},t) \right ]=0,\left [ \pi(\boldsymbol{x},t), \pi(\boldsymbol{x'},t) \right ]=0,\left [ \phi(\boldsymbol{x},t), \pi(\boldsymbol{x'},t) \right ]=i\delta(\boldsymbol{x}-\boldsymbol{x'}) $$
由于其均在时刻t下,上述关系也叫等时对易关系。这里的对易关系不是相对论协变的。
Klein-Gordon方程的解可以用平面波展开,
$$ \phi(x,t)=\int d^3k \left [ a_k \psi_k(x) + a_k^\dagger \psi_k^* \right ] $$
式中$a_k$是正频项,式中$a_k^\dagger $是负频项,对应着场在动量空间的算符。
$$ \begin{aligned} a_k = \int d^3x\ \psi_k^* i \overleftrightarrow{\partial_0} \phi \\ a_k^\dagger = \int d^3x\ \phi i \overleftrightarrow{\partial_0} \psi_k \end{aligned} $$
利用展开式和平面波解函数组的正交归一关系容易验证。
他们具有对易关系$\left [ a_\boldsymbol{k}, a_\boldsymbol{k'} \right ]=0,\left [ a_\boldsymbol{k}^\dagger, a_\boldsymbol{k'}^\dagger \right ]=0,\left [ a_\boldsymbol{k}, a_\boldsymbol{k'}^\dagger \right ]=\delta(\boldsymbol{k}-\boldsymbol{k'})$
协变对易关系与因果论
现在我们来看一下这样定义的函数$[\psi(x),\psi(x')]=i\Delta(x-x')$,根据$a_k$的对易关系,容易得到
$$ \Delta(x-x')=-i\int \frac{d^3k}{(2\pi)^3 2\omega} \left (e^{-ik(x-x')}-e^{ik(x-x')} \right ) $$
注意到$\int \frac{d^3k}{ 2\omega}=\int {d^4k}\delta(k_0^2-m^2-k^2)$是洛伦兹协变的,即$\Delta(x-x')$是洛伦兹协变的,以上关系则被称为协变对易关系。
根据表达式,容易验证等时情况下$\Delta(\boldsymbol{x},0)=0$,由于洛伦兹协变性对于类空间隔也有$\Delta(x-x')=0,\ (x-x')<0$(注意度规)。这似乎说明场是一个局域的作用,A遵循因果论,在光锥外对易式的C数为0。
箱归一化
前面构造$a_k$算符时用的是连续谱展开,$a_k$为对场函数傅立叶变换的系数函数。而当场被限制在一定区域,满足周期性边界条件时,k的取值便应离散化。类似于量子力学中的箱归一化。
由于周期性边界条件的限制,k空间的体元为$\frac{(2\pi)^3}{V}$,积分变为求和$\int d^3k \to \sum_k \frac{(2\pi)^3}V$,k的取值被限定在$\frac{2\pi}L (n,m,l)$。同样的,$\delta$函数也要变为克罗内克符号$\delta(k-k') \to \frac V{(2\pi)^3} \delta_{kk'}$。(需要注意的是$\delta$函数和克罗内克符号$\delta_{kk'}$的区别,不能简单将$\delta(k-k')$理解为$\delta_{kk'}$)
于是KG方程解的展开式写为
$$ \phi(x,t)=\sum_k \sqrt \frac{(2\pi)^3}V \left [ a_k \psi_k(x) + a_k^\dagger \psi_k^* \right ] $$
注意这里因子的变化,是因为使得现在的对易关系写为$\left [ a_\boldsymbol{k}, a_\boldsymbol{k'}^\dagger \right ]=\delta_{\boldsymbol{k}\boldsymbol{k'}}$
粒子数表象与粒子性
这里我们在箱归一化的情况下讨论。(由于在连续谱的动量空间,由于delta函数的性质,我们只能说在某个动量附近积分为1,而不能说粒子的动量是某个确定值。而在箱归一化的情况下,动量取分立值,我们可以很轻松的说在某个动量上有一个粒子)
定义算符$N_k=a_k^\dagger a_k$,有本征方程$$N_k\ket{n_k}=n_k\ket{n_k}$$。根据$a_k$的对易关系,有
$$ [N_k,a_k^\dagger]=a_k^\dagger $$
于是
$$ N_k a_k^\dagger \ket{n_k}=(n_k+1)a_k^\dagger \ket{n_k} $$
即$a_k^\dagger \ket{n_k}$也是算符$N_k$的本征态,$a_k^\dagger\ket{n_k}=C\ket{n_k+1}$。对于归一化的本征态,有$C^*C=\bra{n_k}a_k a_k^\dagger\ket{n_k}=\bra{n_k}(1+N_k)\ket{n_k}=n_k+1$,规定C为正实数,于是$C=\sqrt{1+n_k}$。对$a_k$也进行同样的流程,于是我们能得到
$$ \begin{aligned} a_k^\dagger\ket{n_k} &=\sqrt{1+n_k} \ket{n_k+1} \\ a_k\ket{n_k}&=\sqrt{n_k} \ket{n_k-1} \end{aligned} $$
这就是说,$a_k^\dagger$是产生算符,作用到$N_k$的本征态上使本征值增加1;$a_k$是湮灭算符,作用到$N_k$的本征态上使本征值减少1。本征值$n_k$的意义为动量为k的状态上的粒子数。
从上面还可以得到$a_k\ket{0}=0$,说明本征值的取值是有下限0的。这一结论也可以通过$n_k=\bra{n_k}N_k\ket{n_k}=\abs{a_k \ket{n_k}}^2 \ge 0$说明。这就说明粒子数一定是大于0的,不存在负数的粒子数。
接着来看看场的动量和能量。利用Noether定理,有场的能动量张量密度为$\mathcal T^{\mu\nu}=\frac{\partial \mathcal{L}}{\partial \partial^\mu \phi} \partial_\nu \phi - \mathcal{L} g^{\mu\nu}$,则守恒量$P^\mu=\int d^3x \mathcal T^{0\mu}=\int d^3x \mathcal{P}^{0\mu}=\int d^3x \left( \frac{\partial \mathcal{L}}{\partial \partial^0 \phi} \partial_\mu \phi - \mathcal{L} g^{0\mu}\right)$,于是$\mathcal{P}^0=T^{00}=\dot \phi^2-\mathcal{L}=\mathcal H$
即守恒量密度的第0项即为场的哈密顿密度。其实守恒量$P^\mu$即为场的四动量。
对于$\mu=0$,
$$ \begin{aligned} P^0 & = \int d^3x \mathcal{H} \\ & = \int \frac{d^3x}{2}(\dot \phi^2+(\nabla\phi)^2+m^2\phi^2) \\ & = \int \frac{d^3x}{2}(\dot \phi^2+ \nabla\vdot\phi(\nabla\phi) -\phi\nabla^2\phi+ m^2\phi^2) \\ & = \int \frac{d^3x}{2}(\dot \phi^2-\phi\ddot{\phi}) \end{aligned} $$
对于$\mu\neq0$,
$$ P^i=\int d^3x~(\partial_0\phi\partial^i\phi) $$
通过计算可得到四动量算符为
$$ P^\mu=\sum_k \frac{k^\mu}{2} (a_k^\dagger a_k + a_k a_k^\dagger)=\sum_k~ k^\mu (N_k+\frac{1}{2}) $$
上面的结果说明了,场的能量和动量是量子化的,每份能动量为$k^\mu$,且这一份份的能动量与粒子数$n_k$对应。根据$\omega=\sqrt{k^2+m^2}$,结合质能方程,可以看出最开始拉格朗日密度中的参数m之物理意义即为粒子质量。
真空零点能与宇宙学常数
上面我们得到的四动量算符中,1/2项实在令人在意。对于$n_k=0$的真空态$\ket 0$,其能量为$E_0=\bra{0}P^0\ket 0=\int d^3 k \frac{\omega(k)}{2}$,显然这项是发散的。当然这里我们是对全空间积分了,得到无穷大的能量也不意外。那么我们用箱归一化来计算一下单位体积内的能量呢?由于周期性边界条件的限制,k的取值离散化,k空间体元为$\frac{(2\pi)^3}{V}$,于是单位体积的能量为
$$ \mathcal E_0=\sum_k \frac{d^3 k}{(2\pi)^3} \frac{\omega(k)}{2} $$
依然发散。虽然能量的绝对值并无多大意义,但是一个无穷大的常数还是令人困惑的。
当然我们可以修改模型把这零点能去了,重新定义哈密顿量$:H:=\int \omega a_k^\dagger a_k$。像这样将产生算符放在湮灭算符左边的做法,被称为正规乘积。当然,简单的把零点能去掉这个做法给人的感觉总是有点不妙,事实上正规乘积的意义不仅于此,在后面我们仍会见到这个东西的。
宇宙学常数这块等回学校再看看GR书再来补。
复标量场
前面场算符是实的,我们也可以构造一个复的。
模型的拉格朗日密度为
$$ \mathcal{L}=\partial^\mu\phi^* \partial_\mu\phi-m^2 \phi^* \phi $$
使用欧拉-拉格朗日方程算出运动方程
$$ \begin{aligned} (\partial^2+m^2)\phi~&=0 \\ (\partial^2+m^2)\phi^*&=0 \end{aligned} $$
正则动量
$$ \begin{aligned} \pi=\frac{\partial \mathcal L}{\partial \dot \phi}=\dot \phi^* \\ \pi^*=\frac{\partial \mathcal L}{\partial \dot \phi^*}=\dot \phi \end{aligned} $$
正则对易关系
$$ \begin{array}{c} \left [ \phi ,\phi \right ] =0~\left [ \pi ,\pi \right ] =0 \\ \left [ \phi ,\phi^* \right ] =0~\left [ \pi ,\pi^* \right ] =0 \\ \left [ \phi ,\pi \right ] =i\delta(\boldsymbol x-\boldsymbol x')~\left [ \phi^* ,\pi^* \right ] =i\delta(\boldsymbol x-\boldsymbol x') \end{array} $$
将满足方程的场在动量空间展开,由于现在是复的场,故正频项和负频项无须互为厄米共轭。
$$ \phi=\int d^3k~(a_k\psi_k + b_k^\dagger \psi_k^*) $$
可以验证动量空间的算符具有下列对易关系(倒回去可以验证,正着推还是算了)
$$ \left [ a_k ,a_{k'}^\dagger \right ] =\delta(\boldsymbol k-\boldsymbol k'),~\left [ b_k ,b_{k'}^\dagger \right ] =\delta(\boldsymbol k-\boldsymbol k') $$
如上的一些结果,说明上面的模型较之前的实标量场的自由度翻了个倍,这是因为我们有两个独立的场变量$\psi$和$\psi^*$。我们也可以把复标量场表示为两个实标量场的组合$\phi=\frac{1}{\sqrt{2}}(\phi_1+i\phi_2),~\phi^*=\frac{1}{\sqrt{2}}(\phi_1-i\phi_2)$。
由于两个场变量是独立的,则在考虑场的能动量时需要考虑两者,能动量密度写为$\mathcal T_{\mu\nu}=\frac{\partial \mathcal{L}}{\partial \partial^\mu \phi} \partial_\nu \phi + \frac{\partial \mathcal{L}}{\partial \partial^\mu \phi^*} \partial_\nu \phi^* - \mathcal{L} g_{\mu\nu}$,$\mathcal P^\mu = \mathcal T^{0\mu}=\frac{\partial \mathcal{L}}{\partial \partial^0 \phi} \partial_\mu \phi + \frac{\partial \mathcal{L}}{\partial \partial^0 \phi^*} \partial_\mu \phi^* - \mathcal{L} g^{0\mu}$。
当$\mu=0$时,
$$ \mathcal H = \mathcal P^0=\dot \phi^* \dot \phi+(\nabla\phi^*)\vdot (\nabla\phi) + m^2\phi^*\phi $$
当$\mu \ne 0$时
$$ \mathcal P^i=\dot\phi^*\partial^i\phi+\dot\phi\partial^i\phi^* $$
利用KG方程以及高斯定理以及无限远处场趋于0,可以得到哈密顿量
$$ \begin{aligned} H& = \int d^3 x~\mathcal H \\ & = \int d^3x (\dot\phi^*\phi+\nabla\vdot (\phi\nabla\phi^*)-\phi\nabla^2\phi^*+m^2\phi^*\phi) \\ & = \int d^3x (\dot\phi^*\phi-\phi\nabla^2\phi^*-\phi^*\ddot\phi+\phi\nabla^2\phi^*) \\ & = \int d^3x (\dot\phi^*\phi-\phi^*\ddot\phi) \\ & = - \int d^3x~ \phi^* \overleftrightarrow{\partial_0} \partial_0\phi \end{aligned} $$
同样,动量算符有相同形式(使用分部积分),于是
$$ P^\mu=- \int d^3x~ \phi^* \overleftrightarrow{\partial_0} \partial^\mu\phi $$
带入$\phi$在动量空间的展开式,可以得到
$$ P^\mu = \int d^3k~k^\mu (a_k^\dagger a_k+b_kb_k^\dagger) \\ $$
这一结果表明,复标量场所描述的两种粒子质量相等,每个具有能动量$k_\mu$。
这一场体系除了时空平移对称性,还有内部对称性。考虑其规范变换$\phi \to \phi'=e^{i\gamma}\phi$,其中$\gamma$是实数,与坐标无关。于是根据Noether定理
$$ \begin{aligned} j^\mu &= \frac{\partial \mathcal L}{\partial \partial_\mu \phi}\bar\delta \phi +\frac{\partial \mathcal L}{\partial \partial_\mu \phi^*}\bar\delta \phi^* + \mathcal L \delta x^\mu\\ &=i\gamma \left(\frac{\partial \mathcal L}{\partial \partial_\mu \phi}\phi -\frac{\partial \mathcal L}{\partial \partial_\mu \phi^*}\phi^* \right ) \end{aligned} $$
于是
$$ \begin{aligned} Q&=\int d^3x~j^0 \\ &= \int d^3x~\left(\frac{\partial \mathcal L}{\partial \partial_0 \phi}\phi -\frac{\partial \mathcal L}{\partial \partial_0 \phi^*}\phi^* \right )\\ &= \int d^3x~\left( \dot\phi^*\phi - \dot\phi\phi^* \right )\\ &= \int d^3k~\left( a_k^\dagger a_k - b_kb_k^\dagger \right) \end{aligned} $$
说明复标量场所描述的两种粒子具有的荷符号相反。
回退到量子力学
“非相对论”场
我们现在来考虑一下这样的一个场
$$ \psi=e^{-imt}\phi $$
由于$\phi$满足KG方程,带入后可以得到$2im\dot\psi-\nabla^2\psi+\ddot\psi=0$。在“非相对论”极限下,有$\dot\psi\ll m\psi$,于是在上式中的$\ddot \psi$可以被略去。于是我们得到
$$ i\frac{\partial}{\partial t}\psi=\frac{1}{2m}\psi $$
这一形式与薛定谔方程的形式十分相像,但物理内涵却与薛定谔方程不同。这里是场函数满足的方程,是算符的演化;而薛定谔方程描述的是粒子的波函数,是态的演化。
那么现在的问题就变成了从这个场函数构造一个单粒子态了。
我们可以将$\psi$展开,$\psi(x,t)=\int \frac{d^3p}{(2\pi)^3}e^{i(\omega t+px)}a_p$,注意此时不像前面还需要“负频项”,是因为$\psi$的通解中$\omega=p^2/2m$恒为正。算符$a_p$满足对易关系$\left [ a_p ,a_{p'}^\dagger \right ] =\delta(\boldsymbol k-\boldsymbol k')$。对于箱归一化的情况,有$\left [ a_p ,a_{p'}^\dagger \right ] =\delta_{pp'}$。
类似于实标量场中的做法,我们可以得到真空态$\ket{0}$,并且$a_p^\dagger$是产生算符。于是动量空间的单粒子态$\ket p=a_p^\dagger\ket 0$,坐标空间的单粒子态$\ket x = \psi^\dagger(x)\ket 0 = \int \frac{d^3p}{(2\pi)^3}e^{ipx} \ket p$。若我们将两算符做内积,便可得到
$$ \bra p \ket{x} = \bra p (\int \frac{d^3p'}{(2\pi)^3}e^{ipx} \ket{p'}) = \frac{1}{(2\pi)^3}e^{ipx} $$
这正是量子力学中坐标和动量表象间的变换。
于是我们可以构造一个态$\ket \varphi = \int dx~\varphi(x) \ket x$,其中$\varphi(x)$即为薛定谔方程中所描述的概率幅。
由前面复标量场的讨论,我们可以将动量算符写为$P=\int \frac{d^3p}{(2\pi)^3}p~a^\dagger_p a_p$,这样有$P\ket p = p\ket p$。同样我们定义位置算符$X=\int d^3x ~x \psi^\dagger(x)\psi(x)$,于是$X\ket x=x\ket x$。而哈密顿算符可以写为$H=\int \frac{d^3p}{(2\pi)^3}\frac{p^2}{2m}~a^\dagger_p a_p$
矢量场
前面探讨复标量场的荷的时候,规范变换改变了场的相位。而这种“相位”也能让人联想到矢量。那么矢量场的有哪些物理在里面呢?我们又该如何处理呢?
在洛伦兹变换$x^\mu\to x'^\mu=\Lambda^\mu{}_\nu x^\nu $下,标量场的变换为$\phi(x)\to\phi'(x)=\phi(\Lambda ^{-1}x)$。而对于矢量场来说,当坐标轴旋转时,矢量也要随着旋转。于是洛伦兹变换下矢量场的变换规则为$V^\mu(x) \to \Lambda^\mu{}_{\nu}V^\nu(\Lambda^{-1}x)~$
在此前我们讨论复标量场时,说其具有内部对称性并对其做规范变换$\phi \to \phi'=e^{i\gamma}\phi$。但是正如过程体现的那样,这一变换会改变拉格朗日密度的形式。那么为了使拉格朗日密度在规范变换下不变,应引入一协变微分
$$ \mathcal D_\mu=\partial_\mu+iqA_\mu $$
其中$A_\mu$满足
$$ A_\mu\to A'_\mu=A_\mu-\frac{1}q\partial_\mu \gamma(x) $$
q为耦合系数。这样在规范变换下$\mathcal D_\mu\phi \to \mathcal D_\mu'\phi'=e^{i\gamma(x)}\mathcal D_\mu\phi$,于是引入协变微分能使规范变换下拉格朗日密度形式不变$\mathcal L=(\mathcal D_\mu\phi)^*\mathcal D_\mu\phi-m^2\phi^*\phi$。而这里的$A_\mu$则便是矢量场。
Maxwell场
由于在规范变换下满足的规则,$A_\mu$出现在拉格朗日密度中时必须以反对称张量的形式出现。于是引入$F^{\mu\nu}=\partial^\mu A^\nu-\partial^\nu A^\mu$。拉格朗日密度最简单的模型即为$\mathcal L=-\frac{1}4F^{\mu\nu}F_{\mu\nu}$。此即Maxwell场的拉格朗日密度,而$A_\mu$则是Maxwell场的场量。
通过欧拉-拉格朗日方程可以推得
$$ \frac{\partial\mathcal L}{\partial A_\nu}-\partial_\mu\frac{\partial\mathcal L}{\partial \partial_\mu A_\nu}=\partial_\mu F^{\mu\nu}=0 $$
同时通过$F^{\mu\nu}$的定义容易验证
$$ \partial_\lambda F_{\mu\nu}+\partial_\mu F_{\nu\lambda}+\partial_\nu F_{\lambda\mu}=0 $$
此式也被称为Bianchi恒等式(在广义相对论中也有关于黎曼曲率张量的Bianchi恒等式)
此两式即为无自由电流时的麦克斯韦方程组。
由于$A_\mu$在规范变换下的系数的任意性,故在$A_\mu$中的四个分量并不完全独立,存在非物理的自由度。我们可以增加一些条件来消除这种多余的自由度,这样的条件称为规范条件。常见的规范条件有Lorentz规范(洛伦兹规范)和Coulomb规范(库伦规范)等。
常见的规范条件有Lorentz规范(洛伦兹规范)和Coulomb规范(库伦规范)等。
Lorentz规范为$\partial _\mu A^\mu = 0$,这个规范条件是洛伦兹不变的。
Coulomb规范为$\nabla \vdot \boldsymbol A = 0,~\nabla^2 A^0=-\rho$。
能够注意到,Lorentz规范只有一个方程,$A^\mu$的自由度为3;而Coulomb规范具有两个方程,$A^\mu$的自由度为2。但是无论选取何种规范,具有物理意义的自由度应该是固定的,那么则说明Lorentz规范不能消除所有的非物理自由度,在理论结果中还存在非物理的成分。为了表明Maxwell场的非物理自由度,需要引入场的角动量。
场的角动量
根据一些群论知识我们能知道,空间旋转群是SO(3)群。SO(3)的基为旋转矩阵
$$ R_1= \begin{pmatrix} 1 & 0 & 0 \\ 0 & \cos \alpha & -\sin \alpha \\ 0 & \sin \alpha & \cos \alpha \end{pmatrix},~ R_2= \begin{pmatrix} \cos\beta & 0 & -\sin\beta \\ 0 & 1 & 0 \\ \sin \beta & 0 & \cos \beta \end{pmatrix},~ R_3= \begin{pmatrix} \cos\gamma & -\sin\gamma & 0 \\ \sin\gamma & \cos\gamma & 0\\ 0 & 0 & 1 \end{pmatrix} $$
于是该群的生成元为
$$ J_1=i \begin{pmatrix} 0 & 0 & 0\\ 0 & 0 & -1\\ 0 & 1 & 0\\ \end{pmatrix},~ J_2=i \begin{pmatrix} 0 & 0 & 1\\ 0 & 0 & 0\\ -1 & 0 & 0\\ \end{pmatrix},~ J_3=i \begin{pmatrix} 0 & -1 & 0\\ 1 & 0 & 0\\ 0 & 0 & 0\\ \end{pmatrix} $$
注意,上面不带系数i也成立,这里带i是处于物理方面的考虑。
于是以上矩阵具有对易关系$\left [ J_i , J_j \right ] = i \epsilon_{ij}^k J_k$
对于无穷小旋转变换,三个方向旋转角度分别为$\theta^i=(\alpha,\beta,\gamma)$,那么变换矩阵可以写为
$$ a^i_j= \begin{pmatrix} 1 & -\theta^3 & \theta^2\\ \theta^3 & 1 & -\theta^1\\ -\theta^2 & \theta^1 & 1 \end{pmatrix} =1-iJ_k\theta^k $$
现在我们来讨论一下Maxwell场在以上旋转变换下的守恒量。在无穷小旋转变换下,有
$$ \begin{aligned} x_i \to x_i’=a_i^j x_j &,~ A_i(x) \to A_i’(x’)=a_i^j A_j(x’) \\ \delta x^i = \epsilon^i_{jk}x^j\theta^k &,~ \delta A^i = \epsilon^i_{jk}A^j\theta^k \end{aligned} $$
若拉格朗日量在此变换下不变,根据Noether定理,则有
$$ \begin{aligned} j^\mu &= \frac{\partial \mathcal L}{\partial \partial_\mu A^i}\delta A^i - \left( \frac{\partial \mathcal L}{\partial \partial_\mu A^\rho}\partial_\nu A^\rho - \mathcal L g^\mu_\nu \right)\delta x^\nu \\ & = \left[ \frac{\partial \mathcal L}{\partial \partial_\mu A_i} A^j \epsilon_{ijk} - \left ( \frac{\partial \mathcal L}{\partial \partial_\mu A^\rho}\partial_i A^\rho - \mathcal L g^\mu_i \right ) \epsilon^i_{jk} x^j \right ] \theta^k \\ \end{aligned} $$
我们可以注意到,$\mu=0$时,上式后面一项括号中的便是体系的动量密度$\mathcal P_i = \left ( \frac{\partial \mathcal L}{\partial \partial_0 A^\rho}\partial_i A^\rho - \mathcal L g^0_i \right ) $
于是,我们可以令
$$ j^0 = (\mathcal S_k + \mathcal M_k)\theta^k $$
其中
$$ \mathcal S_k=\frac{\partial \mathcal L}{\partial \partial_0 A_i}A^j \epsilon_{ijk} $$
与$\delta A_i$联系在一起,代表着场的自旋角动量密度。
$$ \mathcal M_k=x^i \mathcal P^j \epsilon_{ijk} $$
与体系动量密度有关,代表着场的轨道角动量密度。
上面的内容说明,在矢量场中,轨道角动量单独并不守恒,还要加上自旋角动量。而在标量场中标量并不会随着坐标的旋转而旋转,则不存在自旋角动量项,标量场的自旋为0。
现在我们来详细计算下Maxwell场的自旋角动量。
$$ \begin{aligned} \mathcal S_k & = \frac{\partial \mathcal L}{\partial \partial_0 A_i}A^j \epsilon_{ijk}\\ & = (\partial^i A^0 - \partial^0 A^i)A^j\epsilon_{ijk} \end{aligned} $$
对于Coulomb规范下的自由场,$A^0 = 0 ,~\nabla \vdot \boldsymbol A = 0$,那么有
$$ \begin{aligned} \mathcal S_k &= -(\partial^0 A^i) A^j \epsilon_{ijk} \\ &=\frac{1}{2} A^i \overleftrightarrow \partial _0 A^j \epsilon_{ijk} \end{aligned} $$
对于矢量场的空间部分$\boldsymbol A(x,t)$,可以和标量场的做法类似地进行平面波展开
$$ \boldsymbol A(x,t) = \int \frac{d^3k}{\sqrt{(2\pi)^3 2\omega}}\boldsymbol e^s_k \left( a_{ks}e^{-ik_\mu x^\mu} + a^\dagger_{ks} e^{ik_\mu x^\mu} \right) $$
分量式为
$$ A_i(x,t) = \int \frac{d^3k}{\sqrt{(2\pi)^3 2\omega}} e^s_{ki} \left( a_{ks}e^{-ik_\mu x^\mu} + a^\dagger_{ks} e^{ik_\mu x^\mu} \right) $$
其中$\boldsymbol e^s_k$为极化矢量,标号s用于标记偏振方向。对于Coulomb规范下的自由场而言,只有两个横场项$s=1,2$,$s=3$的纵场项为0。
于是自旋角动量为
$$ S_k = \int d^3x \mathcal S_k = \frac{i}{2} \int d^3k e^s_{ki} e^{s’}_{kj} \epsilon^{ij}_k \left(a_{ks}s a^\dagger_{ks’} - a^\dagger_{ks} a_{ks’} \right) $$
$$ \begin{aligned} S_3 & = \frac{i}{2} \int d^3k (a_{k1}a^\dagger_{k2}-a^\dagger_{k1}a_{k2})-(a_{k2}a^\dagger_{k1} - a^\dagger_{k2}a_{k1})\\ & = \frac{1}{2} \int d^3k [(a_{k+}a^\dagger_{k+}+a^\dagger_{k+}a_{k+})-(a_{k-}a^\dagger_{k-}+a^\dagger_{k-}a_{k-})] \end{aligned} $$
其中
$$ a_{k\pm} = \frac{1}{\sqrt 2}(a_{k1}\mp i a_{k2}) $$
于是,上述结果说明,Maxwell场的自旋为1。右旋对应自旋+1,左旋对应自旋-1。
Maxwell场的正则量子化
Coulomb规范下
回忆一下,Coulomb规范下的自由场有$A^0=0,~\nabla \vdot \boldsymbol A = 0$,那么正则动量为
$$ \pi^\mu = \frac{\partial \mathcal L}{\partial \dot A_\mu} = -(\partial^0 A^\mu - \partial^\mu A^0) = -\partial_0 A^\mu $$
于是可以看到$\pi^0 = 0$,这正是多余的非物理自由度导致的。
由于有$A^0=\pi^0=0$,于是我们可以把拉格朗日密度改写为
$$ \begin{aligned} \mathcal L & = - \frac{1}{2}(\partial^\mu A^i \partial_\mu A_i - \partial^j A^i \partial _i A_j)\\ & = -\frac{1}{2}(\partial^0 A^i \partial_0 A_i + \partial^i A^j \partial_i A_j - \partial^i A^j \partial_j A_i)\\ & = \frac{1}{2} [(\dot{\boldsymbol A})^2 - (\nabla \times \boldsymbol A)^2] \end{aligned} $$
同样我们能得到哈密顿密度
$$ \mathcal H = \pi^\mu \partial_0 A_\mu - \mathcal L = \frac{1}{2} [(\dot{\boldsymbol A})^2 + (\nabla \times \boldsymbol A)^2] $$
这和我们在电动力学中学到的一致。
根据正则量子化流程,有等时对易关系
$$ \begin{aligned} \left [ A_i(x,t), A_j(x’,t) \right ] = 0,~~\left [ \pi^i(x,t), \pi^j(x’,t) \right ]=0 \\ \left [ A_i(x,t), \pi^j(x’,t) \right] = i g_i^j \delta(x-x’) \end{aligned} $$
上面关系不含$A_0$和$\pi^0$,毕竟在Coulomb规范下$A_0=\pi^0=0$并不作为算符而是一个确定的实数。同时需要注意的是,$A_i$对应的正则动量是$\pi^i$。
前面有提到,在Coulomb规范下,可以将$\boldsymbol A(x,t)$进行平面波展开
$$ A_i(x,t) = \int \frac{d^3k}{\sqrt{(2\pi)^3 2\omega}} (e^s_k)_i \left( a_{ks}e^{-ik_\mu x^\mu} + a^\dagger_{ks} e^{ik_\mu x^\mu} \right) $$
其中$\psi_k(x)$是达朗贝尔方程$\partial_\mu \partial^\mu A^\nu = 0$的平面波解$\psi_k(x)=\frac{1}{(2\pi)^{3/2}\sqrt{2\omega}} e^{-ik_\mu x^\mu}$
带入前面坐标空间的场算符对易关系,可以得到动量空间的算符$a_{ks}$和$a^\dagger_{ks}$的对易关系
$$ [a_{ks}, a_{k’s’}] = 0,~[a^\dagger_{ks}, a^\dagger_{k’s’}] = 0,~[a_{ks},a^\dagger_{k’s’}] = \delta_{ss’} \delta(k-k’) $$
这和我们之前在标量场得到的结果很像,这一对易关系说明光子是玻色子。
而体系的哈密顿量为
$$ \begin{aligned} H & = \int d^3x \mathcal H \\ & = \int d^3x \frac 1 2 [\boldsymbol{\dot A}^2 + (\nabla \times \boldsymbol A)^2] \\ & = \frac 1 2 \int d^3x \boldsymbol{\dot A} \overleftrightarrow{\partial_0} A \\ & = \int d^3k \sum_s \frac \omega 2 (a_{ks}a^\dagger_{ks}+a^\dagger_{ks}a_{ks}) \end{aligned} $$
说明Maxwell场的能量是量子化的,每个光子携带能量$\omega$。
Lorentz规范下
回忆一下,根据拉格朗日密度$\mathcal L = -\frac 1 4 F^{\mu\nu} F_{\mu\nu}$得到的正则动量$\pi^\mu = \partial^\mu A^0 - \partial^0 A^\mu$,于是$\pi^0=0$。根据正则量子化流程则有$A_0$与所有算符对易,这就说明$A_0$其实并不是算符,与$A_i$不同。于是将$A_0$和$A_i$放在一起的$A_\mu$就不具备洛伦兹协变性。
为了构造出洛伦兹协变性,我们可以修改模型的拉格朗日密度。
把$\mathcal L$修改为
$$ \mathcal L = - \frac 1 4 F^{\mu\nu}F_{\mu\nu} -\frac{\lambda} 2 (\partial_\mu A^\mu)^2 $$
新增的第二项称为规范固定项。根据欧拉-拉格朗日方程可以得到
$$ \partial^\mu\partial_\mu A^\nu -(1-\lambda)\partial^\nu(\partial_\sigma A^\sigma)=0 $$
为使上式成为达朗贝尔方程,选取$\lambda = 1$,这被称为Feynman规范。
$\lambda=1$时,由于$\mathcal L$出现在积分中,于是可以相差任意四维散度项,于是我们可以在拉格朗日密度里面动点手脚
$$ \begin{aligned} \mathcal L & = - \frac 1 4 F^{\mu\nu}F_{\mu\nu} -\frac 1 2 (\partial_\mu A^\mu)^2\\ & = -\frac 1 2 (\partial_\mu A_\nu \partial^\mu A^\nu - \partial_\mu A_\nu \partial^\nu A^\mu)-\frac 1 2 \partial_\mu A^\mu\\ & = ~...+\frac 1 2 [\partial_\mu(A^\mu \partial_\nu A^\nu)-\partial_\nu(A^\mu\partial_\mu A^\nu)])]\\ & = - \frac 1 2 \partial_\mu A_\nu \partial^\mu A^\nu \end{aligned} $$
于是,正则动量为
$$ \pi^\mu = -\dot A^\mu $$
根据正则量子化流程得到的对易关系,把正则动量的表达式带入,于是有
$$ \begin{aligned} \left [ A_\mu(x,t), A_\nu(x’,t) \right ] = 0,~~\left [ \dot A_\mu(x,t), \dot A_\nu (x’,t) \right ]=0 \\ \left [ \dot A_\mu(x,t), A_\nu(x’,t) \right] = i g_{\mu\nu} \delta(x-x’) \end{aligned} $$
现在,场量$A_\mu$有四个分量,于是不同于前面的3个,现在我们需要4个独立的单位矢量来标记矢量的方向。记作$e^\sigma_{k\mu}$,k即为波矢,$\sigma=0,1,2,3$用于标记不同的单位矢量,$\mu$是单位矢量的分量的index。我们在这里(也是通常上)令第3轴的方向为波矢方向。
把$A_\mu$进行展开,有(与前面不同的地方只在于偏振方向的个数)
$$ A_\mu(x,t) = \int \frac{d^3k}{\sqrt{(2\pi)^3 2\omega}} e^\sigma_{k\mu} \left( a_{k \sigma }e^{-ik_\mu x^\mu} + a^\dagger_{k\sigma} e^{ik_\mu x^\mu} \right) $$
同理可以得到动量空间的算符$a_{ks}$和$a^\dagger_{ks}$的对易关系
$$ [a_{k\sigma}, a_{k’\sigma’}] = 0,~[a^\dagger_{k\sigma}, a^\dagger_{k’\sigma’}] = 0,~[a_{k\sigma},a^\dagger_{k’\sigma’}] = -g_{\sigma\sigma’} \delta(k-k’) $$
和前面Coulomb规范下得到的区别只在于偏振方向的区别,这里的对易关系似乎说明了存在4种偏振方向的光子。$\sigma=0$的被称为标量光子或是类时光子(由于偏振方向为时间轴),$\sigma=1,2$的被称为横光子,$\sigma=3$的被称为纵光子。
但是我们知道,光子的自旋为1,并且3个自旋本征态中只有2个是具有物理意义的,意味着只有2个物理的偏振态。那么这里的4个偏振方向是怎么会事呢?(同时我们能发现,$[a_{k0},a^\dagger_{k’0}] = - \delta(k-k’)$带有负号,这样单标量光子态的模长为-1(关于这点不详细展开了,涉及到不定度规等内容,参见Gupta及Bleuler的相关文献),是一个很奇怪的东西。但是这样求和的话,如果$a_{k3}=a_{k0}$,那么我们所知道的两个非物理的态就正好相消,只剩下物理的两个横偏振态)
这是因为我们还没讨论Lorentz规范条件。$\partial_\mu A^\mu = 0 = \partial_0 A_0 - \nabla \vdot \boldsymbol A$,这里我们发现,$A_\mu$的空间和时间部分是存在一些耦合的。如果我们用一个称为弱Lorentz规范条件的东西:
$$ \bra \psi \partial_\mu A^\mu \ket \psi = 0 $$
那么上面遇到的问题就能得到解决。现在让我们来看一下这个条件到底意味着什么,将$A^\mu$的展开式带入上式
$$ \bra \psi \partial_\mu \left(\int d^3k~ e^\sigma_{k\mu} \left( a_{k \sigma }\varphi_k + a^\dagger_{k\sigma} \varphi_k^\dagger \right)\right)\ket \psi \Rightarrow (a_{k0}-a_{k3})\ket \psi =0 $$
我们发现,这一条件实际上要求了对于物理的态而言,标量光子与纵光子同时存在。
根据Noether定理,可以得到场的能动量
$$ \begin{aligned} H & = \int d^3x~ \mathcal H = \int d^3x~ -\dot A^\mu \dot A_\mu - \mathcal L\\ & = -\frac 1 2 \int d^3k~ \omega g^{\sigma \sigma’}(a_{k\sigma}a^\dagger_{k\sigma’}+a^\dagger_{k\sigma}a_{k\sigma’})\\ P^i &= \int d^3~ \mathcal P^i = - \int d^3x \dot A^\mu \partial^i A_\mu \\ &= -\frac 1 2 \int d^3k~ k^i g^{\sigma \sigma’}(a_{k\sigma}a^\dagger_{k\sigma’}+a^\dagger_{k\sigma}a_{k\sigma’})\\ \end{aligned} $$
于是有
$$ \begin{aligned} P^\mu & = -\frac 1 2 \int d^3k~ k^\mu g^{\sigma \sigma’}(a_{k\sigma}a^\dagger_{k\sigma’}+a^\dagger_{k\sigma}a_{k\sigma’})\\ & = \frac 1 2 \int d^3k~ k^\mu [\sum_i (a_{ki}a^\dagger_{ki}+a^\dagger_{ki}a_{ki})-(a_{k0}a^\dagger_{k0}+a^\dagger_{k0}a_{k0})] \end{aligned} $$
上面的结果说明了,每种光子都贡献能量和动量,但是对于Lorentz条件限定的物理态而言,标量光子与纵光子同时出现,贡献相互抵消,仅有横光子具有可观测的物理效应。
Casimir力:考虑间隔很近的平行金属板间的真空能(由于金属板,厚度方向波矢取离散值),与无限空间的真空能对比(较小),说明了无穷大的真空能的改变是可观测的。
重矢量场
可以在最初定义的Maxwell场的拉格朗日密度上加入质量项
$$ \mathcal L = - \frac 1 4 F^{\mu \nu}F_{\mu\nu} +\frac 1 2 m^2 A_\mu A^\mu $$
根据欧拉-拉格朗日方程,得到运动方程
$$ \partial_\mu F^{\mu \nu} +m^2 A^\nu = 0 $$
此式也被称为Proca方程
用$\partial_\nu$对这个方程作用一下,由于$F^{\mu\nu}$反对称,于是有$m^2 \partial_\mu A^\mu = 0$,既有Lorentz条件$\partial_\mu A^\mu = 0$。与之前的无质量项的规范不变的矢量场的额外加上的为了消除多余非物理自由度而引入的Lorentz条件不同,此处的模型之Lorentz条件蕴含在了质量项之内。而Lorentz条件不是规范不变的(回忆一下,此处的规范变换指,标量场在做相位/U(1)规范变换时,构造协变微分而引入的相耦合的规范场$A_\mu$,具有此式$A_\mu \to A'_\mu = A_\mu + \partial_\mu \chi(x)$容许的任意性,此式即为$A_\mu$的规范变换)
带入Lorentz规范,Proca方程变为KG方程
$$ (\partial_\mu \partial^\mu + m^2) A_\nu = 0 $$
之后的事情都没什么稀奇的,量子化和前面类似,而在动量空间展开的基函数的$k^\mu$中$\omega=\sqrt{m^2 + k^2}$而不是之前的$\omega=\left | k \right | $。这就导致了纵偏振方向的可观测效应。
相互作用
旋量场
见群论笔记
Weyl方程
前面的KG方程以及Porca方程都是二阶偏微分方程,那我们想,是不是粒子的运动方程都是一阶的呢,我们能不能构造出能产生运动方程是一阶偏微分的拉格朗日密度呢?于是在这章我们的脉络是,先找到一个运动方程,然后反过来去构造拉格朗日密度,再进行量子化。
假设运动方程具有这样的形式
$$ \partial_0 \psi = b^i \partial_i \psi +C\psi $$
对方程两边求$\partial^0$,于是有
$$ \partial_0^2 \psi = [1/2 (b^ib^j+b^jb^i)\partial_i\partial_j+2Cb^i\partial_i+C^2]\psi $$
要使上方程洛伦兹协变,则要求$C=0$和$\{b^i,b^j\}=-g^{ij}$(此时上面方程变为达朗贝尔方程)
而对于二维空间而言,Pauli矩阵恰好满足要求
$$ b^i = \sigma^i $$
这样我们就有Weyl方程
$$ \partial_0\psi = \pm \sigma^i\partial_i\psi $$
我们可以看到,这里的$\psi$是一个二分量的量,并且每个分量都是一个虚数,这就说明这不是一个普通的向量,我们把这称为Weyl旋量。同时,Weyl方程右边的正负号说明这个方程具有两支,也就说明有两种Weyl旋量,代表两种相似但不同的粒子,遵循的运动方程相差一个正负号。
Weyl旋量是一种新的量,那么在Lorentz变换下如何变换呢?
我们可以直接通过SU(2)群的(1/2,0)/(0,1/2)表示来得到$\Lambda=e^{-i\boldsymbol \theta \vdot \boldsymbol \sigma/2}$,也可以单从Lorentz变换下为保证Weyl方程不变得到(略)。
Weyl旋量满足达朗贝尔方程,则说明对应的粒子质量为0以光速运动。同时在前面关于旋量的讨论时,出现了Pauli矩阵以及旋量与SU(2)群的(1/2,0)/(0,1/2)表示密不可分,则蕴含着旋量场的自旋为1/2的内涵。
这里我们还要提一嘴螺旋度的事。螺旋度定义为自旋在运动方向上的投影$h=\frac{\sigma \vdot k}{k}$,于是Weyl场的螺旋度$h=\pm 1$。$h=+1$表示自旋方向与运动方向相同,为右旋态;$h=-1$表示自旋方向与运动方向相反,为左旋态。
Dirac方程
Weyl表象
前面Weyl方程描述的场是无质量以光速运动,自旋为1/2,方程的两支分别描述左旋和右旋态。为了把方程的两支合并起来并加入质量参数,我们可以加入一个耦合因子
$$ \begin{aligned} (\partial_0+\sigma^i\partial_i)\psi_R = -im \psi_L \\ (\partial_0-\sigma^i\partial_i)\psi_L = -im \psi_R \\ \end{aligned} $$
我们可以把这两方程合写为
$$(\partial_0 + \alpha^i\partial_i+im\beta) \psi = 0$$
其中
$$ \psi = \begin{pmatrix} \psi_R\\\psi_L \end{pmatrix} $$
$$ \alpha^i = \begin{pmatrix} \sigma^i & 0\\ 0 & -\sigma^i \end{pmatrix} ,~ \beta = \begin{pmatrix} 0 & I_2\\ I_2 & 0 \end{pmatrix} $$
$\psi$为两个Weyl旋量的组合,称为Dirac旋量。Dirac旋量具有4个分量,本质为SU(2)群的$(0,\frac 1 2)\oplus (\frac 1 2,0)$表示下的本征向量。$\alpha$和$\beta$都是4x4的厄米矩阵,称为Dirac矩阵。而上面这一方程即为自由粒子的Dirac方程。这一方程统一地描述了有质量的自旋为1/2的粒子。
Weyl表象常用于高能情况下$p \ll mc$,此时粒子质量可以忽略,Dirac旋量上下的左旋和右旋部分去耦合,Dirac方程退化为Weyl方程。
Dirac表象
而一般情况下更常见的是Dirac表象。从Weyl表象到Dirac表象的变换矩阵为
$$ U=\frac 1 {\sqrt 2} \begin{pmatrix} 1 & 1\\ 1 & -1 \end{pmatrix} $$
$$ \gamma \to U^{-1} \gamma U,~\psi \to U\psi $$
于是旋量变为
$$ \psi = \begin{pmatrix} \psi_R\\\psi_L \end{pmatrix} \to \psi = \begin{pmatrix} \varphi\\\chi \end{pmatrix} = \frac 1 {\sqrt 2}\begin{pmatrix} \psi_R+\psi_L\\\psi_R-\psi_L \end{pmatrix} $$
而Dirac矩阵变为
$$ \alpha^i = \begin{pmatrix} 0 & \sigma^i\\ \sigma^i & 0 \end{pmatrix} ,~ \beta = \begin{pmatrix} I_2 & 0\\ 0 & -I_2 \end{pmatrix} $$
于是在Dirac表象中,Dirac方程可写为
$$ \begin{aligned} \partial_0 \varphi +\sigma^i \partial_i \chi +im\varphi = 0\\ \partial_0 \chi +\sigma^i \partial_i \varphi -im\chi = 0\\ \end{aligned} $$
从上可以看出,在粒子动量较小时,$p \to 0$,上式中间一项可以略去,意味着$\varphi$代表正频项,$\chi$代表负频项,即分别描述正粒子和反粒子。于是当粒子的动量较小时,正反粒子的产生湮灭可以忽略,用Dirac表象比较方便。
Majorana表象
先放这一下,大概就是粒子的反粒子是其本身的一个东西。
$\gamma$矩阵与Dirac方程的协变形式
让我们先不管$\gamma$矩阵背后的复杂的对称性来源及蕴含的代数结构,直接利用前面已知的东西进行一个简单的定义。
前面我们引入了Dirac矩阵$\alpha^i,~\beta$,他们都是厄米算符,且满足与表象无关的关系$\{\alpha_i,\alpha_j\} = \delta_{ij},~\{\alpha_i,\beta\} = 0,~\beta^2 = 1$.(这一关系也说明了其背后蕴含的代数结构,同样我们这里不展开讨论了)
现在来定义$\gamma$矩阵:
$$ \gamma^0 = \beta,~ \gamma^i = \beta \alpha^i $$
可以发现
$$ \begin{aligned} \gamma^0 = (\gamma^0)^\dagger ,~ \gamma^i = -(\gamma^i)^\dagger\\ \{\gamma^\mu,\gamma^\nu\} = 2 g^{\mu\nu} \mathbf 1 \end{aligned} $$
我们再来定义一个量
$$\gamma^5 = i \gamma^0 \gamma^1 \gamma^2 \gamma^3 $$
对于$\gamma^5$,有
$$ (\gamma^5)^2 = \mathbf 1, ~ \{\gamma^5,\gamma^\mu\} = 0,~(\gamma^5)^\dagger = \gamma^5 $$
这样“多余地”定义一个$\gamma^5$的原因是什么呢?首先这样写很方便是不是!再让我们来稍微考虑一下$\gamma$矩阵背后的代数结构吧。
从$\gamma$矩阵满足的反对易关系$\{\gamma^\mu,\gamma^\nu\} = 2g^{\mu\nu}\mathbf 1$可以知道,$\gamma$矩阵是Clifford代数$CL(1,3)$的元素。$CL(1,3)$具有16个线性无关的基,对于这16个基,物理人的选择是这样的
$$ \begin{array}{c|cc} \hline\text{乘积的重数}&\text{因子}&\text{个数}\\ \hline 0&\mathbf 1 &1\\ 1&\gamma^\mu&4\\ 2&\gamma^\mu\gamma^\nu(\mu\neq\nu)&6\\ 3&\gamma^5\gamma^\mu&4\\ 4&\gamma^5&1\\ \hline \end{array} $$
是吧是吧这样写起来很方便是吧!我们注意到这里的4个$\gamma$矩阵似乎具有特别的地位,这是因为Clifford代数本身就是由低阶的空间的基矢通过矢量乘法张成的,实际上我们这里也就是这样做的。
好吧上面的东西都太数学了,和我们要讨论的话题没太大直接联系,下面就来些物理的解释。
在Dirac表象中,可以定义手征投影算符
$$ P_L = \frac 1 2 \begin{pmatrix} 1 & -1\\-1 & 1 \end{pmatrix} ,~P_R = \frac 1 2 \begin{pmatrix} 1 & 1\\1 & 1 \end{pmatrix} $$
将手征投影算符作用在Dirac旋量上,可以得到
$$ P_L \psi = \frac{1} {\sqrt{2}} \begin{pmatrix} \psi_L\\-\psi_L \end{pmatrix} ,~ P_R \psi = \frac{1} {\sqrt{2}} \begin{pmatrix} \psi_R\\\psi_R \end{pmatrix} $$
这样得到分量完全是左旋或右旋的Weyl旋量的Dirac旋量。说明手征投影算符可以从Dirac旋量中挑选出左旋和右旋部分。
同时手征投影算符有这样的关系
$$ P_L^2=P_L,~P_R^2=P_R,~P_RP_L=P_LP_R=0 $$
而在Dirac表象中
$$ \gamma^5 = \begin{pmatrix} 0 & 1\\1 & 0 \end{pmatrix} = P_R-P_L $$
于是$\gamma^5$的本征态即为左旋态$P_L\psi$和右旋态$P_R\psi$,本征值分别是-1和1,所以$\gamma^5$也有手征算符的说法.
Dirac表象太特殊了,若脱离具体的表象,可以利用$\gamma^5$把手征投影算符定义为
$$ P_L = \frac 1 2 (1-\gamma^5),~P_R=\frac 1 2 (1+\gamma^5) $$
运用$\gamma$矩阵,我们可以把Dirac方程写成洛伦兹协变的形式
$$ (i\gamma^\mu \partial_\mu-m)\psi=0 $$
我们熟知的费曼引入了一种简化的符号
$$ \partial \llap / = \gamma^\mu \partial_\mu,~ A \llap /= \gamma^\mu A_\mu $$
于是可以用Feynman记号把Dirac方程写为
$$ (i \partial \llap / -m)\psi = 0 $$
小技巧,LaTeX里可以这样打Feynman Slash: \partial \llap /
定义Dirac共轭
$$ \bar \psi = \psi^\dagger \gamma^0 $$
于是有
$$ i\partial_\mu \bar \psi \gamma^\mu + m \bar \psi = 0 $$
Dirac场与Dirac方程的变换性质
在洛伦兹变换$x \to x' = \Lambda x$ ,其中$\Lambda=exp(\frac 1 2 \Omega_{\rho \sigma} \mathcal M^{\rho \sigma})$ 下
将Dirac旋量的变换记为
$$ \psi \to \psi'=S[\Lambda]\psi(\Lambda^{-1}x) $$
这里的$S[\Lambda]=exp(\frac 1 2 \Omega_{\rho \sigma} \mathcal S^{\rho \sigma})$,其中 $S^{\mu\nu}=\frac 1 4 [\gamma^\mu,\gamma^\nu]$(详见群论笔记)
若Dirac方程是Lorentz不变的,那么变换后的$\psi'$也满足Dirac方程
即有$(i \partial \llap / -m)\psi' = 0$
于是能得到要求
$$ S^{-1}\gamma^\mu S =\Lambda^\mu_\nu \gamma^\nu $$
这式可以通过群论的知识证明,把S定义带进去再用Clifford代数的定义再用$\mathcal M$的表达式即可证出。
好现在我们证明了Dirac方程是Lorentz不变的了(?)
那么,我们能用Dirac旋量及其共轭构造出哪些Lorentz协变量呢?
如下
$$ \begin{array}{c|c|c|c|c|c} \hline \text { 协变量 } & \bar{\psi} \psi & \bar{\psi} \gamma^{\mu} \psi & \bar{\psi} \gamma^{\mu} \gamma^{\nu} \psi(\mu \neq \nu) & \bar{\psi} \gamma^{5} \psi & \bar{\psi} \gamma^{5} \gamma^{\mu} \psi \\ \hline \text { 协变性 } & \text { 标量 } & \text { 矢量 } & \text { 二阶反对称张量 } & \text { 赝标量 } & \text { 赝矢量 } \\ \hline \end{array} $$
证明很好证,用些gamma矩阵的性质就行了。
这里的“赝”是什么意思呢?代表的是,在正规Lorentz变换下就是按照这种方式变换,但是在非正规Lorentz变换下(空间反射和时间反演)会多出一个负号。
Dirac方程的平面波解
Dirac方程$(i \gamma^\mu \partial_\mu \psi -m)\psi = 0$
考虑平面波解
$$ \psi = u(p)e^{-ipx} $$
并且在Weyl表象下计算,就有(为什么不在Dirac表象下做呢?当然是因为难解啊...)
$$ (\gamma^\mu p_\mu -m)u(p) = \begin{pmatrix} -m & p_0+p_i \sigma^i \\ p_0-p_i \sigma^i & -m \end{pmatrix} u(p)=0 $$
于是可以解出
$$ u(p)=\begin{pmatrix} \sqrt{p_0 + p_i \sigma^i} \xi\\ \sqrt{p_0 - p_i \sigma^i} \xi \end{pmatrix} $$
其中$\xi$为任意二分量旋量,理论上可以选择你自己喜欢的归一化方法,反正在这里系数是任意选取的,这里我们取$\xi^\dagger \xi =1$。
这里上面取了$\psi = u(p)e^{-ipx}$,那么假如我们取$\psi = v(p)e^{+ipx}$呢?可以得到
$$ v(p)=\begin{pmatrix} \sqrt{p_0 + p_i \sigma^i} \xi\\ \sqrt{p_i \sigma^i - p_0} \xi \end{pmatrix} $$
至于其他表象下的平面波解的形式,做下表象变换就能得到了。
由于$\xi$是二分量旋量,于是其有两线性独立的基。可以取基$\xi^1 = \binom{1}{0},~\xi^2 = \binom{0}{1}$。其实Dirac旋量的两个独立的螺旋度本征态就是分别取$\xi^1 / \xi^2$的两个。
Dirac场的量子化
我们现在有Dirac方程$(i\gamma^\mu \partial_\mu -m)\psi = 0$,于是可以这样构造拉格朗日密度
$$ \mathcal L = \bar \psi (i\gamma^\mu \partial_\mu -m)\psi $$
于是与$\psi$对应的正则动量
$$ \pi = \frac{\partial \mathcal L}{\partial \dot \psi} = i \bar \psi \gamma^0 =i\psi^\dagger $$
于是体系的哈密顿密度为
$$ \begin{aligned}[l] \mathcal H = \pi \dot \psi -\mathcal L & = i\psi^\dagger \dot \psi - \bar \psi (i \partial \llap / - m)\psi\\ & = \bar \psi (-i \gamma^i \partial_i + m )\psi\\ & = i\psi^\dagger \partial_0 \psi \end{aligned} $$
同样的可以得到体系的动量密度为
$$ \mathcal P^\mu = i\psi^\dagger \partial^\mu \psi $$
正则量子化——失败的尝试
按照之前的我们对标量场和矢量场的做法,接下来应该是对Dirac场进行正则量子化,写出正则对易关系然后找到动量空间的算符再计算得到体系能量等守恒量。但是对Dirac场的正则量子化在历史上被证明是失败的。我们不妨先来看一眼到底哪里会出现问题。
写出正则对易关系
$$ [\psi_\alpha(x,t),\psi_\beta^\dagger(x',t)]=\delta_{\alpha\beta}\delta(x-x') $$
这里$\psi$的下标$\alpha$和$\beta$用来标记Dirac旋量的四个分量。
将Dirac旋量进行平面波展开
$$ \psi(x,t)=\int\frac{\mathrm dk}{\sqrt{(2\pi)^3}\sqrt{2\omega}}\sum_s^{s=1,2}(c^s_p u^s_p e^{-i(\omega t - kx)}+d^{s\dagger}_p v^s_p e^{i(\omega t - kx)}) $$
这里的上标s用来标记不同螺旋度的本征态。
于是我们能够得到动量空间的算符的正则对易关系
$$ [c^s_p,c_{p'}^{s'\dagger}]=\delta_{ss'}\delta(p-p'),~[d_p^{s\dagger},d^{s'}_{p'}]=\delta_{ss'}\delta(p-p') $$
于是能得到体系的能量
$$ \begin{aligned} H & =\int d^3 x~ \mathcal H =i\int d^3x(\psi^\dagger \partial_0\psi)\\ & = \sum_s^{s=1,2}\int d^3p ~\omega(c^{s\dagger}_p c^s_p - d^s_p d^{s\dagger}_p) \end{aligned} $$
我们惊奇的发现,这里面居然有一个负号!即便取正规乘积后仍是如此。这就意味着体系的能量不是正定的并且来源不是零点能,这使得我们上面正则量子化的做法像个笑话。那么,此前一贯有效的正则量子化在Dirac场这里,终于遇上了不可避免的沉重的失败。
实际上也不意外,此前我们用正则量子化处理标量场和矢量场发现,在粒子数表象下,两个粒子交换是对称的,这就表明正则对易关系描述的是Bose子,这点已经蕴含在对易关系中了。并且我们的标量场和矢量场的模型通过对称性可以推出自旋为整数,也正说明着是Bose子,于是在前面正则量子化恰好能够适用。但是在这章前面的讨论中提到,Dirac场具有两个螺旋度的本征态,说明着粒子自旋为1/2,为Fermi子,故本身就无法使用正则对易关系。
Dirac场的Jordan-Wigner量子化
Jordan和Wigner将以上的正则对易关系修改为反对易关系,即
$$ \{c^s_p,c_{p'}^{s'\dagger}\}=\delta_{ss'}\delta(p-p'),~ \{d_p^{s\dagger},d^{s'}_{p'}\}=\delta_{ss'}\delta(p-p') $$
于是,将上面得到的体系能量取正规乘积就有
$$ \begin{aligned} H & =\int d^3 x~ \mathcal H =i\int d^3x(\psi^\dagger \partial_0\psi)\\ & = \sum_s^{s=1,2}\int d^3p ~\omega(c^{s\dagger}_p c^s_p - d^s_p d^{s\dagger}_p)\\ & = \sum_s^{s=1,2}\int d^3p ~\omega(c^{s\dagger}_p c^s_p + d^{s\dagger}_p d^s_p - \delta(0)) \end{aligned} $$
粒子数表象
用箱归一化将上面的东西离散化,于是对易关系变为
$$ \{c^s_p,c_{p'}^{s'\dagger}\}=\delta_{ss'}\delta_{pp'},~\{d_p^{s\dagger},d^{s'}_{p'}\}=\delta_{ss'}\delta_{pp'} $$
定义粒子数算符
$$ N_p^s = c^{s\dagger}_p c^s_p $$
其本征态记作$\ket{n^s_p}$,那么有$N_p^s \ket{n^s_p} = n^s_p \ket{n^s_p}$
根据对易关系,所以有
$$ N_p^{s~2}=c^{s\dagger}_p c^s_p c^{s\dagger}_p c^s_p = c^{s\dagger}_p (1- c^{s\dagger}_p c^s_p)c^s_p=N_p^s $$
于是$N_p^s$只有0和1两个本征值。
同时我们容易知道,$c^{s\dagger}_p$是产生算符,$c^s_p$是湮灭算符。
算符$d_p^s$除了字母不一样以外没什么区别。
现在我们来考虑下两甚至多粒子态。
由于$[N_p^s,N_{p'}^{s'}]=0$,于是我们可以考虑不同状态下的共同本征态。比如
$$ \ket{1_p^s 1_{p'}^{s'}} = c^{s\dagger}_p c_{p'}^{s'\dagger} \ket 0 $$
由于$\{c^{s\dagger}_p,c_{p'}^{s'\dagger}\}=0$,所以
$$ \ket{1_p^s 1_{p'}^{s'}} = -\ket{1_{p'}^{s'} 1_p^s} $$
体系的两个粒子的交换是反对称的,一个单粒子态上只能有一个粒子(既能从粒子数算符的本征值只有0和1看出,也能从上面两个粒子交换反对称于是这样的态不存在看出)
这便成功地描述了Fermi子的物理。于是我们知道了,Dirac场描述的是Fermi子。
TODO
Peskin P481 对称性