北 京 通 信 学 会

    010-66499190

光子集成神经网络在光信号处理中的关键技术研究


光子集成神经网络在光信号处理中的关键技术研究


裴丽   左晓燕   白冰   王建帅

北京交通大学

光子算数(北京)科技有限责任公司


【摘要】   随着多业务的发展,数据量快速增长,迫切需要高集成度、低功耗、低延时的光信号处理器来满足大容量光通信系统高带宽、大容量、高性能需求。目前,光信号处理主要依赖以电芯片为基础的数字信号处理技术,随着摩尔定律逐渐失效和冯诺依曼架构访存墙的影响,电芯片在功耗和延迟性能优化方面逐渐遭遇瓶颈。近年来,以光芯片为基础的信号处理   技术备受瞩目,其具有大带宽、低延时、高集成度和高能效的特性。本论文分析比较了目前主流的多层感知机、卷积神经网络、脉冲神经网络和递归神经网络等几种光子集成信号处理芯片的特性。研究表明光子集成信号处理芯片在报头识别、信道均衡等任务中均能展现优越的性能,与传统的数字信号处理芯片相比,部分芯片可实现约2个数量级的处理速度提升。光集成处理芯片将作为一种不可或缺的技术路径支撑未来大容量光通信系统的建设。


一、引言

       随着视频流媒体、云服务、VR等数字技术的迅猛发展,对高速光通信系统信号处理的要求日益严格,涵盖了高吞吐量、大带宽、高稳定性和低延迟等关键要素。目前,数字信号处理(DSP)在该领域占据主导地位。经典DSP算法包括前馈均衡(FFE)、判决反馈均衡(DFE)、最大似然序列估计(MLSE)和Volterra非线性均衡(VNE)。然而,DSP电芯片基于冯诺依曼存算分离架构,其面临着处理速度和带宽限制。虽然对高性能DSP的研究仍在不断深入,但还远不能满足信号速率不断提升的需求。


       为了实现高效信号处理,研究者们借鉴人脑神经元连接模式提出了基于神经网络(NN)和深度神经网络(DNN)的信号处理器,网络类型包括多层感知机(MLP)、卷积神经网络(CNN)、脉冲神经网络(SNN)和递归神经网络(RNN)等。近年来,电域NN在信号处理领域不断取得新突破,在数字和模拟信号上都有卓越能力。例如,2021年,Brian Shevitski等人提出了一种DNN,具备传输信道校正和自动调制分类功能,可解调射频基带数字信号。在2019年,Serkan Kiranyaz等人提出了一种CNN,可直接处理模拟信号,如原始电流、电压和振动。当前电域NN在光信号处理领域面临的最大挑战是高计算复杂度。虽然有研究探索了简化方法,例如Diego Argüello Ron等人在2022年提出的一种基于剪枝优化NN的光信道均衡器,实验证明其能在不显著降低性能的基础上,将内存减少87.12%,复杂性降低78.34%。但是,其仍未解决电芯片架构问题。为突破此限制,需寻求新硬件架构,如开发基于更高性能光芯片的NN信号处理器等。


       光子集成器件具备大带宽、低功耗、低延时、小体积的优势,利用其实现NN光信号处理器是目前最具潜力的研究方向。其核心理论是采用具有耦合、调制、传导、探测等功能的光集成器件模拟NN中神经元之间的数据交互。2021年,Chaoran Huang等人提出了一种基于光子集成MLP的信道损伤补偿器,补偿了10080km海底光纤通信系统的非线性损伤,证明了光均衡器的高带宽特性。2018年,Florian Denisle Coarer等人提出了可实现25Gb/s光信号异或的光子集成RNN,其误码率(BER)低于2.5×10-4,功耗低于1mW,证明了光子集成NN优异的计算性能和高能量效率。


二、光子集成NN的主要器件

       光子集成NN主要由有源和无源器件组成。有源器件主要由InP和InGaAsP等具有直接带隙的III-V族材料制成,代表性器件是半导体光放大器(SOA)。无源器件主要由具有间接带隙的绝缘体上硅(SOI)和Si3N4等材料制成,其对互补金属氧化物(CMOS)工艺具有更高兼容性,更适于大批量加工制造,具备加工制造难度低、设计简洁、功耗低等优势,使无源光子集成NN成为目前主流趋势。几种典型的光子集成器件介绍如下:


       定向耦合器(DC)具有4个端口和一个耦合结构,如图一(a)所示。在耦合结构中,两路输入信号光发生耦合和干涉交换彼此的信息。其输入输出关系如公式(1)所示,假设DC分光比为50:50,且输入和输出端口是理想无反射端口。E1_inE2_inE3_outE4_out分别表示DC两个输入端口和两个输出端口的光场。LDC表示DC的插入损耗,以dB为单位。

公式一.jpg


       马赫-曾德尔干涉仪(MZI)由两个耦合结构和两个移相器组成,移相器常基于热光效应实现,如图一(b)所示。首先输入光信号在第一耦合结构干涉,然后通过带有移相器的两臂,最后,在第二耦合结构处再次干涉并通过第二个移相器。其输入输出关系如公式(2)所示,假设耦合结构分光比为50:50,且端口理想无反射。LMZ1是MZI以dB 单位的插入损耗。ψθ是两个移相器的相移量。E5_inE6_inE7_outE8_out分别是两个输入端口和两个输出端口的光场。

公式2.jpg

        微环谐振器(MRR)由微环和直波导组成,两者贴近的部分形成了耦合结构如图一(c)所示。光信号在该耦合结构交换信息并调整输出强度。其输入输出关系如公式(3)所示。Φ=βL是微环单程相移。L是微环周长。γ和κ分别是自耦合系数和交叉耦合系数。β是微环谐振模式传播常数。a是传输和耦合引起的振幅损失,E9,E10 表示光信号输入和输出端口光场。MRR也可在环上添加热调移相器,以增加节点非线性能力。

公式3.jpg

       

       半导体光放大器(SOA)是一种有源器件,如图一(d)所示。光信号通过有源区时,高能态电子返回基态,激发光子并放大光信号。当忽略插损且输入光信号为时,输出光场由公式(4)可得。其中, 分别是输入信号的幅度和相位,增益系数如公式(5)所示,是增益在SOA传输长度上的积分。是信号测量时间。

公式45.jpg

       

       多模干涉仪(MMI)基于多模波导自成像效应,由一个多模波导和几个输入和输出端口组成,分光比取决于多模波导的设计。2×2 MMI如图一(e)所示,它有2个输入端口和2个输出端口,假设分光比为50:50,其输入输出关系与50:50分光比DC相同,不再赘述。

图一.jpg

图一 几种典型光子集成NN器件。(a)定向耦合器;(b)马赫曾德尔干涉仪;(c)微环谐振器;(d)半导体光放大器;(e)多模干涉仪。


三、光子集成NN的结构设计

       在过去几十年里,研究者们探索了许多光子集成NN结构,主要包括MLP、CNN、SNN、RNN等。

       MLP各层之间节点全连接,层间信息传递基于矩阵乘法。通过光子矩阵计算,可以显著降低时延。2017年,Yichen Shen等人提出了一种可实现光学矩阵计算的光子集成芯片,并基于此实现MLP, 如图二(a)所示。在数学上实值矩阵可分解为两个酉矩阵,和一个对角矩阵,即。在光学上,酉矩阵可用MZI阵列来实现,通过改变MZI上移相器来为光学酉矩阵赋值,对角矩阵基于只有单个移相器的MZI实现,非线性激活在电域实现。由于集成光子器件优势,其功率效率比电芯片提高了3个数量级。2017年,Alexander N.Tait等人提出了一种由硅基MRR阵列构成的光子MLP结构,如图二(b)所示。光学矩阵计算基于多波长MRR阵列实现,通过调整MRR上热调相移器配置光学矩阵参数,不同波长信号在总线波导上汇集为最终计算输出。非线性激活通过光探测器和马赫曾德尔调制器(MZM)组成的反馈回路实现。比较两种MLP实现方式可知,MZI结构片上面积大,但是单波长结构简洁、易实现,MRR结构片上面积小,但是多波长方案复杂,需多个激光器,实现难度大。

图二.jpg

图二 几种典型光子集成NN实现方案。(a)基于MMI的MLP;(b)基于MRR的MLP;(c)基于光滤波器和延时波导的CNN;(d)基于PCM和光孤子微梳的CNN;(e)基于PCM和MRR的SNN;(f)基于VCSELs-SA的SNN;(g)基于SOA和延时波导的RC;(h)基于MMI和延时波导的RC。

       光子集成CNN的核心是设计光学卷积核与光学缓冲存储器。Hengameh Bagherian等人在2018年提出了一种使用光学滤波器作为卷积核,光学延迟线作为缓冲存储器的CNN,原理如图二(c)所示。其通过将不同分块区域的图像矩阵光信号与光学卷积核相乘得到某层卷积结果,乘法采用上述MZI光矩阵运算方案。相比于电计算,光卷积有更高能量效率,单次推理功耗仅为2mJ。2021年,J.Feldmann等人提出了一种基于可并行处理光子张量核的CNN,如图二(d)所示。它使用相变材料(PCM)存储器阵列和光孤子微梳实现并行卷积计算,其中输入向量编码在Si3N4光孤子微梳上,其上不同波长信号发送到相应的矩阵输入波导,波导上的PCM实现光矩阵参数配置。它能够在14GHz带宽下每秒运行万亿次乘加(MAC)运算。对比上述两种CNN可见,第一种采用单波长设计,结构简单,但基于硅材料,插损高。第二种采用多波长设计,具有PCM贴片,加工难度大,但此结构基于Si3N4波导,插损低,使用平行运算设计,处理效率高。

       光子集成SNN使用了片上光学组件,如MRR、WDM复用解复用元件和PCM实现神经元积分和激发功能。其代表性工作是J.Feldmann等人在2019年提出了的一种具有140个光学元件的SNN,如图二(e)所示。该光学SNN结构包括4个PCM神经元和60个MRR突触,能以有监督和无监督方式执行光信号模式识别。Ziwei Song等人在2023年提出了一种具有高控制精度的可重构和可编程混合集成SNN结构,如图二(f)所示。线性计算部分由4×4MZI阵列作为权重矩阵实现。非线性计算部分由作为凸出的嵌入式可饱和吸收体阵列和作为神经元的垂直腔面发射激光器(VCSELs-SA)构成。从上述两种SNN可见,第一种使用无源MRR,能量效率高,但受限于PCM可调精度。第二种使用激光器,控制精度高,计算速度快,但是实现难度大、功耗高。

       RNN通过节点延时单元和循环连接机制使网络具备记忆长度。鉴于光子集成RNN后向反馈训练难的问题,RNN中仅需训练读出层的储备池计算(RC)发展迅速。2011年,Kristof-Vandoorne等人提出了一种以SOA为节点的RC结构,如图二(g)所示。它使用平面旋涡状拓扑,每节点只与相邻4个节点相连,非线性激活基于SOA饱和曲线。2014年,Kristof-Vandoorne等人提出了一种基于MMI的无源RC结构,如图二(h)所示。对比两种RC可见,有源RC的SOA节点自带非线性激活,但其与CMOS不兼容、制造难度高、功耗大。无源RC功耗低,但其只能依靠光电探测器添加薄弱非线性。

       光子集成NN具有高集成度、大带宽的优势。然而,该领域的研究也面临着缺乏合适的光学非线性激活函数、光子硬件配置以及光存储介质的挑战。


四、光子集成NN在光信号处理中的应用

       利用光子集成NN进行高速率、低能耗的光信号处理,成为支持片上全光信号处理和噪声均衡的有效途径。

图三_副本.jpg

图三 几种基于光子集成NN的光信号处理器,可实现的光信号处理任务包括(a)报头识别;(b)XOR校验;(c)OOK信号非线性损伤均衡;(d)WDM PAM4光信道损伤均衡;(e)OOK信号全光损伤均衡;(f)OOK信号色散、ASE噪声均衡。

       在光信号处理中,报头识别、异或(XOR)校验是重要任务。利用光子集成NN在光域识别报头可实现高速光数据包路由。Kristof Vandoorne等人在2014年设计了一种基于MMI和延迟波导的RC结构,如图三(a)所示。该结构在实验中展示了12.5Gb/s的5bit报头识别性能。2018年,Florian Denisle Coarer等人提出了一种可实现光学信号XOR任务的基于MRR的RC结构,如图三(b)所示。当其注入功率低于1mW时,20Gb/s NRZ信号XOR计算的BER为2.5×10−4。相比以MMI为基础的RC,此结构片上面积更小。

       在光信号均衡方面,2021年,Stijn-Sackeyn等人提出了一种基于MMI的RC信道均衡器,如图三(c)所示,可有效均衡32Gb/s OOK信号在单模光纤25km传输中产生的非线性失真,BER低于硬判决前向纠错(HD-FEC)0.2×10−3限值。2023年,Benshan Wang等人提出了一种基于不同谐振波长MRR的RNN结构,如图三(d)所示。其在无模数转换(ADC) 的WDM PAM4系统中可直接处理光信号,信号Q因子上升了0.757dB,与DSP芯片相比,其在均衡50Gbaud传输20km的损伤时,计算速度提升2个数量级。

       本研究团队在光子集成RC结构的信道均衡设计方面开展了深入研究,主要工作如下:

       首先,研究了基于4*8矩形RC结构的全光均衡器,如图三(e)所示,用于均衡光纤通信信道中混合的线性和非线性失真。该结构中使用DC作为储层节点,并且为输入输出节点设计了6端口三元DC器件。读出层采用全光设计,以MZI作为光学权重单元,使用特殊设计的两层式粒子群优化(PSO)算法训练光学权重。在25Gb/s OOK信号经单模光纤25km传输后,未均衡信号BER=1.65×10-1,均衡后BER= 9.15×10-5,误码率改善了3个数量级。可将其置于接收机前进行损伤预处理,以降低计算复杂度。

       其次,研究了基于52节点八边形RC的均衡器,如图三(f)所示,用于均衡色散和放大自发辐射噪声(ASE)噪声及单模光纤传输损伤。光储层仅使用简单4端口DC和波导延迟线,输入输出端口仅在外层节点,有助于最小化交叉波导器件带来的损耗与串扰,读出层采用岭回归算法训练。仿真结果表明,均衡器在IMDD系统中可以很好地抑制色散和ASE噪声。在25Gb/s OOK信号,SSMF传输25km链路上,已均衡信号BER=2.31×10-5,比未均衡BER=1.59×10-1优化了3个数量级以上。其在10-40Gb/s速率和5-40km SSMF损伤条件下均具有一定均衡能力。


五、总结与展望

       本文介绍了光子集成NN及其在高性能光通信领域的最新进展,包括基础架构组件,结构搭建方案及光信号处理应用。虽然其发展仍存在以下技术瓶颈:第一,高频光非线性器件缺失;第二,光芯片大规模集成调控难度大;第三,全光处理芯片的可编程和调控性能受限。但是,与DSP芯片相比,光子集成NN芯片具备更低的延时和能耗优势,在低延迟、高性能光信号处理领域将具有广阔的应用前景。


【作者】


裴丽,北京交通大学教授、博士生导师;主要从事光电子器件及光集成芯片、人工智能领域的研究;主持国家级和省部级科研项目 20余项,发表 SCI、EI 论文200 余篇。


左晓燕,北京交通大学在读博士研究生;主要从事光神经网络、光集成芯片,光通信信道均衡领域的研究。



白冰,北京交通大学讲师;主要从事硅光集成计算器件、光电融合计算架构和神经网络算法等领域的研究;已申请专利 10余项。




王建帅,北京交通大学副教授;主要从事特种光纤及大容量光通信关键技术领域的研究,主持和参与国家级和省部级项目10余项;发表SCI论文60余篇。





文章分类: 期刊
分享到: