
导读
非线性激活函数是构建复杂网络表征、避免梯度消失或爆炸的关键,但现有技术方案无法兼顾能耗、响应速度与激活函数可重构的需求。近日,浙江大学、西湖大学、北京大学等联合团队融合硅的克尔效应与石墨烯的饱和吸收特性,成功研发出石墨烯 – 硅集成光子晶体微腔全光非线性激活器,提出片上皮秒脉冲光神经网络架构。该器件实现飞焦级超低能量阈值、皮秒级超高速响应,支持多类型非线性激活函数灵活可重构,性能超同类器件两个数量级。这一突破补全了全光非线性激活器低阈值、高速响应与可重构之间的技术盲区,为光计算的核心功能单元提供了新方案。相关研究成果以“Femto-joule threshold reconfigurable all-optical nonlinear activators for picosecond pulsed optical neural networks”为题发表于《Light: Science & Applications》。
研究背景
人工智能的快速发展对计算系统的速度与能效提出了更高要求。传统电子计算的冯诺依曼架构由于存算分离导致数据搬运能耗高,且串行计算的速度受限于处理器主频,这些根本性的架构限制使得传统计算方式难以满足AI技术的发展需求,其算力密度难以突破 1 TOPs/W/mm²。光计算作为一种新兴的计算范式,利用光子作为信息载体,凭借其天然的并行性、超低传输能耗和光速处理能力,展现出突破现有计算瓶颈的巨大潜力,被认为是应对AI超大规模数据处理需求的重要技术发展方向。
光神经网络的核心计算包含线性加权与非线性激活两大环节。其中,非线性激活函数是构建复杂网络表征、避免梯度消失或爆炸的关键,但现有技术面临严峻挑战:光电型激活器件依赖电光转换,存在集成密度低、功耗高、响应迟缓的问题;全光型激活器件虽集成度更高,却难以同时满足低阈值、高速响应与动态可重构三大核心需求,制约了光计算的实用化进程。
创新研究
团队首先设计了一种具有梯度占空比的硅光子晶体微腔如图1所示,借助光子晶体的慢光效应提升光泵浦效率,将器件尺寸压缩至 15 μm×10 μm,为高密度光计算芯片集成奠定基础。
更进一步的,团队通过光子晶体微腔的谐振来增强克尔非线性效应,在不同波长下实现器件透射率随入射光功率变化的多种非线性响应(如图2所示),解决了全光非线性响应难以实现可重构的问题,器件的非线性响应阈值在百飞焦量级。
为了实现更强的非线性响应,进一步降低器件激活阈值,提高能效比,团队通过将器件与石墨烯异质集成,借助石墨烯的可饱和吸收效应(如图3所示),实现饱和吸收能量阈值低至 4 fJ、响应时间仅 1.05 ps。
异质集成后,器件不仅可以构建出类线性、ReLU 类、Sigmoid 类等多种非线性激活函数,其非线性激活阈值可达到 30 fJ、响应时间 4 ps,如图5所示,核心性能指标超越同类全光激活器件两个数量级,达到国际领先水平。
最后,团队还提出了一种基于皮秒脉冲光的波分复用神经网络计算架构,该架构利用逆设计波分复用器实现多波长复用,利用相变材料实现近零功耗的权重计算,并借助于超快脉冲激发器件的非线性响应,与上述所提出的全光非线性激活器相适配。该架构具有高算力密度、全光计算等优势,为下一代光计算提供了新方案。
总结与展望
研究人员创新性的提出了利用脉冲光实现全光可重构非线性效应的方法,通过将多种非线性效应与光子晶体微腔结合,突破了全光非线性激活器件难以实现可重构的局限,成功实现了飞焦级超低阈值,皮秒级响应时间以及灵活的激活函数可重构。该器件能够集成于光计算芯片,广泛应用于深度学习领域,为未来的人工智能训练提供高能效比的计算解决方案。
未来,通过能带设计、工艺优化等方法,有望进一步降低非线性激活器件的能耗,提高能效比。作为高性能集成光计算系统的核心功能单元,该技术突破为光神经网络的实用化铺平了道路,有望推动人工智能领域形成低功耗、超高速的新型计算范式,助力更多核心技术场景的算力升级。
论文信息
Liu, R., Wang, Z., Zhong, C. et al. Femto-joule threshold reconfigurable all-optical nonlinear activators for picosecond pulsed optical neural networks. Light Sci Appl 15, 128 (2026).
https://doi.org/10.1038/s41377-025-02175-4
本文来自LightScienceApplication,本文观点不代表石墨烯网立场,转载请联系原作者。