一句话总结
丹麦理工大学Kristian S. Thygesen以评论(Comment)形式指出二维材料领域实验知识碎片化的问题,介绍了已建立的实验二维材料数据库 X2DB(Experimental 2D Materials Database)——通过文献挖掘与人工校验将已合成的二维材料与计算数据库关联,并提出应将其发展为持续更新的社区共建”活数据库”,以指导未来二维材料的理性设计与合成。相关工作发表在Nature Reviews Materials。
拟解决的关键科学问题
二维材料自石墨烯发现以来已扩展至过渡金属硫族化合物(TMDs)、氮化硼、MXene、氧化物及非范德华层状材料等数百种,但其合成方法、结构归属和表征证据分散于数千篇独立论文中,难以系统获取。当前二维材料发现的瓶颈已从”是否存在原子级薄晶体”转向”如何在广阔化学空间中高效筛选与合成”。理论计算多采用理想化的自由-standing单层模型,而实验中材料常受基底稳定、表面终端、非化学计量比等因素影响,二者存在结构性鸿沟。缺乏统一的实验数据整合平台导致无法系统学习已有合成经验、无法有效验证理论稳定性判据,也阻碍了对未探索化学家族的理性预测,因此亟需建立共享的实验数据库。
文章内容
二维材料亟需共建共享的实验知识库
二维材料领域的研究方向数不胜数,但行业缺少一套系统化、可共享的实验知识沉淀体系。梳理已成功制备的材料、对应的合成工艺,并打通其与理论计算预测结果之间的关联,或将引领下一代材料发现工作。二维材料研究已产出海量文献。数百种材料可通过剥离、生长、刻蚀等手段制备出原子级薄层结构,诸多材料在电子、光子、量子、传感器件领域展现出巨大应用潜力 ¹。然而,各类合成工艺、结构标定、表征验证数据分散在数千篇论文中,研究者很难系统梳理已实现的实验成果(图 1 左)。实验知识碎片化已成为行业发展瓶颈,且二维材料研发的核心难点正在发生转变。早期二维材料研究的核心目标,是证明原子薄层晶体能够稳定存在并具备实用性能;如今,研究范围早已突破石墨烯、六方氮化硼、过渡金属硫族化合物,拓展至氧化物、卤化物、MXene、非范德华材料等化学体系,待探索的材料空间大幅拓宽 ²⁻⁴。当下的核心问题不再是 “是否存在更多二维材料”,而是本领域能否系统性总结已有实验成果,并依托这些经验指导后续新材料研发。本文将探讨二维材料领域实验知识碎片化的痛点,并介绍已发布的二维材料实验数据库(X2DB):该数据库系统整理所有经实验验证的二维材料,并建立其与理论计算数据的关联。基于此,本文提出:行业应搭建可动态更新、全员共建的共享实验数据库,以此支撑二维材料的创新发现。
一、实验数据与理论计算数据的核心差异
现有二维材料知识体系存在结构性割裂:理论计算中的单层模型大多是自由悬浮、化学计量比完美、无缺陷的理想晶体;但实验制备的二维材料往往存在衬底支撑、表面化学修饰、层间插层、动力学亚稳态、非化学计量比、多晶型,或是仅能制备少层结构等特征。理论研究通常忽略上述关键细节,而这些细节恰恰决定材料能否被制备、具备何种性能⁵。除此之外,绝大多数二维材料的稳定存在形式、晶体物相,都与合成方法、衬底、微观形貌深度绑定。同一种化学组分,随制备工艺与条件不同,可形成多种多型结构;自由悬浮状态下不稳定的单层材料,在特定衬底上可实现稳定;MXene 仅在特定表面端基修饰下能够稳定存在;非范德华材料只能通过化学剥离或选择性刻蚀制备,无法采用机械剥离。数据库仅收录材料化学组分远远不够,必须完整记录上述实验条件信息。
二、二维材料实验数据库(X2DB)的构建思路
为解决上述痛点,X2DB 整合了经人工整理、实验验证的二维材料文献数据,并打通第一性原理计算数据库接口(图 1 中)。数据库采用统一分类体系,完整记录材料组分、晶体结构、微观形貌、合成方法、衬底类型、表征手段、实测性能等全部实验信息。数据库上线之初,通过文献挖掘、人工结构核验、科研社群自主上传,共收录 370 种可制备单层 / 少层结构的独立化合物。X2DB 采用 “材料 – 文献” 一一对应的条目模式:同一化合物可对应多条实验记录,每条记录绑定一篇独立研究论文。针对研究较为充分的经典材料,数据库能够完整汇总不同文献中报道的多种合成路线、表征方案与实测性能差异。X2DB 内每条实验条目均可关联二维材料计算数据库(C2DB) 中对应的单层理论模型⁷。绑定单层结构后,系统会自动匹配对应的双层同质结构、母体块体材料及其他计算数据库资源。实验与理论模型的匹配关系由上传研究者标注置信度;该置信度指标至关重要 —— 实验与理论材料的对应关系并非总能简单匹配,二者的关联本质是带有溯源、可信度标注的科学论断。
三、依托实验 – 计算联动数据挖掘研究规律
打通实验与计算数据后,可开展纯实验数据库或纯理论数据库无法实现的科研分析。例如,利用 X2DB 验证各类理论稳定性能判据在实际可制备二维材料上的适用性,明确现有理论模型的优势、缺陷及背后成因。X2DB 中约 200 条高置信度匹配理论模型的实验材料,绝大多数凸包能值较低,说明相较于其他竞争块体物相(含混合相),这类材料热力学稳定性更优;但也有部分材料能值明显高于热力学稳定材料的预期值。针对这类异常样本,可通过数据库溯源判断其稳定来源:衬底束缚、动力学亚稳态捕获、表面钝化修饰,或是其他机制。实验与计算数据联动同样适用于机器学习建模。仅基于理想单层模型训练的算法,只能在纯理论体系内预测材料性能,无法判断某一材料能否通过分子束外延、晶体剥离、金属衬底生长、选择性刻蚀等工艺制备⁸⁻⁹。若要拓展机器学习模型的实用价值,训练数据集必须纳入完整合成背景信息。
四、规范数据整理,推动数据库长效运营
行业需要转变科研思维:仅依靠已发表论文搭建共享实验数据库,会丢失大量关键实验背景信息。不同文献的术语、数据详实程度、合成与表征记录格式差异巨大,X2DB 虽迈出了标准化整理的第一步,但数据库的价值取决于持续扩容与社群提供的完整元数据。每一篇实验论文不仅是材料或新现象的成果展示,更是构建合成工艺、适用化学体系全景图谱的数据样本。与此同时,全行业需建立常态化的数据归档机制,将数据库整理纳入新型二维材料成果的标准发布流程。鼓励作者在发表新二维材料成果时,同步向 X2DB 等公共资源上传标准化元数据,就像固体化学领域普遍随论文上传晶体学信息文件(CIF)一样。这类数据上传既能提升实验成果的复用价值,也能为理论研究者提供基准数据集,优化材料高通量筛选模型。期刊编辑、科研资助机构、高校院所应认可数据库共建、数据整理工作为正式科研产出;数据库开发团队也需降低用户上传门槛、清晰标注数据贡献者、支持如实记录实验不确定性,而非掩盖数据偏差。一套全员共建、持续更新、联动理论计算资源的动态实验数据库,将重塑二维材料研发范式(图 1 右)。该数据库可挖掘尚未充分探索的化学材料体系、为理论预测材料匹配可行合成路线、筛选适配特定晶体结构的衬底,同时建立材料可剥离性、稳定性、可制备性模型的评价基准。对于领域新人,数据库也能省去逐篇回溯文献梳理行业发展史的繁琐。二维材料的发现始终离不开实验创新与化学直觉,但依托海量共享实验数据,科研直觉才能发挥更大价值。二维材料研究的下一阶段,不能只聚焦 “能计算出什么、能合成出什么”,更要思考 “从过往所有实验中能总结出哪些规律”。想要实现这一转型,二维材料领域不仅需要更多新型化合物,更需要一套共建共享的实验知识库。

图 1 左侧——传统模式下二维材料的合成路线、结构及性质分散于各独立论文中;中间——X2DB 整合已报道的实验实现二维材料并链接至计算单层、双层及块体结构数据库;右侧——由此形成的反馈环路可实现合成趋势统计分析、稳定性描述符基准测试及数据驱动的未来实验靶标筛选,X2DB 可通过社区上传持续扩充。
文章链接:https://doi.org/10.1038/s41578-026-00938-y
本文来自芯事,本文观点不代表石墨烯网立场,转载请联系原作者。