背景介绍
石墨烯因其独特的二维蜂窝状晶格结构以及优异的电学、力学和热学性能,在材料科学、能源存储、电子器件和生物医学等领域受到广泛关注。然而,随着石墨烯研究的快速发展,相关文献数量急剧增长,研究内容也横跨物理、化学、材料和工程等多个学科,给研究人员带来了知识检索、文献整合和实验设计方面的挑战。尽管通用大语言模型在科研辅助中展现出潜力,但其在高度专业化的石墨烯研究中仍存在专业知识不足、回答缺乏深度和文献依据不充分等问题。相比之下,领域专业模型可以通过领域语料微调和任务对齐,将专业术语、实验逻辑和文献证据更好地融入模型回答中,从而在特定科研场景中提供更准确、更可验证、更符合领域规范的智能辅助。然而,目前已有的领域专业模型多集中于科学知识挖掘、信息抽取等任务,面向石墨烯这一高度专业化研究领域的大语言模型仍相对空缺。

图1. 石墨烯研究面临的主要挑战及 GrapheneChat 的整体开发流程
文章亮点
近日,浙江大学宋秀菊团队联合北京大学、剑桥大学等单位,开发了首个面向石墨烯研究的专业微调大语言模型GrapheneChat。GrapheneChat针对石墨烯研究中专业知识门槛高、实验设计复杂和文献数量庞大的问题,构建了集领域知识问答、实验辅助和文献分析于一体的智能科研助手。该模型以Llama-3.1-8B-Instruct为基础,通过石墨烯领域数据集训练,使通用大语言模型能够更好地理解石墨烯合成、表征、性能和应用等专业问题。GrapheneChat以较小参数规模的开源语言模型为基础,专注于石墨烯这一高度专业化研究方向,能够提供更加聚焦、准确、可验证且符合科研语境的专业回答。相比大型闭源通用语言模型,这种轻量化领域专业模型也有助于降低算力资源需求和部署门槛。

图2. GrapheneChat 的数据集构建与模型训练流程
为进一步提升模型在石墨烯研究中的专业性和可靠性,该课题组从约500篇石墨烯相关研究论文和7部专业著作中提取知识,并利用GPT-4o-mini自动生成问答数据。随后,研究人员通过语义聚类方法去除无效内容和冗余数据,最终获得9550组高质量问答数据。在此基础上,GrapheneChat采用监督微调(supervised fine-tuning, SFT)和直接偏好优化(direct preference optimization, DPO)两阶段训练策略:前者用于注入石墨烯领域知识,后者用于提升回答的科学性、逻辑性和专业表达。此外,模型还引入检索增强生成(retrieval-augmented generation, RAG)框架,使其能够从用户上传的文献中检索相关内容,并生成具有文献依据的回答。

图3. GrapheneChat 在 GrapheneBench 上的定量评估结果
在应用展示中,GrapheneChat能够回答PMMA/PSAF辅助转移、rGO-NiPO光催化机制等石墨烯专业问题,并可为液相剥离法制备石墨烯生成包含实验原理、材料设备、关键参数、操作步骤和安全提示的实验方案。与此同时,GrapheneChat还可以基于用户上传文献进行动态分析,例如准确回答氧化石墨烯中碳原子的sp²和sp³杂化状态。为定量验证模型性能,研究团队构建了石墨烯专用测试集GrapheneBench,覆盖合成、表征、性质和应用四个方向。结果显示,GrapheneChat的总体准确率达到91.0%,显著优于未经微调的基础模型,并与GPT-4等闭源模型表现相当。值得注意的是,这一表现是在8B参数开源模型基础上取得的,说明经过领域数据微调后,参数规模相对较小的专业模型也能够在特定科研任务中接近大型闭源通用模型的表现,在较低计算资源需求下实现高水平专业能力。
总结/展望
该工作开发了专门面向石墨烯研究的微调大语言模型 GrapheneChat,展示了领域专业大语言模型在材料科学研究中的重要潜力。GrapheneChat表明,参数规模相对较小的领域模型也能够在特定科研任务中达到接近大型闭源语言模型的表现,从而降低计算资源需求和部署门槛。对于高校课题组、科研机构和企业研发部门而言,这类领域专业模型还具有更强的可定制性,可结合内部文献、实验记录或专有数据构建私有知识库,在提升科研效率的同时降低潜在数据泄露风险。该研究提供了一套可迁移的领域大模型构建范式,未来可进一步扩展至其他材料和细分科研领域。随着多模态大语言模型的发展,类似GrapheneChat的科研助手有望进一步整合论文文本、显微图像、光谱数据和实验记录,为材料科学研究提供更加全面的智能支持。
相关论文发表在期刊ACS Nano上,浙江大学博士研究生杨鼎隆和卢成宇为文章共同第一作者,宋秀菊研究员为通讯作者。
通讯作者信息:
宋秀菊 研究员
宋秀菊,女,浙江大学机械工程学院“百人计划”研究员,博士生导师,玛丽居里学者,入选国家高层次青年人才计划。2020年获欧盟委员会玛丽居里学者项目资助;2023年5月全职加入浙江大学机械工程学院。研究方向主要包括:AI for materials,即人工智能驱动的纳米材料合成、表征与应用,涉及机械、化学、材料、微电子、计算机等多学科高度交叉领域,已发表SCI论文50余篇,H因子28,总引用次数超过6000次,相关成果发表于Nature, Nature Materials, Nature Communications, Advanced Materials, ACS Nano, Nano Letters, International Journal of Mechanical Sciences, Advanced Intelligent Systems, Advanced Materials Technologies, Small, Nano Research等期刊。担任Science Bulletin及《科学通报》邀编委, Information & Functional Materials、《中国机械工程》青年编委,并担任Nature Communications, ACS Nano, Applied Surface Science, Nanoscale Advances等期刊审稿人。
课题组主页链接:https://person.zju.edu.cn/songxiuju
英文原文
英文原题:GrapheneChat: A Large Language Model for Enhancing Graphene Research
通讯作者:宋秀菊,浙江大学流体动力基础件与机电系统全国重点实验室
作者:杨鼎隆,卢成宇,冯毅雄,毛卫明,王康,孙禄钊,王琰,胡炳涛,谭建荣,刘忠范,宋秀菊
ACS Nano. 2026, 20, 9970–9982
Publication Date: March 13, 2026
https://doi.org/10.1021/acsnano.5c21335
本文来自ACS期刊资讯,本文观点不代表石墨烯网立场,转载请联系原作者。