2月15日,周六,东莞松山湖材料实验室的一间办公室里,松山湖材料实验室/中国科学院物理研究所研究员、博士生导师刘淼打开电脑,进入MatChat页面,输入某一无机材料的疑问,然后轻点鼠标,屏幕上跃出一串化学反应方程式——准确、“无幻觉”,同时可以溯源,导向原始论文。
这个由10人“非主流”团队历时7年打造的AI助手MatChat,今年2月9日正式上线,引来业界人士的高度关注,未来有望颠覆无机材料的科研范式,在人工智能时代,开启科研新范式。
人工智能大模型的风吹入无机材料领域。
“落地东莞松山湖以来,经过7年的研发,2023年下半年开始,我们全力投入这一无机材料AI助手的研发,今年2月9日上线首周即吸引超5000名用户注册,26万次专业提问。”刘淼在接受东莞日报独家专访时表示,这一大模型的成功上线和松山湖材料实验室体制机制创新,以及东莞和松山湖大力支持密不可分。
▲松山湖材料实验室/中国科学院物理研究所研究员、博士生导师刘淼
提取超过28万篇科研论文,打破AI“幻觉”
“2018年我刚来到松山湖材料实验室从事科研工作时,就喜欢上东莞的气候环境。”2月15日,在松山湖材料实验室的办公室里,刘淼告诉记者。
2018年松山湖实验室成立之初,便前瞻性地意识到数据和人工智能的重要性,成立了材料计算与数据库平台。
2023年初,ChatGPT3.5火起来后,刘淼敏锐地发现这一大模型解析文字的强大功能。
2023年6月,国外科学家利用一种叫做“自然语言处理(NLP,natural language processing)”的人工智能技术,从400万篇论文提取了3万条材料合成方案数据;与此同时,美国的meta公司发布了一款开源大语言模型。
▲MatChat AI首页
刘淼团队看到了机会,将二者结合,研发了专注于无机材料合成路径预测的初代AI工具—MatChat。“当时团队在这类模型基础上进行再训练后发现,模型可以帮科研人员配好化学反应方程式,大大提升工作效率。”
这些初步的尝试展现出大语言模型在材料领域的创新潜力和应用空间,为材料研究和创新带来了新的启发和思路。初代MatChat论文,发表在《中国物理B》,是目前最受欢迎的论文之一。
初代MatChat模型并不完美。科研工作对于准确性的要求极高,但是大语言模型普遍存在的“幻觉”问题,给出的答案存在“臆想”。在业界,幻觉是指大型语言模型(LLM)在缺乏事实依据时,自发生成看似合理实则错误的内容。这种现象如同人类做梦时的无意识创造,被形象地称为“幻觉”。
另外一个问题是如何增加信息量,让模型掌握更多“知识”。“‘投喂’给大模型的数据越多、越准确,模型会变得越‘聪明’,这是人工智能的规模化法则(scaling law)。”刘淼表示。
随着技术的发展,两个问题都有了解决方案。利用“检索增强生成(RAG)”技术,可以避免“幻觉”问题。为解决“数据问题”,刘淼团队把目光投向预印本(Preprint)。
预印本是指科研工作者的研究成果在尚未经过正式出版物发表之前,出于与同行交流的目的,自愿先在学术会议上或通过互联网发布的科研论文、科技报告等文章。相当于为研究成果打上“时间戳”,确立科研发现的优先权。
“预印本论文通常具有高质量、高准确性,以及创新性的特点。”刘淼表示,“同时,它们也都是开源论文,规避了文献数据的版权争议。”扫清障碍后,MatChat模型开始了再次进化。2024年底,MatChat完成所有准备工作,并在2025年2月9日正式上线。
新版MatChat AI基于大语言模型(LLM)与检索增强生成(RAG),提取了超过28万篇材料科学、物理、化学论文中的知识,形成了无机材料领域的庞大知识库。
“作为一款专注于材料科学领域的智能问答引擎,上线一周来,MatChat AI总用户数已经超过5000人,42%的用户超过10次对话,获得广泛关注和应用。”刘淼表示。
科研新范式引起业界高度关注
2025年春节,DeepSeek大模型问世,瞬间爆火全球。
与DeepSeek等其他通用大模型不同的是,MatChat AI是一款完全侧重于无机材料领域的垂类模型。
用户可以通过对话形式,获取知识库中的材料科学内容。例如:“热电应用中有哪些不错的材料体系?”“高温超导体有哪些材料体系?”“Bloch波方法中,是否可以通过电子束衍射强度求解结构因子?”MatChat AI均可给出可靠的答案。
“挺好的,在我查的电子衍射方面的东西,内容不比通用模型差,而且更简洁,文献基本都准确。通用模型的文献有一半左右是假的。”中国科学院研究员姚湲此前评价道,“我问了一些专业问题,竟然还给出了公式推导,很强。”
中国科学院赣江创新研究院研究员王路告诉记者,作为材料科学领域的智能“智囊团”,它助力研究人员快速获取高质量学术信息,让科研更精准、高效,推动自然科学迈入智能新时代,“作为学术研究工作者,我更倾向于用MatChat,答案都是基于科技论文的结果,而不是乱说的。”
MatChat不是终点,是科研新范式发展的起点
DeepSeek同样为MatChat的进化带来帮助。
在刘淼看来,DeepSeek-R1上线之后,其强大的语言理解能力和逻辑思维能力同样被团队采用,推动MatChat AI进化升级。“同时,MatChat大模型还运用了ChatGPT和通义千问等优秀大模型的功能,取其优势,自成一体。”
成功推出MatChat大模型的背后,是一支勇于打破学科壁垒的“非主流”团队。
在这个10人的小团队里,材料学家与IT极客并肩作战,物联网专家为机器人车间注入灵魂,这种“混血基因”催生出独特的创新生态,同步孵化出机器人车间、Atomly大模型等协同平台,初步形成“迸发灵感-利用平台找材料-实验验证-得出数据”的全链条研发生态,打破传统科研工作的范式。
“可以说,这个大模型是跨界碰撞出的火花。”刘淼揭秘团队建设哲学,这种柔性人才机制,恰是松山湖实验室创新平台与创新主体实力的一个缩影——跨界才能破界,重构才能催生新的物种。
“这一大模型的成功上线和松山湖材料实验室体制机制创新,以及东莞和松山湖大力支持密不可分。正是有了这一宽松的科研环境,才让MatChat顺利问世。”刘淼坦言,MatChat不是终点,是科研新范式发展的起点。
与此同时,中国科学院院士、松山湖材料实验室主任汪卫华向记者表示,“我深信人工智能还将为科学插上翅膀,让科学飞得更快。我们团队一直在这个领域探索,MatChat还只是一个前奏,未来还将会有一系列激动人心的进展。”
未来,MatChat将拓展多语言交互与跨材料预测能力,而它的真正价值,则为当前高水平科技自立自强提供了可复制的范式:通过机制破壁释放人才活力,依托垂直深耕在人工智能时代先行一步。
在AI重构科研范式的浪潮中,这场始于松山湖的“材料革命”,正悄然推动行业向人工智能时代跃迁。刘淼希望,这一大模型能够给无机材料的从业者带来帮助,助力行业发展,同时能够在AI时代,给科学界AI赋能发展提供一个有益的借鉴和参考,共同助力我国科技高水平自立自强。