她叫王笑楠,17 岁读清华,27 岁担任博士生导师,辗转海外留学和任教之后,又回到母校清华化工系担任副教授。
图 | 王笑楠(来源:王笑楠)
她的研究工作与近日发布的《麻省理工科技评论》2022 年“全球十大突破性技术”多项内容紧密相关,包括智能化碳捕集和利用、清洁能源、AI 数据生成、加密计算和各个前沿场景的应用等等。2021 年,她曾入选由 Elsevier 旗下 Mendeley Data 发布的“2020 年度科学影响力排行榜”,并受邀担任多本国际期刊的副主编和编委,斩获多项国际青年大奖。
2022 年伊始,她和团队开年即迎“大丰收”,一口气在顶刊连发多篇论文。他说这是组建“智慧系统工程”团队五年来的积累,赶在虎年开局迎来了厚积薄发。其表示:“这些工作旨在面向实际应用,将人工智能技术和行业深度结合,提供了一种新材料研发的全新范式。我们将材料研发的全生命周期大大提速,实现了从‘鸟枪法’到‘地毯式搜索’的转变,由‘钓鱼’变为‘打渔、网鱼、养鱼’,以科学的设计和预测指导实验,而不是盲人摸象地试错。”
针对器件尺度,开发三段式机器学习框架
以该团队近期发表在 Nature Machine Intelligence 的论文为例,他们针对器件尺度,开发出一个三段式机器学习框架[1]。
它能用于构建预测模型,可从初始纳米材料设计入手,在 0.5% 到 350% 的应变范围内自主设计传感器的性能。借此解决了机器学习辅助的纳米复合材料设计、以及软体机器人应变传感器领域存在的长期挑战。另外,该工作通过混合制造方法,同时采用实验室材料制造和虚拟数据增强计算,来解决新材料实验数据不规范、数据量少等挑战,在器件层面则构建出机器学习模型,以实现针对不同软体机器应变传感器的自动化设计。
对于上述三段式机器学习框架的能力,王笑楠表示即使在小样本数据下,它也能在 0.5%-350% 的应变范围内实现传感器的自动化设计,最终可实现以下两种自动化、智能化的交互设计:第一,可根据制造配方来预测传感器的性能;第二,则可为各种软体机器人的不同需求,推荐适合的传感器制造配方。
另外,他们利用统计分析工具,对收集到的传感器特征数据进行分析,揭示了潜在的材料作用机制,挖掘到隐藏在数据背后的新型传感器材料设计原则。比如,相比调整纳米材料组分,调节传感器形貌对最终传感器的性能影响更大。另据悉,三段式机器学习框架可在数据采集率有限的器件水平上,进行双向的自动化交互设计。
正如多篇文献所提到的[2-3],目前机器学习面临的一个关键挑战,是开发新型机器学习工具来加速功能电子器件的开发。由于制造过程较为耗时,难以获得高质量的数据库。而三段式机器学习框架,带来的优势有三:1、支持向量机分类器;2、主动学习;3、数据增强。这也让该团队得以快速收集具有代表性的数据点,并利用数据增强来训练模型,并极大地加速了应变传感器的预测模型的构建。
王笑楠表示:“该研究的第二个创新是实现了软体机器人传感器的自动化设计。它的成功意味着各类软体机器人的传感器制造配方,可直接由预测模型推荐,无需专家参与试错实验。而在此前,在如此宽的应变区间设计应变传感器是难以完成的[4-5]。”
此外,通过对收集到的数据集进行统计分析和计算,王笑楠发现了制造配方和传感器特性之间的复杂关系,这些数据驱动的关系和趋势,被整理归纳为新的材料设计原则,并通过原位电子显微镜研究得到进一步验证。其表示:“这种用机器学习工具探索新的传感器材料设计原则的设想,也被多篇领域内很重要的文献提及[6-7],而我们的工作首次成功实现了这种方法。”
其中,第一作者杨海涛博士和李佳礼博士共同负责软体机器人材料实验框架的设计以及三段式机器学习框架的构建。
图 | 结合主动学习、数据增强和优化模型的材料器件设计新范式(来源:Nature Machine Intelligence )
论文被选为 2021 年 JACS 前 3 篇编辑和读者精选论文,系唯一入选的华人团队学术研究成果
针对微纳尺度,王笑楠则联合新加坡国立大学化工系赛义夫·汗(Saif Khan)教授、麻省理工学院(MIT)托尼奥·布奥纳西(Tonio Buonassisi)团队,合作开发了高通量微流控反应体系[8]。
“我们开创性地提供了贝叶斯优化和深度神经网络结合的两步算法,对于此类高通量平台不同阶段的稀疏数据和海量数据实现了有效处理,加速了纳米颗粒的合成研发。”
该工作发表后不久,王笑楠又在 JACS 发表了一篇论文,这次聚焦于分子尺度的研究[9]。期间,该团队和新加坡国立大学化工系刘斌院士团队开发出具备自我学习能力的分子、材料计算体系,加速了下一代材料开发过程。双方结合材料第一性原理计算,基于贝叶斯优化的主动学习、以及深度学习预测模型,实现了高性能光敏剂的自我改进发现系统。
其中,来自王笑楠团队的论文第一作者李佳礼博士提供了机器学习算法与框架的设计开发,并从超过 700 万个分子的设计空间中,发现了 5357 个潜在的高性能光敏剂,进一步合成了其中四种分子,并显示出与商业高性能光敏剂相当或更好的性能。
王笑楠表示:“该工作突破了主动学习在基于第一原理的材料设计中的潜力,所发现的材料结构将大大促进光敏化相关应用的发展,尤其是抗癌光动力疗法等核心领域。”
图 | 分子尺度的深度学习加速理论计算和设计(来源:JACS)
而她此前发表在 JACS 的另一论文,则针对仪器尺度做了相关研究。据悉,王笑楠和新加坡国立大学化学系吕炯教授团队开发出一款基于先进机器视觉算法,可用于分析扫描探针显微镜的“一图像一系统”深度学习框架[10]。为证明其准确性和通用性,他们用该框架去确定由两个具有两种不同手性组织模式的超分子自组装体组成的分子的手性。结果发现,该框架准确检测了每个分子的位置,并标明了其手性,验证了机器学习算法的巨大潜力,具备在广泛的研究学科中自动识别复杂的扫描探针显微镜图像模式的能力。
“论文还被选为 2021 年 JACS 的 18 篇编辑特选之一,经过全球读者的投票,被选作了 Top3 读者精选文章。我们也感到很荣幸,希望在深度学习的前沿方法和应用上有更多突破。”王笑楠补充称。
图 | “看”得见会“思考”的智能仪器(来源:JACS)
用 AI 加速新型材料的研发
据悉,这一系列工作旨在用 AI 加速新型材料的研发,是 AI for Science 新兴领域的一个重要分支。相较于制药和结构生物学领域,深度学习与功能材料研发的结合起步更晚,但拥有极高的重要性。
而深度学习优异的高维复杂数据的处理能力、以及从数据中挖掘准确规律的能力,使其可以解决功能材料研究中遇到的问题。
王笑楠认为:“用深度学习加速材料研发,已成为新的范式。正因此,她和团队展开一系列工作,并覆盖不同尺度的新材料研发场景,比如分子尺度、微纳尺度、器件尺度、平台尺度等。”
针对不同尺度的研发场景,王笑楠团队分别与领域内的优秀课题组交流,详细了解不同尺度下材料研发的特点,借此深化算法构架。
例如,针对分子尺度的材料,该团队通过第一性原理计算得到大量的模拟数据,然后通过深度学习来加速第一性原理的计算,或通过主动学习来更高效地获取数据,以便建立合适的数据库。
而针对微纳尺度,该团队则主要考虑搭建高通量的微流控实验平台,并结合高通量的表征工具来建立相关的数据库。
针对器件尺度,由于尺度的增加会导致流程的复杂度增加,从而致使高通量数据采集过程更加困难。基于此,该团队针对所要设计的器件材料,定制了专门的主动学习算法,并将器件性质的预测问题,拆解成多阶段性的子问题来简化预测难度,最后结合优化算法和数据增强算法,来进一步提升模型预测能力。
针对仪器和平台尺度,由于大量的仪器使用均会涉及到图像分析,这时王笑楠等人使用机器学习算法,来加速自动化仪器和未来智能实验室的实现过程。
图 | 未来智慧碳中和实验室(来源:王笑楠课题组)
助力清洁能源、碳捕集利用和“双碳”目标
通过以上研究,该团队已实现新材料研发效率的大幅提升,缩短了研发周期,亦降低了研发成本。
“通过将这类研发手段用于不同领域,我们有信心解决更多领域的痛点,比如设计开发先进的新能源和储能材料、芯片材料以及碳捕集、利用与封存材料,助力国家实现清洁能源转型,芯片自主化及碳达峰、碳中和等远大目标。”王笑楠总结。
基于前期良好的基础,该团队会更加深化在各个材料尺度的机器学习框架,朝着构建未来智能实验室这一方向而努力。目前,王笑楠正考虑将柔性机器人、自动化机器臂与高通量实验平台、以及更智能的算法框架进行结合,以便在不同尺度不同种类的材料尤其是碳中和相关材料应用场景下,构建全自动智能化的实验室。
-End-
参考:
1、Yang, H., Li, J. et al. Automatic strain sensor design via active learning and data augmentation for soft machines. Nat Mach Intell 4, 84–94 (2022).
2、Li, J. et al. AI applications through the whole life cycle of material discovery. Matter3, 393-432, (2020).
3、Cao, B. et al. How to optimize materials and devices via design of experiments and machine learning: Demonstration using organic photovoltaics. ACS Nano12, 7434-7444, (2018).
4、Araromi, O. A. et al. Ultra-sensitive and resilient compliant strain gauges for soft machines. Nature587, 219-224, (2020).
5、Yang, H. et al. Wireless ti3c2tx mxene strain sensor with ultrahigh sensitivity and designated working windows for soft exoskeletons. ACS Nano14, 11860-11875, (2020).
6、Shih, B. et al. Electronic skins and machine learning for intelligent soft robots. Sci. Robot.5, eaaz9239, (2020).
7、Miriyev, A. & Kovač, M. Skills for physical artificial intelligence. Nat. Mach. Intell.2, 658-660, (2020).
8、Mekki-Berrada, F., Ren, Z., Huang, T. et al. Two-step machine learning enables optimized nanoparticle synthesis. npj Comput Mater 7, 55 (2021).
9、Xu, S., Li, J. et al. Self-Improving Photosensitizer Discovery System via Bayesian Search with First-Principle Simulations. J. Am. Chem. Soc. 143, 47, 19769–19777, (2021).
10、Li, J. et al. Machine Vision Automated Chiral Molecule Detection and Classification in Molecular Imaging. J. Am. Chem. Soc. 143, 27, 10177–10188, (2021).