在搜索特定应用可能的新材料的理论列表时,例如电池或其他与能源有关的设备,通常有数百万种潜在的材料可以考虑,以及需要同时满足和优化的多个标准。 现在,麻省理工学院的研究人员已经找到了一种方法,利用机器学习系统来显著简化发现过程。
作为一个示范,团队到达了一套八大最有前途的材料,在近300万名候选人中,为一个叫做流动电池的储能系统。 他们说,这种剔除过程需要50年的常规分析方法,但他们在5周内完成了。
这一发现在“ACS中心科学”杂志上报道,这是麻省理工学院化学工程教授希瑟·库里克(Heather Kulik)、乔恩·保罗·珍尼特(JonPaul Janet Ph)的一篇论文。 D.19岁,萨哈斯拉吉特·拉梅什,研究生陈如段。
这项研究研究了一组称为过渡金属配合物的材料。 这些材料可以以大量不同的形式存在,Kulik说,它们“真的很吸引人,功能材料不同于许多其他材料阶段。 要理解它们为什么以它们的方式工作,唯一的方法就是使用量子力学来研究它们。”
为了预测这些材料中任何一种的性质,要么需要耗时和资源密集型的光谱学和其他实验室工作,要么需要对每种可能的候选材料或材料组合进行耗时、高度复杂的基于物理的计算机建模。 每项此类研究都可能耗费数小时至数天的工作时间。
相反,Kulik和她的团队使用了少量不同的可能材料,并利用它们来教授一个先进的机器学习神经网络,了解材料的化学成分与其物理性质之间的关系。 然后将这一知识应用于为下一代可能的材料提出建议,以便用于神经网络的下一轮培训。 通过这一过程的四次连续迭代,神经网络每次都有显著的改进,直到达到一个很明显的点,即进一步的迭代不会产生任何进一步的改进。
这种迭代优化系统极大地简化了找到满足两个相互冲突的标准的潜在解决方案的过程。 这种在改善一个因素往往使另一个因素恶化的情况下找到最佳解决方案的过程被称为帕累托前沿,表示一个点的图,这样一个因素的任何进一步改善都会使另一个因素变得更糟。 换句话说,图表示最好的折衷点,这取决于分配给每个因素的相对重要性。
训练典型的神经网络需要非常大的数据集,从数千到数百万个例子,但是Kulik和她的团队能够使用这种迭代过程,基于帕累托前沿模型,只使用几百个样本来简化过程并提供可靠的结果..
在筛选流动电池材料的情况下,所需的特性是相互冲突的,通常是这样:最佳材料将具有高溶解度和高能量密度(在给定重量下储存能量的能力)。 但溶解度的增加往往会降低能量密度,反之亦然。
神经网络不仅能够迅速找到有前途的候选者,而且能够通过每次迭代为其不同的预测分配置信度,这有助于在每一步改进样本选择。 库利克说:“我们开发了一种比类中最好的不确定性量化技术,以真正了解这些模型何时会失败。”
他们为概念验证试验选择的挑战是用于氧化还原流动电池的材料,这种类型的电池有望用于大型电网规模的电池,可以在实现清洁、可再生能源方面发挥重要作用。 过渡金属配合物是这种电池的首选材料类别,Kulik说,但有太多的可能性通过传统的方法来评估。 他们首先列出了300万个这样的综合体,然后最终将其削减到八个好的候选人,以及一套设计规则,这些规则应该使实验者能够探索这些候选人的潜力及其变化。
她说:“通过这一过程,神经网络在[设计]空间方面变得越来越聪明,但也越来越悲观,任何超出我们已经描述的东西都能进一步改善我们已经知道的东西。”
她说,除了建议使用该系统进一步研究的特定过渡金属配合物外,该方法本身也可以有更广泛的应用。 “我们确实认为它是一个框架,可以应用于任何材料设计挑战,你真的试图同时解决多个目标。 你知道,所有最有趣的材料设计挑战都是你有一件事要改进,但改进会使另一件事恶化。 对我们来说,氧化还原流动电池氧化还原偶只是一个很好的证明,我们认为我们可以去哪里与这台机器学习和加速材料发现。”
例如,优化各种化学和工业过程的催化剂是另一种这样复杂的材料搜索,Kulik说。 目前使用的催化剂往往涉及稀有和昂贵的元素,因此在丰富和廉价的材料基础上寻找类似有效的化合物可能是一个显著的优势。
她说:“我认为,这篇论文代表了在化学科学中第一次应用多维定向改进。” 但这项工作的长期意义在于方法论本身,因为在其他方面可能根本不可能。 “你开始意识到,即使进行并行计算,这些情况下我们也不会以任何其他方式提出设计原则。 我们的工作所产生的这些线索,并不一定都是从文献中已经知道的想法,也不一定是一位专家能够指给你的。”
西北大学化学和化学与生物工程教授乔治·沙茨说:“这是统计学、应用数学和物理科学中非常有用的概念组合。” 他说,这项研究涉及“当有多个目标时,如何进行机器学习。 库利克的方法使用领先的边缘方法来训练一个人工神经网络,用于预测哪种过渡金属离子和有机配体的组合将最适合氧化还原流动电池电解质。”
沙茨说:“这种方法可以在许多不同的环境中使用,因此它有可能改变机器学习,这是世界各地的一项主要活动。”