文章发表于2025-10-29 09:36:02,归属【科技前沿】分类,已有31人阅读
大约 70 年前,著名数学家、密码破译者兼计算机科学家艾伦・图灵提出了一个问题:“机器能思考吗?” 如今,部分专家坚信人工智能(AI)即将发展出人类所具备的能力,但也有专家认为机器永远无法企及。
尽管 AI 已能在特定任务上超越人类 —— 就像计算器一样,但它们无法习得人类的创造力。毕竟,人类的独创性有时源于激情和直觉,而非逻辑和证据,正是这种能力让我们取得了从疫苗到基本粒子的重大发现。AI 当然永远无法与之抗衡?事实证明,它们或许可以。《自然》杂志近期发表的一篇论文显示,AI 仅通过从研究出版物中提取有意义的数据来预测未来的科学发现。
语言与思维有着深刻联系,它塑造了人类社会、人际关系,最终也塑造了智能。因此,AI 研究的终极目标之一便是充分理解人类语言的所有细微差别,这一点并不令人意外。自然语言处理(NLP)是机器学习这一领域的分支,旨在从文本数据中评估、提取和分析信息。
儿童通过与周围世界互动、反复尝试来学习 —— 学骑自行车往往要经历几次磕碰和摔倒。换句话说,我们在犯错中学习,而这正是机器学习的运作方式,有时还会辅以额外的 “指导性” 输入(即监督式机器学习)。
例如,AI 可以通过大量单个样本构建物体的特征模型,从而学会识别图像中的物体。在此过程中,人类需要向它展示包含或不包含该物体的图像,计算机先猜测图像中是否存在该物体,再根据人类判断的猜测准确性调整其统计模型。不过,我们也可以让计算机程序自行完成所有相关学习(即无监督式机器学习),此时 AI 会自动检测数据中的模式。无论哪种模式,计算机程序都需要通过评估自身的错误程度来寻找解决方案,然后调整优化以最小化误差。
假设我们想了解某一特定材料的相关特性,最直接的步骤是从书籍、网页和其他合适的资源中查找信息。但这一过程十分耗时,可能需要数小时的网络搜索、阅读文章和专业文献。而 NLP 可以提供帮助:通过复杂的方法和技术,计算机程序能从海量文本数据集中识别概念、相互关系、主题大意和特定属性。
在这项新研究中,AI 通过无监督学习从科学文献中提取信息,这具有非凡的意义。迄今为止,大多数现有的自动化 NLP 方法都是监督式的,需要人类输入。尽管相比纯手动方式已有进步,但这仍然是一项劳动密集型工作。
然而,在这项新研究中,研究人员打造了一个能独立准确识别和提取信息的系统。它基于数据的统计和几何特性,采用复杂技术识别化学名称、概念和结构。该系统的训练数据来自约 150 万篇材料科学领域的科学论文摘要。
随后,机器学习程序根据 “元素”“能量学”“粘结剂” 等特定特征对数据中的词汇进行分类。例如,“热量” 被归类到 “能量学”,“气体” 被归类到 “元素”。这有助于将特定化合物与磁性类型、其他材料的相似性等关联起来,在无需人类干预的情况下,揭示了词汇之间的内在联系。
这种方法能够捕捉复杂的关系并识别多层信息,这对人类而言几乎是不可能完成的任务。与目前科学家的预测相比,它提供了超前的洞察 —— 事实上,AI 能够在材料实际被发现的数年前,推荐其功能性应用场景。研究中共有五项这样的预测,全部基于 2009 年之前发表的论文。例如,AI 成功识别出一种名为 “CsAgGa₂Se₄” 的物质是热电材料,而科学家直到 2012 年才发现这一点。也就是说,如果 2009 年就有这款 AI,它本可以加速这一发现进程。
AI 的预测依据是,将该化合物与 “硫族化物”(含硫、硒等 “硫族元素” 的材料)、“光电子学”(产生、探测和控制光的电子设备)和 “光伏应用” 等词汇关联起来。许多热电材料都具备这些特性,而 AI 迅速捕捉到了这一点。
这表明,关于未来发现的潜在知识在很大程度上蕴含在过去的出版物中。AI 系统正变得越来越独立,但这并无可怕之处。它们能极大地帮助我们应对人类活动持续产生的海量数据和信息。尽管存在隐私和安全相关的担忧,但 AI 正在改变我们的社会。我相信,它将引导我们做出更优决策、改善日常生活,并最终让我们变得更聪明。