ChatGPT的表弟刚被NASA录用。2月1日,NASA和IBM宣布两大组织之间建立新的合作伙伴关系,旨在将人工智能(AI)工具应用于气候科学,扫描研究文献以获得快速答案,并识别地球科学数据中的特征。
这不是NASA首次涉足人工智能领域,甚至也不是该机构与IBM的首次合作。2014年,美国宇航局与这家科技巨头合作,在太阳动力学天文台的传感器故障时推断出太阳极端辐射的测量结果。一年后,NASA开办了一个夏季训练营,将科学家和硅谷的工程师聚集在一起,被称为前沿发展实验室(Frontier Development Lab)。
此外,自从机器学习技术出现以来,NASA各个领域的科学家一直在自己的项目中使用这些工具,从观测太阳到设计自主数据收集机器人。然而,随着人工智能的能力和复杂性的增长,个人研究人员越来越难以充分利用这些工具的潜力。每当他们开始一个新项目时,许多NASA工程师和科学家都会为每个数据集建立一个定制的模型。为了解决这个问题,美国宇航局在2020年举办了一场关于人工智能的研讨会。它寻求大规模的、极具挑战性的问题的答案,对每个问题都有远大的梦想,而不是一次性的模型——IBM的技术似乎与他们的需求完美匹配。
IBM首席开发人员Priya Nagpurkar在新闻发布会上说,“我们都听说过并看到过”广泛应用的机器学习模型的魔力,尤其是像ChatGPT这样的语言模型。“我们正处于这个独特的时刻,是时候把这些进步应用到不同的领域……以及推进科学。”
这次合作是一种特殊的人工智能(一种灵活的、广泛适用的技术,被称为基础模型,IBM处于开发的前沿)首次应用于地球科学。IBM代表Danielle Cerasani说:“虽然NASA和IBM在过去几年里讨论过使用人工智能来解决各种问题,但IBM的基础模型研究是目前合作的催化剂。”
正如最近的一份新闻稿所述,该合作计划解决两个主要项目:基于科学文献回答问题,以及分析地球的大型数据集,以确定模式和趋势。美国国家航空航天局(NASA)将提供其大量地球观测数据和科学家的访问,而IBM正在增加人工智能开发专业知识和他们对这项技术的现有研究。
文献搜索是基于类似ChatGPT的技术,NASA希望它能成为一种超先进的科学家搜索引擎。它的主要卖点之一是,它的答案将带有引文——直接链接到它所提取信息的研究论文——不像其他工具更像一个神秘的黑匣子。美国宇航局马歇尔太空飞行中心的高级研究科学家拉胡尔·拉马钱德兰在新闻发布会上表示,这项技术最早可能在2023年中期准备就绪。
尽管如此,一些科学家仍持怀疑态度。纽约市立大学(City University of New York)物理学家、人工智能专家Viviana Acquaviva表示:“模型总结信息和回答问题的能力——这是最具创新性的方面,尤其是对更广泛的社区而言——也存在更高的偏见风险。”“我们已经看到像ChatGPT这样的最先进的模型很容易产生有偏见或不正确的答案,同时听起来似乎合理和自信。”例如,在谷歌的新巴德聊天机器人的广告中,人工智能错误地声称詹姆斯·韦伯太空望远镜拍摄到了第一颗系外行星,而欧洲南方天文台的甚大望远镜在几年前就已经这样做了。
与此同时,将人工智能应用于地球观测是合作中更科学有趣的部分,至少对Acquaviva来说是这样。NASA拥有地球上世界上最大的数据档案——足够填满大约100万部普通iphone——他们希望利用IBM的模型更有效地对这些数据进行分类。
Ramachandran告诉记者:“我们的档案目前为70pb,预计在几年内将增长到250pb……我们支持全球70亿用户访问我们的数据进行研究和应用。”“显然,考虑到我们拥有的数据规模,我们面临着大数据问题。”
通过这项新的人工智能技术,他们希望能够轻松地追踪全球各地的天气和自然灾害——从龙卷风轨迹到尘埃云。Ramachandran设想了这样一种场景:灾难响应小组可以在飓风过后迅速分析洪水的程度,从而实现更快、更有效的紧急援助。该团队计划首先分析一个名为“协调陆地卫星哨兵2号”的数据集,该数据集是由两颗强大的NASA卫星观测数据的组合。然而,这项工作才刚刚开始,Ramachandran将其描述为研究的“开放领域”。
合作还打算公开发布他们通过这些项目开发的代码和其他工具,让任何对它们的使用感兴趣的人都可以使用它们。Acquaviva说:“令人兴奋的是,我们正在朝着创建一个包容性和跨学科的社区迈进,这可以让科学家和公众更容易获得气候数据和人工智能工具。”