安原盛明教授就职于香港大学生物科学院的太古海洋科学研究所。他的主要研究兴趣之一是古生态学,即古代生物与其环境的相互作用。在这次与我们的科研主编Pavel Toropov博士的采访中,安原盛明教授及其博士生胡加勉解释了人工智能深度学习工具如何改变了他们的研究。
Q:您能解释一下您实验室的研究方向吗?
我们想了解气候和环境对地球,特别是对海洋生态系统和生物多样性的影响。我们对气候变化、全球变暖、酸化、氧气减少如何影响海洋动物很感兴趣。
我们实验室专注于海洋古生物学——基于化石记录的长时间尺度的海洋生物学研究。在现代生物学中,科学家往往在意识到问题后才开始监测。比如,他们发现污染后才开始监测。然而,我们并不了解污染发生前的自然环境状况。
但是通过研究沉积物岩芯和深时化石记录,我们可以获得一个完整的长时间序列——包括污染前后的情况。我们能够追溯到几十万年、几千万年,甚至数亿年前。
Q:您使用哪些动物的化石记录?
大多数动物如鱼、水母、蠕虫、海洋哺乳动物没有良好的化石记录,因为它们没有贝壳这样的硬质部分,无法很好地保存为化石,或者因它们体型太大,无法在少量沉积物中沉积物中大量保存为化石。因此,我们需要寻找一个具有代表性的替代物种,以此来推断全球海洋生态系统的状况。
一个代表物种是介形虫(ostracods)。介形虫是微型甲壳类动物,具有非常漂亮的碳酸钙质外壳,是所有甲壳类动物、节肢动物和后生动物中拥有最好化石记录之一。
通过研究介形虫,我们不仅可以了解介形虫本身,还可以以它们为代表,探索整个(海洋)生态系统的多样性。
Q:您的介形虫样本来自哪里?
主要来自新生代(Cenozoic Era),从6600万年前到现在。我的一些学生正在研究奥陶纪(Ordovician)时期的样本——至今已经超过4亿年了。我的研究地点包括北极、南极、大西洋、印度洋、太平洋、红海、地中海……香港、非洲。
Q:让我用简单的话概括一下您的工作:
Pavel:首先,您从海底获取沉积物岩芯样本,取出所有介形虫微化石,将它们放在显微镜载玻片上。接著,您识别它们的物种。由于不同物种适应不同的环境,通过了解不同种类介形虫数量随时间的变化,您可以得出整个海洋生态系统变化的结论,对吗?
安原盛明教授:是的。
Q:您如何应用人工智能?
(在研究介形虫时)有几个挑战。首先,整个过程非常耗时:包含挑选、识别、分类。其次,这项工作需要深厚的专业知识。要培养一个能熟练识别介形虫的人往往需要需要很多年的时间,甚至可能要一整个博士学位课程。
最近我和我的博士生胡加勉合作,通过应用人工智能深度学习来自动化上述过程。他做得非常好,现在我们可以使用我们的数字显微镜自动扫描整个载玻片。
胡加勉使用了至少20万个介形虫标本来训练我们的人工智能,目前人工智能已经可以做到自动识别了。识别速度大幅度提升,同时可以让我们可以获取更多的数据。
胡加勉: 没错,拥有海量数据确实意义重大!我们积累了20万个经专家鉴定的研究级样本,这庞大的数据库为我们的深度神经网络提供了充足的学习素材,使其能够有效掌握介形虫识别的各种模式。
Q:使用人工智能能为您节省多少时间?
胡加勉:我们有一个博士生,她有大约一百个来自巴拿马的介形虫样本。在使用人工智能之前,手工识别,一个个地处理,一个样本可能需要几天时间。现在使用人工智能来做,不用一个小时就能完成。
(展示一张带有介形虫的显微镜载玻片):一只介形虫是载玻片上的一个白点。人工智能在一秒钟内可以识别20个。这个载玻片上有几百个介形虫。人工智能识别只需几分钟,但用肉眼识别,取决于个人,可能需要几个小时到一天的时间。
另外,安原教授并不总是有空,但我们开发的人工智能系统却能够全天候运作。这意味着,无论何时学生在鉴定方面遇到疑难,这个智能系统都能及时提供协助。
Q:你是自己编写这个深度学习程序的吗?
胡佳勉:我是用PyTorch从头开始构建的,它是专门为识别介形虫订制的。我以前是计算机专业的学生。
安原教授:人工智能不仅在时间效率上更高,通过使用人工智能和深度学习,我们做出了令人兴奋的发现,学到了新东西。人工智能可以发现我们忽略的识别错误。人工智能可以给你带来新的问题去思考。
本文转载自“香港大学”公众号