用神经网络快速检测超新星

哈Ha!我想向您介绍智利天体物理学研究所的Rodrigo Carrasco-Davis撰写的出色文章“使用神经网络快速检测超新星”文章(略作改编)



有点背景



天文学是对天体的研究:天体,星系或黑洞。对天体的这项研究类似于“自然物理学”实验室中的工作。最令人难以置信的极端自然过程发生在其中,这在地球上大部分是无法重复的。对这些过程的观察使我们能够对世界有更深入的了解,检查有关物理学的现有知识,将已建立的思想与我们在宇宙中观察到的思想进行比较。



天文学家非常感兴趣的是一种特殊的事件。它发生在大质量恒星生命的尽头。它们由氢组成,氢被重力拉向中心。当密度足够高时,氢原子开始融合。这会导致发光的外观和新化学元素的外观:氦,碳,氧,氖等。合并过程在内部压力下进行,而重力施加外部压力,从而在恒星自行燃烧时保持其稳定性。恒星越重,到达其核心的温度越高,其燃烧核燃料的速度就越快。



合成过程逐渐转移到较重的元素:镁,硅,硫,最后变成铁,钴和镍。合成其他元素所需的能量比反应期间释放的能量更多,因此核心坍塌并发生超新星爆炸。





蟹状星云,超新星残余



这个过程对天文学家来说非常重要。由于爆炸过程中的极端条件,天文学家可以观察重元素的合成,在强压力和高温下检查物质的行为,并观察爆炸产物,可能是中子星或黑洞。



超新星也可以用作标准蜡烛。天文学中的一个常见问题:测量到天体的距离。由于恒星距离地球太远,因此很难确定恒星是昏暗且靠近我们,还是离得很远且非常明亮。宇宙中大多数超新星爆炸都是以相同的方式发生的,这就是为什么天文学家使用超新星测量距离的原因,这在研究例如宇宙膨胀和暗能量时非常重要



尽管超新星爆炸非常明亮,但由于它们离地球的距离,发生频率低(每个星系每个世纪大约一个超新星)和爆炸的短期性质(它们可能持续数天到几次)而很难注意到周。另外,为了从超新星获得有用的信息,有必要准备一个光谱仪(用于测量爆炸在几个频率下发出的能量)。最好提前开始观测恒星,因为许多有趣的物理过程是在爆炸开始前的几个小时内发生的。现在问自己一个问题:我们如何才能在宇宙中所有其他可观测的天文物体之间快速找到这些超新星爆炸?



今天的天文学



几十年前,天文学家不得不选择一个特定的物体并用望远镜对准它,以获得他所需的信息。现代望远镜像兹维基瞬态基金(ZTF)或维拉·鲁宾天文台拍摄的天空在一个非常高的速度高品质的图像,在可见的天空收集数据每三天。 ZTF望远镜每晚产生1.4 TB的数据,实时识别并发送有关天空中有趣的变化物体的信息。



当某些东西的亮度改变时,“智能”望远镜会注意到它并发送警告警报。通过发送数据流来完成警告,其中每个消息都包含三个63 x 63像素的裁剪图像。这三个图像称为科学图像,参考图像和微分图像。



科学的图像文件是特定区域的最新观察结果。参考-观察开始时是什么。在第一张和第二张图像之间已更改的所有内容都可以在第三张中看到。臭名昭著的望远镜每晚最多可发送一百万条警告,但更常见的是数千条警告。假设某人想要手动检查每个警报,则在一夜内查看所有警报大约需要3.5天。





科学,参考和差异图像。补充其他重要数据,例如观察条件和有关对象的信息。第四图像是PanSTARRS使用Aladin Sky Atlas制作的彩色版本。您可以在ALeRCE界面中看到超新星亮度随时间的完整变化



由于这些警告传达了天空中所有变化的信息,因此重要的是能够检测到望远镜产生的全部信息流中的超新星。问题在于其他天文物体也会触发警报。例如,变星改变亮度,活跃的银河核小行星。也有错误的警告。幸运的是,科学,参考和差异图像具有许多独特的功能,可帮助确定警报在谈论超新星或其他物体。学习如何有效地区分主要警报类别将非常有用。





五类天文物体



因此,活跃的银河核通常位于星系的中心。超新星通常发生在宿主星系附近。小行星在太阳系附近观察到,在参考图像中不可见。在充满其他恒星的图像中会发现可变恒星,因为它们大多位于银河系中。虚假警报的产生有多种原因:望远镜相机中像素不足,创建差分图像时相减不佳,宇宙射线等。正如我之前所说,人类不可能手动检查每个警告。因此,需要一种自动分类的方法,以便天文学家可以找到最有趣的数据,其中更有可能包含有关超新星的信息。



使用神经网络搜索超新星



由于我们大致了解了上述五个类别的图像之间的差异,因此我们可以尝试计算特定特征以对其进行正确分类。但是,手工工作很困难,并且需要长时间的反复试验。因此,决定训练卷积神经网络(CNN)以解决分类问题并快速检测超新星。



通过在训练集中创建每个图像的旋转副本90°,来确保神经网络的不变性,然后加载图像的每个旋转版本的平均值。使用不变性非常重要,因为没有特定的方向可以使结构在警报发送的图像中出现。



科学家还添加了警告中包含的一些元数据,例如天空坐标中的位置,与其他已知物体的距离以及大气条件。在使用交叉熵训练模型后,警告包含有关超新星信息的概率集中在0或1的值附近。的确,分类器有时会在预测的类中犯错。在计算机做出预测后,研究人员不得不对可能的超新星数据进行额外过滤并不是十分方便。



为了最大化预测的熵并分配输出概率的值,科学家向神经网络添加了更多信息。这使得可以改善预测的细节或清晰度,获得从0到1的整个范围内的概率,而不仅仅是这些指标的极值。结果是更方便解释的预测,使天文学家可以挑选出超新星候选者。





旋转不变性增加的卷积神经网络。创建旋转后的副本,并将其传递到相同的神经网络体系结构,然后在与元数据结合之前将中间池应用于密集层。



科学家通过神经网络传递了大约40万个对象,这些对象均匀地分布在ZTF望远镜的整个覆盖范围内,以检验模型预测的正确性。事实证明,神经网络预测的每个类别在空间上都是分布的。当您考虑每个天文物体的性质时,这是有道理的。例如,活跃的银河核和超新星大多位于银河系平面之外(激流物体),因为由于阻塞,不太可能通过银河系平面看到其他物体。该模型可以正确预测银河系平面(银河纬度接近于0)附近的物体。在银河平面中以较高的密度正确检测到了变星。小行星位于太阳系平面附近,也称为黄道(标有黄线)。错误的警告无处不在。



图像中的信息(科学,参考和差异)足以在训练集中获得良好的分类,但是来自元数据的信息集成对于获得正确的预测空间分布至关重要。 





一组未标记的天文物体的空间分布。每个图均以星系坐标给出。银河系的纬度位于银河系的中心,因此接近0的纬度也更接近银河系的平面。银河经度表示我们在银河系平面中看到的磁盘数量。黄线代表太阳系的平面(黄道)。



超新星猎人



由此产生的Supernova Hunter项目的Web界面允许天文学家研究由神经网络选择的对象,并确信它们是超新星。他们还可以报告模型做出的错误分类,从而可以将新信息添加到训练集中,以提高以后的神经网络性能。





超新星猎人:用于研究超新星候选者的用户界面。它显示了具有超新星信息可能性的警报列表。对于每个图像,都添加了对象位置和元数据。



神经网络分类器和超新星猎人确认了394个超新星,并在瞬态名称服务器上报告了3,060个超新星候选者从2019年6月26日到2020年7月21日,平均每天释放9.2名超新星候选者。这种观察速度大大增加了爆炸早期可以研究的可用超新星数量。



观点



超新星猎手背后的科学家们正在努力改善模型的分类特性,以便更准确地识别超新星候选者,并减少人类的关注。理想情况下,这应该是一个可以高度自信地自动报告每个可能的超新星候选者的系统。



科学家的另一个工作领域是使用异常检测方法搜索稀有物体。这是一项具有挑战性但现实的任务,因为新型望远镜在理论上可以发现新型的天文物体,原因是每次观测的采样率和规模都令人难以置信。



由于组织数据的分类和重新分配是科学的重要组成部分,因此一种分析大量天文数据的新方法不仅有用,而且很有必要。当今功能强大的望远镜的使用从根本上改变了天文学家研究天体的方式,科学家必须准备好使用新技术。



感谢您的关注!原始文章



All Articles