张健楠 作品数:11 被引量:20 H指数:3 供职机构: 中国科学院国家天文台 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 北京市属高等学校人才强教计划资助项目 更多>> 相关领域: 天文地球 自动化与计算机技术 更多>>
中低分辨率恒星光谱物理参量自动测量研究 本文针对LAMOST,SDSS,GAIA等银河系巡天项目产生的海量中低分辨率(R=2000,R=10000)恒星光谱研究其三个大气基本物理参量(表面有效温度(Teff),表面重力加速度(10g g),金属丰度([Fe/H... 张健楠关键词:恒星光谱 自动测量 银河系 恒星大气物理参量的非参数估计方法 被引量:5 2005年 恒星大气物理参量(有效温度、表面重力、化学丰度)是导致恒星光谱差异的 主要因素.恒星大气物理参量的自动测量是LAMOST等大规模巡天望远镜所产生的海量 天体光谱数据自动处理中一个重要研究内容.针对测量大样本的恒星光谱数据估计每个恒 星的大气物理参量,提出了一种基于变窗宽核函数的估计算法:变窗宽算法是对固定窗宽 算法的改进,分为3个步骤: (1)将历史恒星光谱数据进行PCA处理,得到光谱的低 维特征数据;(2)利用特征数据与其物理参数的对应关系,建立一种变窗宽的非参数估计 模型; (3)利用该估计模型,直接计算待测恒星光谱的3个物理参量(有效温度、表面重 力、金属丰度).实验结果表明:该方法与固定窗宽估计模型以及在其他文献中报道的方法 相比,具有较高的估计精度和鲁棒性. 张健楠 吴福朝 罗阿理 赵永恒关键词:非参数估计 核回归方法在恒星光谱物理参量自动估计中的应用 被引量:3 2009年 恒星大气物理参量(有效温度、表面重力、化学丰度)是导致恒星光谱差异的主要因素。恒星大气物理参量的自动测量是LAMOST等大规模巡天望远镜所产生的海量天体光谱数据自动处理中一个重要研究内容。文章采用两种非线性核回归方法对低分辨率恒星光谱进行3个物理参量的自动估计:核最小二乘回归(KLSR),核PCA回归(KPCR)。实验表明:(1)KLSR与KPCR可以实现光谱到表面有效温度和表面重力的回归,但是KLSR对噪声敏感,KPCR鲁棒性好于前者;(2)对于温度参数估计,两种算法具有相近的估计效果;对于表面重力和化学丰度估计,KPCR优于KLSR和非参数回归方法;(3)KLSR与KPCR方法实现容易,模型的训练速度快,运算复杂度小,适用于恒星光谱物理参量的自动测量。 张健楠 吴福朝 罗阿理关键词:恒星光谱 确定恒星表面有效温度的曲面拟合方法 被引量:3 2004年 恒星表面有效温度是恒星的一个重要物理参量,是恒星光谱差异的决定因素。本文提出了一种确定恒星表面有效温度的曲面拟合方法,所使用的拟合曲面模型是多项式的指数函数。首先对历史光谱数据进行PCA处理,再根据PCA特征数据与其表面温度的对应关系计算拟合曲面。通过实验,我们发现使用2维PCA数据和指数为3次多项式,根为10的指数函数模型所得到的拟合曲面,不仅有效好的拟合精度而且有很好的鲁棒性。本文的研究结果对恒星表面有效温度的自动测量具有重要的意义。 张健楠 吴福朝 罗阿理 赵永恒关键词:恒星 星表 星光 曲面模型 曲面拟合 表面温度 统计SDSS-DR7中的CEMP星并分析其温度和光谱型 被引量:2 2009年 统计了SDSS(TheSloanDigitalSkySurvey)最新发布的DR7(DataRelease7)数据中的CEMP星(Carbon—EnhancedMetal—PoorStars)。分析了样本的温度、光谱型、颜色等物理参量,同时给出了CEMP星在SDSS贫金属星中占的比例约为11%。统计得到SDSS_SSPP(TheSEGUEStellarParameterPipeline)发布的CEMP星样本的温度主要集中在6000~9000K范围内。采用PLSR(偏最小二乘回归)方法计算样本的温度并给出其光谱型,结果显示与SSPP发布的温度比较没有系统误差,但在温度较高时,随机误差较大,这与SSPP中采用不同方法给出的温度值是一致的。从颜色一颜色图上看,选出的CEMP星主要包含两类星:BHB/BS和F(FTurn-Off),前者温度较高且温度误差相对较大。通过样本在Log(g)一颜色图上的划分,可以区分BHB和BS样本。最后讨论了BHB/BS和F(FTurn-Off)中C元素的来源。 王凤飞 罗阿理 张健楠 刘超 赵永恒关键词:SDSS CEMP 光谱型 PLSR 基于非参数回归与最近邻方法的恒星光谱自动分类 被引量:1 2009年 恒星光谱数据的自动识别与分类是现代巡天望远镜所产生的海量光谱数据处理的一项重要研究内容。针对流量未定标的低分辨率恒星光谱设计了一种有效的自动分类方案,实现恒星光谱的MK分类:光谱型及其次型分类,光度型分类。该方案由三部分实现:(1)连续谱归一化:基于小波技术提取低频信号逼近连续谱的方法;(2)七种光谱型及其次型的分类通过非参数回归方法实现。(3)光度型分类通过基于最近邻的χ2方法实现。实验结果表明该方案能够有效实现恒星光谱的MK分类,光谱型及其次型的分类精度为3.2个光谱次型,Ⅰ-Ⅴ光度型的正确识别率为60%,次优统计率为78%。该方案训练速度快,方法实现容易,适用于海量恒星光谱自动分类处理系统。 张健楠 赵永恒 刘蓉关键词:非参数回归 最近邻方法 光度 确定恒星表面有效温度的非参数估计方法 被引量:3 2005年 恒星表面有效温度是恒星的一个重要物理参量,是恒星光谱差异的重要因素。文章采用非参数估 计算法对恒星表面温度进行估计。首先对历史光谱数据进行主成分分析(PCA)处理,再根据PCA特征数据 与其表面温度的对应关系建立温度的估计模型,该模型是基于高斯核函数的。方法不依赖对光谱进行精确 测量,就可以得到较高估计精度的温度值,对大样本光谱分析具有重要意义。 张健楠 吴福朝 罗阿理 赵永恒关键词:恒星光谱 非参数估计 主成分分析 LAMOST的“Unknown”光谱分类研究:ODS-YOLOv7模型 2024年 天体识别是天文新发现和深入研究天体的基础。在LAMOST DR8 v1.0发布的低分辨率光谱数据中有约53万条因没有类别标签而被命名为“Unknown”的光谱,其中有88.56%的光谱信噪比在0~10之间,对这批光谱的研究分析将增加LAMOST的有效数据产出。该研究为“Unknown”光谱的分类设计了一种ODS-YOLOv7模型。它是一种端到端的类别预测模型,通过添加一维卷积注意力模块以提高光谱识别能力。在经过一批信噪比在0~10之间的已知类别光谱训练后,ODS-YOLOv7可以学习到低信噪比光谱的有效特征,进而实现对“Unknown”光谱的类别预测。实验表明,该模型在已知类别标记的低信噪比恒星、星系、类星体的光谱识别中,F1-score分别为0.98、0.95、0.95;同时在与传统算法KNN、RF、DT、SVM和深度学习算法1D CNN、1DSSCNN、ResNet、DenseNet、VIT对比实验中取得相对最好的效果。实验结果还给出了ODS-YOLOv7模型对DR8 v1.0中信噪比在0~10的“Unknown”光谱预测置信度分布,在预测类别为恒星、星系、类星体任务中,有92%的分类置信度在60%以上。为保证模型输出质量,本文只选取分类置信度大于99%的光谱类别作为输出结果。以此为依据,在DR8 v1.0和DR9 v0发布的全部“Unknown”光谱中分别有37.19%和47.03%被ODS-YOLOv7模型预测出类别。此外,还增加人工认证以检验该模型预测的正确性。为提升模型的可解释性,参照了二维图像特征可视化的Grad-CAM方法,将其改进为适合于可视化一维光谱数据特征的算法。其结果表明该模型可自动关注到不同的分类特征,使得该模型非常适用于低信噪比“Unknown”光谱的类别预测。 王晓敏 高军萍 蒲源 邱波 张健楠 闫静 李荣关键词:LAMOST 特征可视化 海量天体光谱数据分析与产品发布系统的研制与应用 2021年 随着国内外大规模天文光谱巡天的出现,缺乏完善的海量天体光谱数据自动处理和数据发布系统成为制约基于海量天文光谱进行科研的瓶颈.中国科学院国家天文台针对此问题提出了完整的解决方案并基于大量的创新技术方法解决了天文数据所特有的复杂背景信号的建模与扣除、稀疏特征的压缩与提取、恒星物理参数的非线性回归、非结构化数据的快速索引等问题,并且成功地应用在我国自主研发的国家重大科技基础设施郭守敬望远镜(LAMOST),成功地处理和分析了数以千万计的天体光谱并精确地测量了这些天体的参数,对全世界公开发布了世界上最大的光谱库和天体参数表.这个系统的应用和所发布的数据不仅是我国在银河系研究走到世界前列的基础,同时也为大数据和人工智能方面的研究提供了标准的数据库. 罗阿理 张昊彤 崔辰州 赵永恒 白仲瑞 陈建军 樊东卫 张健楠 何勃亮 袁海龙 杜冰 吴悦 雷亚娟 宋轶晗 孔啸 邬科飞 郭炎鑫 左芳 董义乔 李荫碧 侯文 王瑞 李珊珊 汪梦欣 王有芬 汪霞关键词:天体光谱 天文学 海量数据 基于聚类的星系光谱分析 被引量:2 2020年 各类大型巡天项目产生了海量的天文数据,因此,需要研究适用于大规模数据的光谱自动处理方法.传统的基于谱线检测或BPT(Baldwin,Phillips,Terjevich)诊断图的星系光谱分类方法难以直接应用于星系光谱自动分类,相比之下,基于机器学习的光谱自动分析更适用于海量天文数据的分类研究.提出一种基于双层聚类的星系光谱分析方法.第1层采用k均值聚类算法将星系光谱分为吸收线星系和发射线星系,第2层使用CLARA(Clustering LARge Applications)聚类算法将发射线星系聚为5簇.对LAMOST DR5的星系数据进行实验,结果表明:(1)第1层k均值聚类能够成功将星系光谱分为吸收线星系和发射线星系,聚类簇与基于谱线检测的分类结果基本一致.(2)第2层CLARA聚类结果能够在BPT图中反映出不同的星系类型.(3)光谱聚类结果与颜色星等图分类存在预期的相关性.(4)k均值聚类和CLARA聚类能够适用于大规模数据自动分析处理,聚类结果能够很好地反映星系的物理性质和演化过程,簇心数据可以为光谱自动分类系统提供模板. 张茜 张茜 张健楠关键词:LAMOST 聚类