CASIA OpenIR  > 毕业生  > 博士学位论文
机器学习在光谱巡天中的应用研究
其他题名Application Research of Machine Learning in Spectroscopic Sky Survey
司建敏
学位类型工学博士
导师吴毅红 ; 罗阿理 ; 赵永恒
2014-05-25
学位授予单位中国科学院大学
学位授予地点中国科学院自动化研究所
学位专业模式识别与智能系统
关键词标记传播 流形排序 核密度估计 K-近邻 稀有天体 Label Propagation Manifold Ranking Kernel Density Estimation Knn Rare Objects
摘要随着望远镜技术的发展,光谱巡天的光谱获取能力越来越强,最具有代表性的多目标光纤数字巡天项目有美国的 Sloan Digital Sky Survey (SDSS) 和中国的 Large Sky Area Multi-Object Fiber Spectroscopic Telescope (LAMOST)。SDSS 观测能力由 I 期同时观测 640 个目标增加到 III 期同时观测 1000 个目标,目前共发布了 400 多万条光谱;LAMOST 光谱获取能力更强,每次观测能获得 4000 条光谱,每个观测夜能获取近 2 万条光谱,目前仅仅两年的时间已经发布了 200 多万条光谱。在海量的光谱中存在着许多稀有的有意义的特殊天体,利用机器学习算法快速有效的搜寻这些有意义的特殊天体对特殊天体的后继研究和分析具有非常重要的意义。针对这个问题,本文的主要工作如下: 1)在 SDSS 海量光谱中应用标记传播学习算法成功搜寻 1573 个碳星和 188 个 DZ 白矮星,其中 260 个碳星和 29 个 DZ 白矮星是新发现的,还搜寻到 11 个包含碳星成分和白矮星成分的复合系统。通过自行速度,96 个碳星被确认为矮碳星,7 个被确认为巨碳星;通过对 11 个复合系统分解确定了 10 个白矮星成分类型为 DA 型白矮星,1 个为非常稀有的热的 PG1159 型白矮星,这些都是特殊的天体,其中一部分很可能是非常稀有的 DA/dC 双星系统,它们对于研究恒星演化和银河系动力学都有着非常重要的意义;通过 PCA 重构确定了这些新发现的 DZ 白矮星都是典型的 DZ 白矮星;通过和 SDSS 白矮星自行速度对比,新发现的 DZ 白矮星与目前被 SDSS 观测到的白矮星一样有较大的自行速度;通过拟合有效温度与 g-r 的颜色的关系确定了 DZ 白矮星的有效温度,在 29 个 DZ 白矮星中有 12 个温度较低,其中 9 个有效温度在 6000K 到 6600K 之间,3 个低于 6000K,这些 DZ 白矮星的发现进一步填充了 DZ 白矮星的低温序列。 2)应用快速的流形排序学习算法在 LAMOST 海量光谱中搜索碳星。分析了算法在不同参数取值和不同特征下的性能,将中值滤波的光谱和扣除连续谱的同时作为特征时,能够极大的提高算法的性能,并且对参数取值有很强的鲁棒性。此外,该算法速度快,内存占有少,能够应用于在光谱获取率极高的 LAMOST 光谱巡天数据中搜寻感兴趣天体。利用该算法在 LAMOST 先导巡天数据 717,660 条光谱中共搜寻到 183 个碳星和 1 个由碳星成分和 PG1159 型白矮星成分组成的复合系统,其中 158 个碳星是我们新发现的。根据光谱的特征,58 个被分类为 C-H 型, 11 个为 C-H 型候选体,56 个为 C-R 型,10 个为 C-R 型候选体,30 个为 C-N 型,3 个为 C-N 型候选体,4 个为 C-J 型,10 个因为光谱质量差而没有对其光谱型分类。在 C-N 型碳星中有 1 个非常特殊,它的光谱中有很明显的 CaII H&K 吸收线,这在 C-N 星中是非常罕见的;利用模板匹配和 Cj-index 的方法确认了 C-J 型碳星,依据自行速度,确认了 21 个 矮碳星;分析了不同光谱型和光度型在 JHKs 空间中的分布,利用 SVM 算法给出了基于 JHKs 测光的 C-H 和 C-N 型碳星的最优分类面;与星表 GALEX 交叉匹配,发现 3 个可能的碳双星;通过和 Northern Sky Variability Survey (NSVS) 数据...
其他摘要The ability of spectroscopic sky survey to obtain spectra is increasingly growing with the development of telescope technology. The Sloan Digital Sky Survey (SDSS) and the Large Sky Area Multi-Object Fiber Spectroscopic Telescope (LAMOST) are two of the most important multi-object fiber spectroscopic sky surveys. Number of fiber of SDSS has been increased up to 1000 from 640 and the SDSS has released more than 4,000,000 spectra. The LAMOST can observe 4000 objects one time and has released more than 2,000,000 spectra for only two years. There are many interesting and rare stellar objects, and it is quite significant for the followed research and analysis to search for these special objects from massive spectra database automatically and fast using machine learning algorithm. Our main contributions of this thesis are as follows. 1) We have applied the label propagation algorithm to search for carbon stars and DZ white dwarfs from Data Release Eight (DR8) of the Sloan Digital Sky Survey (SDSS), which is verified to be quite efficient. From nearly two million spectra including stars, galaxies, and QSOs, we have found 260 new carbon stars in which 96 stars have been identified as dwarfs and 7 identified as giants, and 11 composition spectrum systems (each of them consists of a white dwarf and a carbon star). Similarly, using the label propagation method, we have obtained 29 new DZ white dwarfs from SDSS DR8. Compared with spectra reconstructed by PCA, the 29 new findings are typical DZ white dwarfs. We have also investigated their proper motions by comparing them with proper motion distribution of 9,374 white dwarfs, and found that they have similar proper motions with the current observed white dwarfs by SDSS. In addition, we have estimated their effective temperatures by fitting the polynomial relationship between effective temperature and g-r color of known DZ white dwarfs, and found 12 of the 29 new DZ white dwarfs are cool, in which nine are between 6000K and 6600K, and three are below 6000K. 2)We have applied efficient manifold ranking learning algorithm to search for carbon stars in the LAMOST pilot survey. The performance of the efficient manifold ranking in searching for carbon stars from SDSS DR8 stellar spectra is verified comprehensively using variety of features and parameter values. It is shown that the algorithm is robust to parameters with various values, and the performance can be significantly improved if we use median filtered spectra f...
馆藏号XWLW1985
其他标识符201018014628056
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/6605
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
司建敏. 机器学习在光谱巡天中的应用研究[D]. 中国科学院自动化研究所. 中国科学院大学,2014.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CASIA_20101801462805(8967KB) 暂不开放CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[司建敏]的文章
百度学术
百度学术中相似的文章
[司建敏]的文章
必应学术
必应学术中相似的文章
[司建敏]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。