生命科學(xué)學(xué)院碩士研究生在國際進(jìn)化生物學(xué)權(quán)威刊物發(fā)表論文

首都師范大學(xué)招生辦
2021-9-26 23:24:29 文/毛曉莉 圖/黃浩然
日前,我校生命科學(xué)學(xué)院遺傳多樣性與進(jìn)化團(tuán)隊(duì),提出了一種基于深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的物種識(shí)別新方法,構(gòu)建了一種新的深度學(xué)習(xí)網(wǎng)絡(luò)模型(MMNet),首次實(shí)現(xiàn)了將形態(tài)學(xué)和分子數(shù)據(jù)自動(dòng)化整合用于物種鑒定。該模型在具有廣泛代表性的實(shí)際數(shù)據(jù)中進(jìn)行集中測試,結(jié)果表明所提出的MMNet新方法顯著優(yōu)于常用的利用單一數(shù)據(jù)的方法。其中,甲蟲數(shù)據(jù)集的識(shí)別準(zhǔn)確率為98.1%、蝴蝶數(shù)據(jù)集的識(shí)別準(zhǔn)確率為98.8%、魚類數(shù)據(jù)集的識(shí)別準(zhǔn)確率為96.3%、蛾類準(zhǔn)確率96.4%。此外,新的MMNet方法在更具有挑戰(zhàn)性的同屬近緣種的識(shí)別中也具有極高的識(shí)別準(zhǔn)確性(大于98%)。新方法對序列長度和圖像大小具有較強(qiáng)的魯棒性,進(jìn)一步分析表明形態(tài)數(shù)據(jù)和遺傳數(shù)據(jù)對模型都很重要,遺傳數(shù)據(jù)的貢獻(xiàn)相對較大。這項(xiàng)成果9月15日在線發(fā)表于國際著名進(jìn)化生物學(xué)期刊《系統(tǒng)生物學(xué)》(Systematic Biology, IF=15.683, ranking 3/50, Evolutionary Biology;ranking 7/647,Ecology, Evolution, Behavior and Systematics)。我校生命科學(xué)學(xué)院碩士研究生楊炳為論文的第一作者,資源環(huán)境與旅游學(xué)院青年教師張振鑫副教授,為論文共同第一作者和共同通訊作者,張愛兵教授為論文最后通訊作者。
圖1. 本研究提出的新的MMNet網(wǎng)絡(luò)模型
生物多樣性是生命長期演化的結(jié)果,也是人類文明賴以生存的基礎(chǔ),人類對于生物多樣性的認(rèn)知在近幾十年取得許多重要進(jìn)展,然而作為現(xiàn)代分類學(xué)重要基礎(chǔ)的經(jīng)典林奈分類學(xué),面臨著趨同進(jìn)化、表型可塑性的重要挑戰(zhàn);另一方面新興的DNA分類方法則由于基因漸滲、不完全譜系分選和基因水平轉(zhuǎn)移現(xiàn)象而導(dǎo)致物種鑒定存在潛在謬誤。雖然整合分類學(xué)思想早在2005年就被提出,但在過去的16年間,鮮有相關(guān)的新算法報(bào)道,尤其是基于深度學(xué)習(xí)的整合新算法
MMNet新方法為進(jìn)一步整合圖像、音頻、視頻、三維掃描和生物傳感器等多模態(tài)信息進(jìn)行整合分類奠定了基礎(chǔ),而且能夠更全面地描述生物特征,為進(jìn)一步開展生物多樣性調(diào)查、監(jiān)測和保護(hù)奠定基礎(chǔ)。該工作在審稿過程中被審稿人及專題副主編評價(jià)為對系統(tǒng)生物學(xué)研究的重要貢獻(xiàn)“a valuable contribution to Systematic Biology”。
本次科研成果的發(fā)表是張愛兵教授繼2008年在國際上提出基于人工智能的DNA條形碼物種識(shí)別新方法以來(Zhang et al. 2008. Syst. Biol. ),首次以首都師范大學(xué)為第一單位指導(dǎo)研究生在該國際著名進(jìn)化生物學(xué)期刊發(fā)表研究成果。研究獲國家杰出青年基金、國家自然基金面上項(xiàng)目及首都師范大學(xué)交叉科學(xué)研究院交叉項(xiàng)目資助。
# 論文相關(guān)信息 #
1. Yang,B,Z.X. Zhang, C.Q. Yang, Y. Wang, Mi. C. Orr, H.B. Wang, A.B. Zhang. (2021). Identification of Species by Combining Molecular and Morphological Data Using Convolutional Neural Networks,Systematic Biology, 2021; syab076,https://網(wǎng)址未加載/10.1093/sysbio/syab076.
2. Zhang, A. B., D. S. Sikes, C. Muster, S. Q. Li. (2008). Inferring Species Membership using DNA sequences with Back-propagation Neural Networks. Systematic Biology, 57(2):202-215. http://academic.網(wǎng)址未加載/sysbio/article/57/2/202/1622290.
來源:首都師范大學(xué)官網(wǎng)