收集現(xiàn)場數(shù)據(jù)的高通量技術(shù)使得在生命科學(xué)的幾個分支進行大規(guī)模觀測成為可能。收集的數(shù)據(jù)范圍可以從分子水平(基因型)到生理(表型特征)和環(huán)境觀察(例如天氣、土壤條件)。這些大量的數(shù)據(jù)被統(tǒng)稱為表型學(xué)數(shù)據(jù),代表了潛在生物系統(tǒng)動力學(xué)的關(guān)鍵科學(xué)知識的寶庫。然而,由于這些復(fù)雜數(shù)據(jù)集的多維性和對其復(fù)雜結(jié)構(gòu)的先驗知識的缺乏,從這些復(fù)雜的數(shù)據(jù)集中提取信息和見解仍然是一項重大挑戰(zhàn)。
比較Hippo-X(HX)與Pheno Mapper的特征。藍色表示“是”(Y),粉紅色表示“不”(N)。
在本文中,作者介紹了Pheno-Mapper,一個用于探索性分析和可視化大規(guī)模現(xiàn)象數(shù)據(jù)的交互式工具箱。作者的方法是使用mapper框架對數(shù)據(jù)進行拓?fù)浞治觯缓笫褂脙?nèi)置的數(shù)據(jù)分析和機器學(xué)習(xí)功能呈現(xiàn)可視化表示。作者在真實的植物(如玉米)現(xiàn)象數(shù)據(jù)集上演示了這一新工具的實用性。
Pheno-Mapper 的用戶界面
與現(xiàn)有方法相比,Pheno-Mapper的主要優(yōu)勢在于它提供了豐富的、交互式的對物候數(shù)據(jù)進行探索性分析的能力,并且它以一種易于擴展的方式將可視化分析與數(shù)據(jù)分析和機器學(xué)習(xí)相結(jié)合。特別是,Pheno-Mapper允許在數(shù)據(jù)拓?fù)淇偨Y(jié)的指導(dǎo)下進行子種群的交互選擇,并將數(shù)據(jù)挖掘和機器學(xué)習(xí)應(yīng)用于這些選定的子種群進行深入探索。
來源:Pheno-Mapper: An Interactive Toolbox for the Visual Explorationof Phenomics Data.
Youjia Zhou,Methun Kamruzzaman,Patrick Schnable,Bala Krishnamoorthy,Ananth Kalyanaraman,Bei Wang
https://arxiv.org/pdf/2106.13397.pdf