神州學人網訊 在生命科學研究中,“RNA修飾”就像基因表達的“隱形開關”,控制著細胞何時、以何種方式制造蛋白質。其中最常見的一種叫m6A(N6-甲基腺苷),它影響著RNA的穩定性和蛋白質合成效率,被認為與細胞功能乃至疾病發生密切相關。
長期以來,這個領域一直存在一個“煩惱”:不同實驗室得到的結果經常對不上。同一個基因、同一個核苷酸位點,在一篇論文里被標成“有修飾”,在另一篇論文里卻顯示“沒有”。這種結果前后不一致的情況,讓科研人員很難判斷究竟哪些修飾是真實的、能重復驗證的。而這一混亂狀況終于有望改變。
統一標準:讓全球數據“對齊”
近日,西交利物浦大學理學院生物科學與生物信息學系魏震博士團隊,聯合利物浦大學研究者,在國際權威期刊《核酸研究》(Nucleic Acids Research)上發表最新成果,推出了全球首個整合多種m6A檢測技術并通過交叉驗證的數據庫——m6AConquer。
魏震形象地說:“過去研究者各說各話,現在終于有了一個能‘對齊’所有數據的共同坐標系?!?/p>
簡單來說,m6AConquer整合了來自十種實驗技術和數百個公開數據集的m6A測序結果,并通過引入“正交驗證”的算法,篩選出了能夠在多種采用不同生化原理的m6A檢測技術中重復驗證的修飾位點。這意味著,研究者終于有了一個可靠、統一、可驗證的數據基準。

m6AConquer: 在十種m6A修飾檢測技術上實現一致量化和正交驗證的數據分享平臺
一臺“RNA修飾真偽檢測儀”
在生動的比喻下,m6AConquer可以被看作一臺“RNA修飾真偽檢測儀”。它幫助科研人員區分哪些信號是可重復的生物學標記,哪些只是偶然的實驗噪音。
研究團隊借鑒了國際著名的ENCODE人類基因組計劃的統計框架,采用IDR模型衡量不同檢測方法之間的結果一致性。最終,他們識別出了超過13.5萬個高置信度的m6A修飾位點(IDR<0.05),這些位點在不同的正交實驗技術之間表現出統計顯著的可重復性。
魏震解釋:“這項分析首次在該領域中建立了嚴謹的真實標準(ground truth)數據集,讓不同m6A檢測方法的性能評估成為可能??蒲腥藛T可以直接利用這些經過多平臺驗證的修飾位點作為統一參考,不再需要為技術差異反復調整。這樣不僅提高了研究的一致性和可重復性,也為后續算法開發與疾病機理研究提供了可靠的參照系?!?/p>

使用被正交驗證的m6A位點作為真實標準(ground truth)來準確評估不同m6A檢測方法的性能
從“能信”到“能用”:科研的基礎設施
除了確保數據的可靠性,魏博士團隊還關注“可用性”——如何讓這些數據更容易被科學家使用。
m6AConquer建立了一個標準化的數據共享框架,把原本分散、復雜的多組學原始數據重新整理為“分析就緒”的矩陣化格式。這就像把散落在不同國家的字典整合成同一種語言版本,研究人員無需再花大量時間清洗、對齊數據,就能直接開展比較、建模和驗證,大幅提升科研效率與可復現性。

m6AConquer構建的多組學數據分享框架(Multi-Omics Data-Sharing Framework)
連接基因變異與疾病機制的新窗口
更令人興奮的是,m6AConquer不僅整合了修飾數據,還將RNA修飾與基因變異、基因表達和疾病風險相結合。研究團隊發現了6000多個與高置信度m6A位點修飾水平顯著相關的基因變異(m6A-QTL),揭示了遺傳差異如何影響RNA修飾,從而改變基因的調控方式。其中一些變異位于精神疾病、抑郁癥等復雜疾病的風險區域,為科學家理解這些疾病的分子機制提供了新的切入點。魏震解釋道:“這意味著我們不僅能看到RNA修飾的‘結果’,還開始理解它背后的‘原因’。有些基因突變可能正是通過影響RNA修飾水平,間接改變了疾病風險。”
魏震表示,m6AConquer不僅是一個數據資源,更是連接遺傳變異、RNA修飾與疾病發生的橋梁。同時,它也為未來利用高置信度數據開展人工智能建模、RNA修飾預測和藥物靶點研究奠定了堅實基礎?!拔覀兿M@一開放資源能夠成為推動表觀轉錄組學從‘數據整合’走向‘機制理解’的重要一步?!?/p>
目前,m6AConquer數據庫和所有分析工具已在網站 rnamd.org/m6aconquer免費向全球科研人員開放。(供稿/西交利物浦大學)
文章中觀點僅代表作者個人觀點,不代表本網站的觀點和看法。
神州學人雜志及神州學人網原創文章轉載說明:如需轉載,務必注明出處,違者本網將依法追究。