雖然人類的參考基因組(human reference genome)是目前最準確、最完整的脊椎動物基因組,但即使經過 20 年改進,完整的 DNA 序列始終存在缺口。現在,一組國際遺傳學團隊首次確定了人類 X 染色體從頭到尾(端粒到端粒)的完整序列,沒有空缺且準確性達到空前水準。
對一般人類來說,23 對染色體中有一對稱為性染色體(決定性別),女性的性染色體中有 2 條 X 染色體(X chromosome),男性則 X、Y 染色體各有 1 條,然而這 2 個 X 染色體並不相同,它們的 DNA 序列存有許多差異。
來自美國國立衛生研究院(NIH)國家人類基因組研究所(NHGRI)、加州大學聖克魯斯分校、華盛頓大學醫學院等 20 多個機構的科學家們,沒有選擇利用一般人類細胞的 X 染色體進行測序,而是挑選一種特殊細胞類型,它們具有 2 個相同的 X 染色體。
過去基因組測序遇到的一個大問題是,傳統技術一次只能讀取 DNA 的短片段,然後科學家將之一段一段拼湊起來,但當這些片段一遍又一遍重複時,拼裝工作就變得困難重重,團隊形容就像在組裝單一色彩的拼圖。
此外,X 染色體最難探索的區域是高度濃縮的著絲粒(centromere),為了解決這個難題,研究團隊使用新方法讀取更長的 DNA 序列,其中一種稱為奈米孔技術,讓單個 DNA 分子穿過一個小孔,然後藉由檢測電流變化來進行測序,一次能讀取數十萬個鹼基對,跨過曾經被當作難處理的區域。
最終,研究團隊得以填補著絲粒的研究空白地帶,包括發現約 310 萬個之前映射不出的 DNA 鹼基對,並發現在參考序列中有缺口的區域,實際上是變異最豐富的區域。
這項發現有助於解開更多人類疾病與生物學謎團,X 染色體只是個開始,團隊表示,他們計畫在 2020 年底之前將其他染色體 DNA 序列全部測出,也許我們很快就會擁有完整的人類基因組序列。
新論文發表在《自然》(Nature)期刊。