? ? 香港赛马会会资料大全
主頁 > 科技服務 > 基因組 > GWAS關聯分析 >
GWAS關聯分析

什么是GWAS?

GWAS分析方法的原理是,在全基因組范圍內選擇遺傳變異進行基因分型,統計分析每個變異與目標性狀之間的關聯性大小,最終確認其與目標性狀之間的相關性。


GWAS技術路線圖

樣本選取原則


1.保證選取的群體能夠具有足夠的代表性

2.樣本中不能有明顯的亞群分化(例如生殖隔離等),因為明顯的分化的群體會使得遺傳背景的噪音較大

3.建議選擇幾個比較重要的表型性狀作為研究的重點
         
數量性狀:盡量選取目標表型有明顯差異的個體,且表型的性狀分布基本符合正態分布,保證有足夠的多態性
   
質量性狀:(case-control)每個群體(對照研究)選取一定量的樣本


實驗流程


文庫構建:500bp/200bp小片段文庫

測序深度:重測序3-10X;轉錄組2-6G;
 


文獻解讀

英文題目:2015-Genetic discovery for oil production and quality in sesame 

群體選擇共705份,中國405份 traditional landraces,95 份modern cultivars,來自于其它28個國家的 205 份accessions,所有樣品至少自交四代

測序平臺Illumina Hiseq2500

測序深度全基因組重測序,平均2.6X,并選擇兩個有代表性的品種Baizhima 以及 Mishuozhima 進行高深度70X測序并進行de novo組裝

性狀研究54個農藝性狀,在4個環境下測定,主要是產油性狀及油質量性狀

基因型填充k-nearest neighbour-based method (http://www.ncgr.ac.cn/fimg/down.html). 基因型缺失率從47.9% 降到 3.7%. 隨機選了10個個體進行16X重測序,檢測基因型填充準確性,發現一致性達97.8%

群體變異檢測:共檢測到SNP 5,407,981個,其中非同義突變254781個,覆蓋了芝麻基因數的96.8%;對兩個代表品種進行高深度重測序并拼接,contig N5047K

結果與討論
群體結構分析:進化樹發現可以分為南北方,Fst分析結果表明兩個群體之間分化不顯著(0.02)有研究報道芝麻起原于南亞地區,北方的品種可能是經歷長期馴化形成的,但是群體分化分析表明,兩個品種之間差異并不顯著,現代栽培品種的基因組雜合度略高于傳統的栽培品種,綜上,鑒于群體分化指數較低,群體分層不顯著,且現代與傳統栽培品種差別也不是很明顯,本群體適于進行GWAS分析。

 

表型數據調查:對表型數據進行分布圖繪制,大多數有豐富的表型變異GWAS前可以讓客戶簡單做一下表型分布調查,評估性狀是否適合進行GWAS分析

 

全基因組關聯分析:篩選MAF大于0.03180萬個SNP用進GWAS分析,分析4個環境下的56個重要農藝性狀,通過功能分析,得到46個候選基因

 

全基因組關聯分析熱點:GWAS顯著的SNP位點進行熱點區統計,具體是以500K為步長進行劃窗,窗口內顯著的SNP大于5個計為熱點區域,全基因組共找到17個熱點區域

 

油份和組成主效基因:對含油量進行GWAS分析,得到13個顯著的位點,有四個基因在脂酶及脂肪轉運蛋白代謝途徑中顯著影響油份含量的幾個位點中,有4個都是與油脂合成相關,其余的兩個中,最顯著的信號在SiNST1基因中,同樣也最顯著地影響芝麻素,芝麻酚及蛋白含量性狀,發現高油品種中是C型,低油品種中是A型,同時木質素含量相反地是A型高于C型,而且報道發現此基因處于木質素合成通路中,由此推測由于加速木質素合成影響了其它營養物質的合成;另外一個SiPPO基因,發現突變型在種子中幾乎不表達,而且通過選擇清除分析發現此基因處于強烈的選擇狀態,而且此基因還顯著影響了種皮性狀,預測這個基因編碼產生黑色素的酶類,可能會影響黑,白芝麻的形成,但是如何影響油份性狀還不清楚

 

蒴果數主效基因:蒴果數是產量性狀,GWAS定位到一個顯著的錯義突變位點,并且通過保守性分析,發現這個位點是極度保守的

參考文獻:

Wei X, Liu K, Zhang Y, et al. Genetic discovery for oil production and quality in sesame[J]. Nature communications, 2015, 6.

?
科技服務 技術支持 聯系我們 市場活動 關于我們
香港赛马会彩图会员料