玉米雜交種幾個農藝性狀的主成分分析
來源:環(huán)球糧機網發(fā)布時間:2015-06-15 13:13:24
對吉林省種植的晚熟玉米雜交種的8個主要農藝性狀進行主成分分析,結果表明在所有的主成分構成中,信息主要集中在前5個主成分,其累積貢獻率達到87.95%,主成分1貢獻率最大,為32.39%,其次為主成分2、3、4、5,貢獻率分別為20.51%、14.65% 、11.63%、8.77%,可以概括這些雜交種農藝性狀的絕大部分信息。
關鍵詞:玉米;農藝性狀;主成分分析
中圖分類號:S513 文獻標識碼:A
玉米是吉林省主要糧食作物之一,提高玉米產量具有十分重要的意義。主成分分析在小麥,水質評價等方面都有很大的應用[1-2]。玉米產量是一個是多個農藝性狀共同作用的結果。而這些性狀之間又相互作用、相互影響,對玉米產量的貢獻各不相同。本研究采用主成分分析法對其主要農藝性狀進行分析,找出對育種目標有益的綜合指標,為玉米育種和生產提供理論依據[3-9]。
1 材料與方法
1.1 試驗材料
對29個晚熟玉米雜交種(N1301~N1329),采用隨機區(qū)組設計,每個品種種植10m行長、5行區(qū)、3次重復。本試驗點位于公主嶺,測定容重、百粒重、穗長、穗粗、禿尖、株高、穗位。
1.2 試驗方法
主成分分析[10-11]是把多個指標化為少數幾個綜合指標的一種統(tǒng)計分析方法,找出幾個綜合因子來代表原來眾多的變量,從而達到簡化的目的。特征根代表綜合指標(主成分)遺傳方差的大小,特征向量表示各個性狀對綜合指標貢獻的權重,并根據特征根的大小依次排序,計算出信息累計貢獻率,本文以累計貢獻率大于85%的原則選擇主成分。
1.2.1 設樣本數為n,指標數為p的數據矩陣
1.2.2 將原始數據進行標準化處理
為標準化的數據,,分別為第j個指標平均值,標準差。
1.2.3 計算相關矩陣
將標準化的指標進行相關分析,得相關系數矩陣:
1.2.4 對相關矩陣用雅克比法求特征方程
的非負特征值,和相應特征向量。
方差大對模型貢獻率大,方差小對模型貢獻率小,新變量分別稱為第1主成分、第2主成分和第p主成分。
1.2.5 計算主成分貢獻率及累計貢獻率
主成分貢獻率:
累計貢獻率:
1.2.6 選擇主成分
前m個主成分提供了85%以上的信息量,則取特征值所對應的第1,第2,第m個主成分。
表1玉米雜交種農藝性狀平均值
編號 容重/
?。╣/l) 百粒重
/g 穗長/cm 穗粗/cm 禿尖/cm 株高/cm 穗位/cm 莖粗/cm
N1301 657.0 38.2 20.6 5.9 1.6 279.0 146.0 2.1
N1302 728.0 39.6 21.2 5.2 1.2 291.0 141.0 2.3
N1303 706.0 34.5 22.4 5.4 0.3 293.0 144.0 2.2
N1304 714.0 37.7 21.2 5.8 0.6 323.0 160.0 2.2
N1305 679.0 37.5 21.3 5.9 1.3 295.0 134.0 2.5
N1306 698.0 39.1 21.4 5.5 0.6 278.0 126.0 2.6
N1307 698.0 40.2 22.0 5.7 1.4 284.0 135.0 2.4
N1308 689.0 38.7 22.2 5.4 0.3 272.0 134.0 2.4
N1309 707.0 41.9 23.1 5.2 1.1 269.0 121.0 2.8
N1310 725.0 38.8 21.5 5.5 0.9 278.0 140.0 2.2
N1311 664.0 38.6 20.4 6.0 1.8 294.0 152.0 2.2
N1312 720.0 36.7 21.0 5.6 0.6 294.0 142.0 2.2
N1313 700.0 38.8 21.5 4.9 0.4 267.0 122.0 2.2
N1314 749.0 40.9 20.4 5.6 0.6 249.0 107.0 2.2
N1315 707.0 38.1 21.2 5.6 1.0 266.0 131.0 2.2
N1316 707.0 38.0 19.2 5.6 0.5 287.0 141.0 2.4
N1317 725.0 34.3 19.8 5.5 1.6 258.0 123.0 2.2
N1318 706.0 38.3 20.4 5.4 1.5 272.0 127.0 2.3
N1319 678.0 37.5 21.7 5.4 1.3 245.0 155.0 2.2
N1320 724.0 38.7 22.2 5.2 0.2 256.0 128.0 2.3
N1321 726.0 37.2 19.9 5.1 0.3 257.0 117.0 2.4
N1322 691.0 35.0 22.4 5.5 0.5 279.0 131.0 2.6
N1323 697.0 39.6 20.5 5.4 1.1 262.0 118.0 2.3
N1324 682.0 38.6 19.7 5.9 0.5 293.0 143.0 2.2
N1325 731.0 38.6 22.6 4.9 0.6 268.0 127.0 2.5
N1326 654.0 34.2 20.1 5.7 1.8 243.0 117.0 2.3
N1327 680.0 37.4 21.8 5.7 0.7 254.0 119.0 2.3
N1328 722.0 40.9 24.1 5.4 0.9 277.0 137.0 2.3
N1329 702.0 45.2 20.8 5.5 0.9 278.0 139.0 2.3
2 結果與分析
2.1 主成分分析
對以上8個農藝性狀進行主成分分析,數據通過SPSS軟件處理,計算特征根與特征向量。
在所有的主成分構成中,信息主要集中在前5個主成分,其累積貢獻率達到87.95%。主成分1的特征值λ1=2.5915,貢獻率最大,為32.39%,其次為主成分2、3、4、5,特征值分別為λ2=1.6404、λ3=1.1721、λ4=0.9300、λ5=0.7019,貢獻率分別為20.51%、14.65%、11.63%、8.77%(見表2)。
主成分1的特征向量中,載荷較大且數值為正的性狀依次為株高、穗位、莖粗等,此類性狀與植株的生長勢有關,可稱為生長勢因子。其中,以株高的載荷量最大,說明植株越高、穗位越高,莖越粗,生長勢也越強。載荷較大且數值為負的性狀依次為穗長、容重,說明伴隨著株高、穗粗等的增加,穗長、容重呈下降趨勢,即盲目追求過大過多的株高、穗位、穗粗等,將會造成穗長、容重的下降。主成分2的特征向量中,載荷較大且數值為正的性狀依次為穗粗、百粒重和穗長,此類性狀與產量有關,可稱為產量因子,說明穗越粗大,百粒重就越高。載荷較大且數值為負的性狀依次為株高、容重,即過多追求大穗、粗穗,容重就會降低,株高也會降低,即生長勢因子也會降低。主成分3的特征向量中,載荷較大且數值為正的性狀依次為穗長、穗位和百粒重,可稱為穗部因子,說明穗越大、穗位越高,百粒重也會增加。載荷較大且數值為負的性狀依次為禿尖、容重和莖粗,即穗位過高或穗過長、百粒重過高,會造成禿尖的增加。主成分4的特征向量中,載荷較大且數值為正的性狀依次為穗位、容重、莖粗等,說明穗位越高,一般情況下莖粗也要增加。載荷較大且數值為負的性狀依次為株高和百粒重。主成分5的特征向量中,載荷較大且數值為正的性狀依次為株高、容重、穗長和穗粗,以株高的載荷最大,說明生長勢因子越大,在某種程度上可以帶來產量因子的提高。載荷較大且數值為負的性狀依次為百粒重和禿尖。
表2 8個農藝性狀的主成分分析
主成分 特征根/λ 貢獻率/% 累計貢獻率/% 特征向量
容重/(g/l) 百粒重/g 穗長/cm 穗粗/cm 禿尖/cm 株高/cm 穗位/cm 莖粗/cm
1 2.5915 32.3943 32.3943 -0.4030 0.2055 -0.4726 0.2289 0.0627 0.5444 0.3407 0.3207
2 1.6404 20.5055 52.8997 -0.1781 0.2602 0.2549 0.8576 0.0263 -0.3023 -0.0839 -0.0299
3 1.1721 14.6515 67.5512 -0.2924 0.3557 0.4228 -0.2482 -0.5744 -0.0347 0.4532 -0.1056
4 0.9300 11.6254 79.1766 0.5275 -0.0050 0.1202 0.0793 0.2881 -0.1880 0.6982 0.3083
5 0.7019 8.7740 87.9506 0.3385 -0.3287 0.3825 0.2985 -0.2691 0.6793 -0.0260 -0.0858
6 0.4753 5.9412 93.8918 0.2734 0.6225 -0.0326 -0.0582 0.3404 0.2696 0.0015 -0.5872
7 0.3425 4.2817 98.1735 0.3916 0.5122 -0.0363 -0.0600 -0.3037 0.0364 -0.3970 0.5729
8 0.1461 1.8265 100.0000 -0.3148 0.0751 0.6080 -0.2192 0.5495 0.2005 -0.1604 0.3311