PCA mintapélda Matlabban

A Matlab matematikai programcsomag tartalmazza a főkomponens-analízis módszerét is. A princomp(X) függvény a könyvben megadott lépéseket követve előbb kiszámolja a kovarianciamátrixot, majd meghatározza a kapcsolódó sajátértékeket és sajátvektorokat. Az eljárás bemenetként olyan adatmátrixot vár, amelyben az adatok várható értéke minden koordináta mentén zérus. Az X  mátrixban a vektorokat sorvektorként kell megadni. Példánkban az alábbi kétdimenziós vektorokból indulunk ki:

〈1.0, 1.8〉, 〈2.1, 4.2〉, 〈0.7, 1.6〉, 〈0.5, 1.1〉,
〈1.3, 2.5〉, 〈2.3, 4.4〉, 〈1.8, 3.5〉, 〈1.4, 2.7〉.

A főkomponensek meghatározása az alábbi Matlab-parancsokkal történik:

Az eredményből kiolvasható, hogy a Pca-elemzés egy olyan új bázisrendszert készített, amelyben a második dimenzió irányában a koordinátaértékek zérushoz közeliek. Ezen dimenziót elhagyva a pontok egymás közötti távolságviszonya nem változik számottevően. A második dimenzió szerepének kicsiny jelentőségét a hozzá tartozó sajátérték igen kis értéke is jól mutatja.


PIC
1. ábra. Főkomponens-irányokra történő áttérés


Az 1. ábrán látható, hogy az új (i′,j′)  koordináta-rendszerben az i′ bázisvektor irányában jelentős, míg a  ′
j bázisvektor irányában igen kicsi a koordinátaértékek varianciája. A  ′
j dimenziót elhagyva tehát kicsiny információveszteséggel csökkenthető az eredeti adathalmaz dimenziója.