Karelerin Toplamı Nedir?
Karelerin toplamı, veri noktalarının dağılımını belirlemek için regresyon analizinde kullanılan istatistiksel bir tekniktir. Regresyon analizinde amaç, veri serisinin nasıl oluşturulduğunu açıklamaya yardımcı olabilecek bir işleve bir veri serisinin ne kadar iyi takılabileceğini belirlemektir. Toplamlar, verilerden en iyi uyan (en az değişen) işlevi bulmak için matematiksel bir yol olarak kullanılır.
Karelerin Toplamı İçin Formül
N öğeden oluşan bir X kümesi için: Karelerin toplamı = i = 0∑n (Xi −X) 2 yer: Xi = setX'teki ith öğesi = Setteki tüm öğelerin ortalaması (Xi −X) = Her bir öğenin ortalamadan sapması
Karelerin toplamı, varyasyon olarak da bilinir.
Karelerin Toplamı Size Ne Anlatıyor?
Karelerin toplamı, ortalamadan sapmanın bir ölçüsüdür. İstatistiklerde, ortalama bir sayı kümesinin ortalamasıdır ve en sık kullanılan merkezi eğilim ölçüsüdür. Aritmetik ortalama, veri kümesindeki değerlerin toplanması ve değer sayısına bölünmesiyle hesaplanır.
Diyelim ki Microsoft'un (MSFT) son beş gündeki kapanış fiyatları 74.01, 74.77, 73.94, 73.61 ve 73.40 dolardı. Toplam fiyatların toplamı 369, 73 $ ve ders kitabının ortalama veya ortalama fiyatı 369, 73 $ / 5 = 73, 95 $ olacaktır.
Ancak bir ölçüm setinin ortalamasını bilmek her zaman yeterli değildir. Bazen, bir dizi ölçümde ne kadar varyasyon olduğunu bilmek yardımcı olabilir. Bireysel değerlerin ortalamadan ne kadar uzak olduğu, gözlemlerin veya değerlerin yaratılan regresyon modeline ne kadar uygun olduğuna dair bir fikir verebilir.
Örneğin, bir analist MSFT'nin hisse fiyatının Apple'ın fiyatıyla (AAPL) birlikte hareket edip etmediğini bilmek isterse, her iki hisse senedinin süreci için gözlem kümesini belirli bir süre için listeleyebilir, örneğin 1, 2 veya 10 yıl süreyle saklayın ve kaydedilen her gözlem veya ölçümle doğrusal bir model oluşturun. Her iki değişken arasındaki ilişki (yani AAPL'nin fiyatı ve MSFT'nin fiyatı) düz bir çizgi değilse, veri kümesinde incelenmesi gereken farklılıklar vardır.
İstatistiklere göre, oluşturulan doğrusal modeldeki çizgi tüm değer ölçümlerinden geçmezse, hisse fiyatlarında gözlemlenen değişkenliğin bir kısmı açıklanmamaktadır. Kareler toplamı, iki değişken arasında doğrusal bir ilişkinin olup olmadığını hesaplamak için kullanılır ve açıklanamayan herhangi bir değişkenliğe, karelerin kalan toplamı denir.
Karelerin toplamı, varyasyonun her bir değer ile ortalama arasındaki yayılma olarak tanımlandığı varyasyon karesinin toplamıdır. Karelerin toplamını belirlemek için, her veri noktası ile en iyi uyum çizgisi arasındaki mesafe karelenir ve sonra toplanır. En uygun çizgi bu değeri en aza indirir.
Kareler Toplamı Nasıl Hesaplanır
Şimdi ölçümün neden kare sapmaların toplamı veya kısaca karelerin toplamı olarak adlandırıldığını görebilirsiniz. Yukarıdaki MSFT örneğimizi kullanarak, karelerin toplamı şu şekilde hesaplanabilir:
- SS = (74.01 - 73.95) 2 + (74.77 - 73.95) 2 + (73.94 - 73.95) 2 + (73.61 - 73.95) 2 + (73.40 - 73.95) 2 SS = (0.06) 2 + (0.82) 2 + (- 0.01) 2 + (-0.34) 2 + (-0.55) 2 SS = 1.0942
Karesi açılmadan tek başına sapmaların toplamını eklemek, sıfıra eşit veya sıfıra yakın bir sayı ile sonuçlanacaktır, çünkü negatif sapmalar olumlu sapmaları neredeyse mükemmel bir şekilde dengeleyecektir. Daha gerçekçi bir sayı elde etmek için, sapmaların toplamının karesi alınmalıdır. Karelerin toplamı her zaman pozitif bir sayı olacaktır, çünkü pozitif veya negatif olsun, herhangi bir sayının karesi her zaman pozitiftir.
Karelerin Toplamının Nasıl Kullanılacağına Örnek
MSFT hesaplamasının sonuçlarına dayanarak, yüksek bir kareler toplamı değerlerin çoğunun ortalamadan daha uzak olduğunu gösterir ve bu nedenle verilerde büyük değişkenlik vardır. Düşük bir kareler toplamı, gözlem kümesindeki düşük değişkenliği ifade eder.
Yukarıdaki örnekte, 1.0942, MSFT'nin hisse senedi fiyatındaki son beş gün içindeki değişkenliğin çok düşük olduğunu ve fiyat istikrarı ve düşük oynaklık ile karakterize edilen hisse senetlerine yatırım yapmak isteyen yatırımcıların MSFT'yi tercih edebileceğini göstermektedir.
Önemli Çıkarımlar
- Karelerin toplamı, veri noktalarının ortalama değerden sapmasını ölçer. Daha yüksek bir kareler toplamı sonucu, veri kümesi içinde büyük bir değişkenlik derecesi gösterirken, daha düşük bir sonuç, verilerin ortalama değerden önemli ölçüde değiştiğini gösterir..
Karelerin Toplamını Kullanma Sınırlamaları
Hangi hisse senedinin satın alınacağına ilişkin bir yatırım kararı vermek, burada listelenenlerden daha fazla gözlem gerektirir. Bir analistin, bir varlığın değişkenliğinin ne kadar yüksek veya düşük olduğunu daha yüksek bir kesinlik ile bilmek için yıllarca veri ile çalışması gerekebilir. Kümeye daha fazla veri noktası eklendikçe, değerler daha fazla yayılacağı için karelerin toplamı büyür.
En yaygın kullanılan varyasyon ölçümleri standart sapma ve varyanstır. Ancak, iki metriğin herhangi birini hesaplamak için, önce karelerin toplamı hesaplanmalıdır. Varyans, karelerin toplamının ortalamasıdır (yani, karelerin toplamının gözlem sayısına bölünmesiyle). Standart sapma varyansın kare köküdür.
Karelerin toplamını kullanan iki regresyon analizi yöntemi vardır: doğrusal en küçük kareler yöntemi ve doğrusal olmayan en küçük kareler yöntemi. En küçük kareler yöntemi, regresyon fonksiyonunun gerçek veri noktalarından varyans karelerinin toplamını en aza indirdiği gerçeğini ifade eder. Bu şekilde, verilere en uygun olanı istatistiksel olarak sağlayan bir fonksiyon çizmek mümkündür. Bir regresyon fonksiyonunun doğrusal (düz çizgi) veya doğrusal olmayan (eğri çizgi) olabileceğini unutmayın.