第 15 章 資料分析、平均數、變異數與標準差¶
本章介紹高中數學的重要統計內容:
平均數、中位數、眾數、變異數、標準差、加權平均、資料表處理等。
wxMaxima 雖不是專用統計軟體,但提供足夠的資料處理能力,能協助學生快速檢查答案。
15.1 建立資料列表¶
wxMaxima 使用 list 來存放資料:
data : [5, 7, 3, 9, 10, 4];
load(descriptive)$ /* 載入統計需要的套件 */
mean(data);
mean(data), numer;
加上 numer,以小數表示。
平均數也可用定義,把總和除以項數:
sum(data[i], i, 1, length(data)) / length(data);
median(data);
因為這筆資料有 6 項,這裡傳會中間 2 個數的平均。
15.4 眾數(mode)¶
最常出現的數值。
wxMaxima 沒有直接代表眾數的指令。
可以用其它方法觀察:
使用discrete_freq(list) 傳回 [值, 出現次數]。
data1 : [3, 5, 2, 3, 3, 2, 5, 4, 3, 5, 7];
df1 : discrete_freq(data1);
val : df1[1];
freq : df1[2];
index_max : sublist_indices(freq, lambda([x], x = lmax(freq))); /* 找出最大的 freq 的 index 位置 */
modes : makelist(val[i], i, index_max)$ /* 眾數的定義,傳回出現最多次數的值 */
modes;
在此例中,可以看到 3 出現 4 次,所以眾數是 3。
定義一個求眾數的自訂函數
把上面的方法延伸,直接定義一個求眾數的函數。
mode(list) := block(
[df, val, freq, idx],
/* 離散型資料的值與頻數 */
df : discrete_freq(list),
val : df[1],
freq : df[2],
/* 最大頻數的索引位置 */
idx : sublist_indices(freq, lambda([x], x = lmax(freq))),
/* 傳回所有眾數 */
makelist(val[i], i, idx)
)$
接著,只要輸入:
data2 : [3, 5, 2, 3, 3, 2, 5, 4, 3, 5, 7];
mode(data2);
data : [3, 5, 2, 3, 3, 2, 5, 4, 3, 5, 7];
var(data), numer; /* 變異數 */
std(data), numer; /* 標準差 */
15.6 樣本變異數與樣本標準差¶
適用於有限個樣本數的變異數和標準差,此時分母是用 $n - 1$。
$$ s^2 = \frac{1}{n-1}\sum (x_i - \bar{x})^2 $$
計算
使用 var1 和 std1。
data : [3, 5, 2, 3, 3, 2, 5, 4, 3, 5, 7];
var1(data), numer;
std1(data), numer;
x : [70, 80, 90];
w : [2, 3, 5];
sum(w[i]*x[i], i,1,3) / sum(w[i], i,1,3);
得到加權平均。
15.8 分組資料(級距)之平均¶
若資料分組(例如統計表),需要用組中點計算:
組中點:
$$ m_i = \frac{\text{下限}+\text{上限}}{2} $$
平均數:
$$ \bar{x} = \frac{\sum m_i f_i}{\sum f_i} $$
CAS:
mid : [(0+10)/2, (10+20)/2, (20+30)/2];
freq : [5, 12, 8];
sum(mid[i]*freq[i], i,1,3) / sum(freq[i], i,1,3), numer;
15.9 數據排序、最大值、最小值¶
data : [3, 5, 2, 3, 3, 2, 5, 4, 3, 5, 7];
sort(data);
lmax(data);
lmin(data);
data : [3,5,2,3,3,2,5,4,3,5,7];
quantile(data, 0.25);
quantile(data, 0.50); /* 中位數 */
quantile(data, 0.75);
15.11 練習題¶
計算下列資料的平均數、中位數、眾數:
$[6, 8, 6, 10, 5, 7, 6]$
求變異數與標準差:
$[3, 4, 5, 6, 7]$
三科成績:
數學 80(權重 3)
英文 70(權重 2)
自然 90(權重 5)
求加權平均。
對分組資料:
區間 人數
- 0–10: 4
- 10–20: 6
- 20–30: 5
求估計平均數。
計算資料的最大、最小、排序與四分位數:
$[2,9,1,4,7,6]$
15.12 本章小結¶
本章你已學會:
使用 wxMaxima 處理資料列表
計算平均數、中位數、眾數
變異數與標準差(母體與樣本)
加權平均
分組資料的平均
資料排序、最大值、最小值、四分位數
下一章將進入本書的最後主題:wxMaxima 的應用策略。