Chapter 6: Important Topics:
- Measures of Central Tendency
- Importance of Measures of Central Tendency
- Qualities of a good average
- Types of Averages: Arithmetic Mean, Median, Mode
- Partition Values: Quartiles, Deciles, Percentiles
Unit 6 Measures of Central Tendency focus points notes only
A measure of central tendency will represent whole of the distribution i.e.. measure of central tendency summarises data in a single value which represent the entire data.
Live Example 2: If we have daily temperatures for a month, the median temperature tells us the middle value, with half the days being hotter and half being cooler.
Importance of Measures of central tendency
- To find representative value
- To condense data
- To make comparison
- Helpful in further statistical analysis
Simple Hints: 1. Too many numbers are confusing. 2. Need quick understanding. 3. Helps in decision making.
Qualities of a good average
- It should be rigidly defined
- It should be representative of the entire data
- It should be based of all observation
- It should be easily calculated
- It should be capable of easy interpretation.
- It should be capable of further mathematical calculation
- It should not be influenced by the extreme value
Answer Structure: 1. First quality with brief explanation. 2. Second quality. 3. Third quality. 4. Fourth quality.
Types of Averages
- Arithmetic Mean
- Median
- Mode
1. Arithmetic Mean
It is defined as the sum of the values of all items divided by the number of items. It is denoted by x̄. Arithmetic mean maybe of two types; Simple Arithmetic Mean and Weighted Arithmetic Mean.
Simple Arithmetic Mean
Individual series
Mean = (10+20+30+40+50) ÷ 5 = 150 ÷ 5 = 30
Live Example 2: Daily expenses: ₹100, ₹150, ₹200, ₹250
Mean = (100+150+200+250) ÷ 4 = 700 ÷ 4 = ₹175
Discrete Series
Continuous Series
Weighted Arithmetic Mean
Weighted mean = [(2×80) + (3×90)] ÷ (2+3) = (160+270) ÷ 5 = 430 ÷ 5 = 86
Combined Mean
The Mean age of 40 students is 16 years and the mean age of another group of 60 students is 20 years. Find out the mean age of 100 students combined together.
Correction in mean
The average marks secured by 50 students was 44 . Later on it was discovered that score of 36 was taken as 56. Correct the mean.
Total value of observation (incorrect value) = 44 × 50 = 2200
Correct total value = 2200 – 56 + 36 = 2180 ;
Correct Mean = 2180/50 = 43.6
Simple Hints: 1. Different importance levels. 2. Different group sizes. 3. Combined data from different sources.
Median
Median is the middle value. It divides the series into two parts. This is the value that comes in the middle when arranged in ascending or descending order according to magnitude.
1. Individual series
N = Total number of items
Calculate Median from the following
15, 20, 25, 28, 16, 18, 17, 9, 11
Ascending Order 9, 11, 15, 16, 17, 18, 20, 25, 28
2. Discrete series
Arrange the series in ascending or descending order according to magnitude.
When the data is continuous and in the form of a frequency distribution, the median is found as shown below:
Median = 
where,
- L = lower limit of median class
- cf = cumulative frequency of the class preceding the median class
- f = frequency of the median class
- i = class size
Median = 9 (middle value)
Live Example 2: Data: 2, 4, 6, 8, 10, 12
Median = (6+8) ÷ 2 = 7 (average of two middle values)
Example: Find the median marks for the following distribution:
| Classes | 0-10 | 10-20 | 20-30 | 30-40 | 40-50 |
|---|---|---|---|---|---|
| Frequency | 2 | 12 | 22 | 8 | 6 |
Solution:
We need to calculate the cumulative frequencies to find the median.
| Classes | Number of students | Cumulative frequency |
|---|---|---|
| 0-10 | 2 | 2 |
| 10-20 | 12 | 2 + 12 = 14 |
| 20-30 | 22 | 14 + 22 = 36 |
| 30-40 | 8 | 36 + 8 = 44 |
| 40-50 | 6 | 44 + 6 = 50 |
N = 50
N/2 = 50/2 = 25
Median Class = (20 - 30)
L = 20, f = 22, cf = 14, i = 10
Using Median formula:
Median = 20 + (25 - 14)/22 × 10
= 20 + (11/22) × 10
= 20 + 5 = 25
∴ Median = 25
Answer Structure: 1. Find cumulative frequency. 2. Locate median class. 3. Apply formula with steps.
Mode
Mode is defined as the value which occurs maximum number of times in a series. Mode is the most frequently observed data value. So it is value with highest frequency.
A. Individual series
In individual series mode can be the value which occurs maximum number of times in a series.
Find Mode 41, 42, 45, 44, 45, 48, 50, 45, 47, 50, 56
45 occurs 3 times in the series.
Thus 45 is Mode.
When there are two or more values, having the same maximum frequency, mode is said to be ill-defined. In such case, mode is calculated by the following formula.
Mode = 3Median – 2Mean
B. Discrete series
In discrete series, value with the highest frequency is taken as mode
C. Continuous series
In a continuous series mode lies in the class having the highest frequency.
Mode =
L = lower limit of the model class
D1 = The difference between the frequency of the model class and the frequency of the pre-model class
D2 = the difference between the frequency of the model class and the frequency of the post model class
i = the class intervals of the model class.
Mode = 3 (appears 3 times)
Live Example 2: Shoe sizes: 7, 8, 8, 9, 9, 9, 10
Mode = 9 (appears 3 times)
Example: Find the mode marks for the following distribution:
value with highest frequency is 15, therefore model class is 50-60
Simple Hints: 1. Categorical data (like favorite color). 2. Skewed data. 3. When most common value matters most.
Location of Mode Graphically
Mode can be located graphically with the help of histogram. Steps:
- Draw a histogram of the given data
- Draw two lines diagonally in the inside of the model class bar, starting from each corner of the bar to the upper corner of the adjacent bar
- Then draw a perpendicular line from the point of intersection to the X-axis, which gives us the model value.
Partition Values
Partition values are values that divide a series into several equal parts.
They are:
- Median
- Quartiles
- Deciles
- Percentiles
1. Median
Median are values that divide a series into two equal parts.
2. Quartiles
Quartiles are values that divide a series into four equal parts. 3 Quartiles Q1, Q2, Q3. Q2 is equal to the median.
3. Deciles
Deciles are values that divide a series into ten equal parts. 9 Deciles. D1, D2, D3 ... D9. D5 is equal to the median.
4. Percentiles
Percentiles are values that divide a series into hundred equal parts. 99 Percentiles P1, P2, P3 ... P99. P50 is equal to the median.
Partition Values in Individual series
1. Quartiles
2. Deciles
3. Percentiles
Answer Structure: 1. Definition of each. 2. Number of divisions. 3. Formula. 4. One example each.
Important Exam Questions
- Define measures of central tendency. List its importance. (3 marks)
- Explain arithmetic mean with formulas for individual, discrete and continuous series. (4 marks)
- Calculate median for given data. Show all steps. (3 marks)
- Find mode graphically. Explain steps. (3 marks)
- Differentiate between mean, median and mode. When to use which? (4 marks)
- Calculate quartiles for given individual series. (3 marks)
- Correct the mean when wrong observation is given. (2 marks)
- Find combined mean of two groups. (2 marks)
പ്രധാന പാഠഭാഗങ്ങൾ:
- കേന്ദ്ര പ്രവണതയുടെ അളവ്
- കേന്ദ്ര പ്രവണതയുടെ പ്രാധാന്യം
- നല്ല ശരാശരിയുടെ ഗുണങ്ങൾ
- ശരാശരിയുടെ തരങ്ങൾ: ഗണിത ശരാശരി, മീഡിയൻ, മോഡ്
- വിഭജന മൂല്യങ്ങൾ: ക്വാർട്ടൈലുകൾ, ഡെസിലുകൾ, ശതമാനം
Unit 6 Measures of Central Tendency focus points notes only (കേന്ദ്ര പ്രവണത)
കേന്ദ്ര പ്രവണതയുടെ അളവ് വിതരണത്തെ മുഴുവനായും പ്രതിനിധീകരിക്കും അതായത്. കേന്ദ്ര പ്രവണതയുടെ അളവ്, മുഴുവൻ ഡാറ്റയെയും പ്രതിനിധീകരിക്കുന്ന ഒരൊറ്റ മൂല്യത്തിൽ ഡാറ്റ സംഗ്രഹിക്കുന്നു.
ലൈവ് ഉദാഹരണം 2: ഒരു മാസത്തെ ദൈനംദിന താപനില ഉണ്ടെങ്കിൽ, മീഡിയൻ താപനില മധ്യ മൂല്യം നൽകുന്നു, പകുതി ദിവസങ്ങൾ ചൂടുള്ളതും പകുതി ദിവസങ്ങൾ തണുത്തതുമായിരിക്കും.
Importance of Measures of central tendency (പ്രാധാന്യം)
- പ്രതിനിധി മൂല്യം കണ്ടെത്താൻ
- ഡാറ്റ സംഗ്രഹിക്കാൻ
- താരതമ്യം ചെയ്യാൻ
- കൂടുതൽ സ്ഥിതിവിവര വിശകലനത്തിന് സഹായകമാണ്
ലളിതമായ സൂചനകൾ: 1. വളരെയധികം സംഖ്യകൾ ആശയക്കുഴപ്പമാണ്. 2. വേഗത്തിലുള്ള ധാരണ ആവശ്യമാണ്. 3. തീരുമാനമെടുക്കാൻ സഹായിക്കുന്നു.
Qualities of a good average (നല്ല ശരാശരിയുടെ ഗുണങ്ങൾ)
- അത് കർശനമായി നിർവചിക്കേണ്ടതാണ്
- ഇത് മുഴുവൻ ഡാറ്റയുടെയും പ്രതിനിധിയായിരിക്കണം
- അത് എല്ലാ നിരീക്ഷണങ്ങളുടെയും അടിസ്ഥാനത്തിലായിരിക്കണം
- ഇത് എളുപ്പത്തിൽ കണക്കാക്കണം
- അത് എളുപ്പത്തിൽ വ്യാഖ്യാനിക്കാവുന്നതായിരിക്കണം.
- ഇത് കൂടുതൽ ഗണിതശാസ്ത്രപരമായ കണക്കുകൂട്ടലിന് പ്രാപ്തമായിരിക്കണം
- അത് അങ്ങേയറ്റത്തെ മൂല്യത്താൽ സ്വാധീനിക്കപ്പെടരുത്
ഉത്തര ഘടന: 1. ആദ്യ ഗുണം സംക്ഷിപ്ത വിശദീകരണത്തോടെ. 2. രണ്ടാമത്തെ ഗുണം. 3. മൂന്നാമത്തെ ഗുണം. 4. നാലാമത്തെ ഗുണം.
Types of Averages (ശരാശരിയുടെ തരങ്ങൾ)
- Arithmetic Mean ഗണിത ശരാശരി
- Median മീഡിയൻ
- Mode മോഡ്
1. Arithmetic Mean (ഗണിത ശരാശരി)
എല്ലാ ഇനങ്ങളുടെയും മൂല്യങ്ങളെ ഇനങ്ങളുടെ എണ്ണം കൊണ്ട് ഹരിച്ചാൽ ലഭിക്കുന്ന തുകയാണ് അരിത്മെറ്റിക് അർത്ഥം. ഇത് x̄ ഗണിത ശരാശരി കൊണ്ട് സൂചിപ്പിക്കുന്നു, രണ്ട് തരത്തിലായിരിക്കാം; ലളിതമായ ഗണിത ശരാശരിയും തൂക്കമുള്ള ഗണിത ശരാശരിയും.
Simple Arithmetic Mean (ലളിതമായ ഗണിത ശരാശരി)
Individual series (വ്യക്തിഗത പരമ്പര)
ശരാശരി = (10+20+30+40+50) ÷ 5 = 150 ÷ 5 = 30
ലൈവ് ഉദാഹരണം 2: ദൈനംദിന ചെലവ്: ₹100, ₹150, ₹200, ₹250
ശരാശരി = (100+150+200+250) ÷ 4 = 700 ÷ 4 = ₹175
Discrete Series (ഡിസ്ക്രീറ്റ് സീരീസ്)
Continuous Series (തുടർച്ചയായ പരമ്പര)
Weighted Arithmetic Mean (വെയ്റ്റഡ് അരിത്മെറ്റിക് ശരാശരി)
തൂക്കമുള്ള ശരാശരി = [(2×80) + (3×90)] ÷ (2+3) = (160+270) ÷ 5 = 430 ÷ 5 = 86
Combined Mean (സംയോജിത ശരാശരി)
40 വിദ്യാർത്ഥികളുടെ ശരാശരി വയസ്സ് 16 വയസ്സും മറ്റൊരു 60 വിദ്യാർത്ഥികളുടെ ശരാശരി വയസ്സ് 20 വയസ്സുമാണ്. 100 വിദ്യാർത്ഥികളുടെ ഒരുമിച്ചുള്ള ശരാശരി വയസ്സ് കണ്ടെത്തുക.
Correction in mean (തിരുത്തൽ)
50 വിദ്യാർത്ഥികൾ നേടിയ ശരാശരി മാർക്ക് 44 ആയിരുന്നു. പിന്നീട് 36 മാർക്ക് 56 എന്ന് തെറ്റായി എടുത്തതായി കണ്ടെത്തി. ശരാശരി തിരുത്തുക.
നിരീക്ഷണങ്ങളുടെ മൊത്തം മൂല്യം (തെറ്റായ മൂല്യം) = 44 × 50 = 2200
ശരിയായ മൊത്തം മൂല്യം = 2200 – 56 + 36 = 2180 ;
ശരിയായ ശരാശരി = 2180/50 = 43.6
ലളിതമായ സൂചനകൾ: 1. വ്യത്യസ്ത പ്രാധാന്യ നില. 2. വ്യത്യസ്ത ഗ്രൂപ്പ് വലുപ്പങ്ങൾ. 3. വ്യത്യസ്ത സ്രോതസ്സുകളിൽ നിന്നുള്ള സംയോജിത ഡാറ്റ.
Median (മീഡിയൻ)
മീഡിയൻ മധ്യ മൂല്യമാണ്. ഇത് പരമ്പരയെ രണ്ട് ഭാഗങ്ങളായി വിഭജിക്കുന്നു. മാഗ്നിറ്റ്യൂഡ് അനുസരിച്ച് ആരോഹണക്രമത്തിലോ അവരോഹണത്തിലോ ക്രമീകരിക്കുമ്പോൾ മധ്യത്തിൽ വരുന്ന മൂല്യമാണിത്.
1. Individual series (വ്യക്തിഗത പരമ്പര)
N = ആകെ ഇനങ്ങളുടെ എണ്ണം
ഇതിൽ നിന്ന് മീഡിയൻ കണക്കാക്കുക
15, 20, 25, 28, 16, 18, 17, 9, 11
ആരോഹണ ക്രമം 9, 11, 15, 16, 17, 18, 20, 25, 28
2. Discrete series (ഡിസ്ക്രീറ്റ് സീരീസ്)
മാഗ്നിറ്റ്യൂഡ് അനുസരിച്ച് സീരീസ് ആരോഹണ അല്ലെങ്കിൽ അവരോഹണ ക്രമത്തിൽ ക്രമീകരിക്കുക.
ഡാറ്റ തുടർച്ചയായും ഫ്രീക്വൻസി ഡിസ്ട്രിബ്യൂഷന്റെ രൂപത്തിലും ആയിരിക്കുമ്പോൾ, ചുവടെ കാണിച്ചിരിക്കുന്നതുപോലെ മീഡിയൻ കാണപ്പെടുന്നു:
Median = 
ഇവിടെ,
- L = മീഡിയൻ ക്ലാസ്സിന്റെ താഴ്ന്ന പരിധി
- cf = മീഡിയൻ ക്ലാസ്സിന് മുമ്പുള്ള ക്ലാസ്സിന്റെ ക്യുമുലേറ്റീവ് ഫ്രീക്വൻസി
- f = മീഡിയൻ ക്ലാസ്സിന്റെ ആവൃത്തി
- i = ക്ലാസ് വലിപ്പം
മീഡിയൻ = 9 (മധ്യ മൂല്യം)
ലൈവ് ഉദാഹരണം 2: ഡാറ്റ: 2, 4, 6, 8, 10, 12
മീഡിയൻ = (6+8) ÷ 2 = 7 (രണ്ട് മധ്യ മൂല്യങ്ങളുടെ ശരാശരി)
ഉത്തര ഘടന: 1. ക്യുമുലേറ്റീവ് ഫ്രീക്വൻസി കണ്ടെത്തുക. 2. മീഡിയൻ ക്ലാസ് സ്ഥാനം നിർണ്ണയിക്കുക. 3. ഘട്ടങ്ങളോടെ ഫോർമുല പ്രയോഗിക്കുക.
Mode (മോഡ്)
ഒരു ശ്രേണിയിൽ പരമാവധി തവണ സംഭവിക്കുന്ന മൂല്യമായി മോഡ് നിർവചിക്കപ്പെടുന്നു. ഏറ്റവും കൂടുതൽ നിരീക്ഷിക്കപ്പെടുന്ന ഡാറ്റ മൂല്യമാണ് മോഡ്. ഇത് ഏറ്റവും ഉയർന്ന ആവൃത്തിയിലുള്ള മൂല്യമാണ്.
A. Individual series (വ്യക്തിഗത പരമ്പര)
വ്യക്തിഗത പരമ്പരയിൽ മോഡ് എന്നത് ഒരു ശ്രേണിയിൽ പരമാവധി തവണ സംഭവിക്കുന്ന മൂല്യമായിരിക്കും.
മോഡ് കണ്ടെത്തുക 41, 42, 45, 44, 45, 48, 50, 45, 47, 50, 56
45 പരമ്പരയിൽ 3 തവണ സംഭവിക്കുന്നു.
അതിനാൽ 45 മോഡ് ആണ്.
രണ്ടോ അതിലധികമോ മൂല്യങ്ങൾക്ക് ഒരേ പരമാവധി ആവൃത്തി ഉള്ളപ്പോൾ, മോഡ് നന്നായി നിർവചിക്കപ്പെട്ടിട്ടില്ലെന്ന് പറയപ്പെടുന്നു. അത്തരം സാഹചര്യത്തിൽ, മോഡ് ഇനിപ്പറയുന്ന ഫോർമുല ഉപയോഗിച്ച് കണക്കാക്കുന്നു.
Mode = 3Median – 2Mean
B. Discrete series (ഡിസ്ക്രീറ്റ് സീരീസ്)
ഡിസ്ക്രീറ്റ് സീരീസിൽ, ഏറ്റവും ഉയർന്ന ആവൃത്തിയുള്ള മൂല്യം മോഡായി എടുക്കുന്നു
C. Continuous series (തുടർച്ചയായ പരമ്പര)
തുടർച്ചയായ പരമ്പരയിൽ, ഏറ്റവും ഉയർന്ന ആവൃത്തിയുള്ള ക്ലാസിൽ മോഡ് കിടക്കുന്നു.
Mode =