본문 바로가기
경영학/통계

경영 통계학 : 1. 통계학의 정의

by 한리즈 2022. 5. 12.

1. 통계학

통계학(statistics)데이터를 정리, 요약, 분석하는데 필요한 지식과 기술의 집합이며, 통계학은 보다 효과적인 의사결정을 도와주는 데이터의 수집, 정리, 표현, 분석 및 해석에 대한 과학으로 정의됩니다.

 

 

1-1. 통계학의 종류

데이터로부터 의사결정을 위한 정보를 얻어 내기 위해서 통계학을 사용할 때. 기술통계학과 추론 통계학을 이용합니다. 이때, 질문과 데이터의 종류에 따라 둘 중 어떤 것을 적용할지 결정이 됩니다. 데이터를 기반으로 한 의사결정을 위한 정보를 얻어 내기 위해서 기술통계학추론통계학의 정의를 살펴보겠습니다.

 

1) 기술통계학(descriptive statistics)의 경우. 데이터를 정보를 주고받기 유용한 방식으로 체계화하고, 요약하고, 표현하는 방법을 기술통계학으로 정의합니다.

 

다음으로 추론 통계학을 설명하기 전, 우리가 반드시 알아야 하는 것이 바로 모집단표본입니다. 여기에서 말하는 모집단이란, 관심 대상인 모든 개인이나 개체 또는 관심 대상인 모든 개인이나 개체로부터 얻어진 측정치를 말합니다. 다음으로 표본이란, 관심 대상인 모집단의 부분 또는 일부를 말합니다. 보다 쉽게 이해하기 위해 그림으로 설명하자면, 아래의 그림과 같이 나타낼 수 있습니다.

 

모집단과 표본

 

여기서 모집단의 특성을 추정하기 위한 목적을 가지고 모집으로부터 표본을 추출하는 과정을 바로 추론통계학이라고 합니다.

 

2) 추론통계학(inferential statistics)은 표본에 기반하여 모집단의 특성을 추정하기 위한 방법을 말합니다.

 

 

1-2. 변수의 종류

변수에는 정성적정량적이라는 두 종류의 기본형이 있습니다.

 

1) 정성변수개체나 개인이 비 수치적인 특성치로 관찰, 기록되는 특성이 있습니다. 예시성별, 눈동자의 색, 소유한 책의 종류 등이 있습니다. 변수가 정성적일 때는 대부분 각 범주에 해당하는 관측치의 수를 세고, 각 범주에 해당하는 %를 결정합니다.

 

2) 정량변수수치상으로 보고 될 수 있는 변수를 말하며, 예시로는 가구당 인원수, 통장 잔액 등이 있습니다. 또한 적량변수는 이산적 또는 연속적으로 분류됩니다.

 

이산변수어떤 특정한 숫자만 가질 수 있으며, 값과 값, 사이 차이가 존재합니다. 그리고 일반적으로 셀 수 있는 값을 가집니다.

 

연속변수의 경우, 특정한 범위 내의 어떤 값도 가질 수 있다고 가정하며, 일반적으로 측정의 결과를 나타냅니다.

변수의 유형

 

1-3. 측정의 척도

데이터는 측정의 척도에 따라 분류될 수 있으며, 측정 척도에 따라 데이터를 요약, 제시하는 방법이 결정됩니다. 또한, 수행되어야 할 통계적 분석의 종류를 알려주는 역할을 합니다. 측정의 척도는 명목, 순서, 등간, 비율 4가지로 구분되며, 가장 단순한 하위단계의 측정척도는 명목척도이고, 가장 상위단계에는 비율척도가 해당합니다.

 

1) 명목척도레이블 또는 명칭으로 대표되며, 레이블 또는 명칭의 정성 변수 값을 측정, 기록하는 데 사용됩니다. 그러나 여기에는 특정한 순서가 없으며, 단지 분류되어 빈도수를 셀 수 있을 뿐입니다. 명목척도에서는 수학적인 연산을 통한 어떤 해석도 유효하지 않습니다. 이 이야기는 과자 제조사와 운동선수의 등번호 등 그 예시를 통해 조금 더 쉽게 이해할 수 있습니다.

 

2) 순서척도에서는 정성변수 혹은 속성이 상대적인 기준으로 순위와 등급이 매겨집니다. 순서척도로 기록된 데이터는 정의된 속성 또는 정성변수에 대한 상대적인 순위나 등급에 기반을 두게 되는데, 기반을 둔 변수는 오로지 순위가 매겨지거나 빈도수가 세어집니다. 예시로는 학년 전교 석차, 올림픽 메달 순위 등이 있습니다.

 

3) 등간척도에 의해 기록된 데이터 값들은 사이의 간격과 차이에 의미를 가지고 있으며, 알려진 측정 단위의 척도를 기반으로 합니다. 숫자 사이의 거리는 의미가 있는데, 비율이 그렇지 않다는 특징을 가지고 있습니다. 이를 쉽게 이해하기 위해 예시남성 의복과 여성 의복의 사이즈를 떠올리면 조금 더 쉽게 이해를 할 수 있습니다. 이 밖에 등간척도의 예시로 온도 등이 있습니다.

 

4) 비율척도가장 상위의 측정척도이며, 거의 모든 정량 변수가 비율척도로 기록됩니다. 비율척도는 구간척도의 모든 특성을 포함합니다. 비율척도로 기록된 데이터는 알려진 측정 단위의 척도를 기반으로 하며, 더하여 0과 두 숫자 사이 비율이 모두 의미가 있습니다. 비율척도의 예로임금, 생산량, 무게, 주가의 변화, 지점사무실 간의 거리 높이. 여론조사 전화통 수, 역까지의 거리, 매장 내 방문객의 수 등이 있습니다.

 

마지막으로 측정의 척도를 요약 정리해보자면, 측정의 척도는 크게 4가지로 구분되며, 각각 명목척도, 순서척도, 등간척도, 비율척도로 불립니다.

 

명목척도의 가장 큰 특징은 자료를 구분한다는 것이고, 순서척도의 가장 큰 특징은 자료에 서열이 있다는 것입니다. 다음으로 등간척도는 값 간의 거리에 의미가 있지만 비율은 그렇지 않다는 것이고, 비율척도는 영점과 값 간의 비율이 의미가 있습니다.

 

명목척도의 예시로는 과자 제조사와 운동선수의 등번호가 있고, 순서척도의 예시로는 학년 전교 석차, 올림픽 메달 순위가 있습니다. 그리고 등간척도의 예시로는 온도와 남성복의 사이즈가 있고, 비율척도의 예시로는 여론조사 전화통 수, 역까지의 거리, 매장 내 방문객의 수가 있습니다.

 

요약내용을 표로 정리하면 아래의 표와 같습니다.

 

측정척도 요약

댓글