비교? 비교! 데이터의 다양한 비교는 이렇게 한다!

이번 시간에 공부한 내용은 ” Spotting Difference ” !

크게 3가지로 나눠서 봤습니다. ^ ^

★ Comparing across Multiple Variables

다각적인 가치를 비교하는 법 즉, 여러개의 변수를 통한 비교라는 뜻입니다.

데이터들은 상당한 많은 양이 존재하는데요. 그 많은 데이터들을

Visualize화하여 효과적으로 보여주는 가장 간단한 방법은

모든 데이터들을 한 번에 보여주는 것! 인데요

Heatmap

이는 숫자로 나타내는 방법대신에 색깔을 이용하는 방법을 사용하였습니다.

이 표에 같은 사이즈로 나타낸 grid 모양과 함께

색 음영을 이용하여 각 값의 가치를 세분화시켰습니다.

그래서 각각의 가치를 상대적으로 쉽게 파악할 수 있게 하였는데요.

 일반적으로, 가장 어두운 색은 최고값을 의미하고

가장 옅은 색은 최저값을 의미한다고 합니다.

하지만 음영의 적용을 쉽게 바꿀 수도 있어요.^ ^

이 방법 이외에도 다양한 Heatmap이 있답니다.

Heatmap의 색깔은 사용자의 설정에 따라 다양하게 바꿀 수 있어요.

앞에서도 말했듯이, 이 Heatmap의 가장 큰 장점은

모든 데이터를 한 번에 보여줄 수 있다는 점인데요.

하지만, 이는 개인적인 point에 중점이 맞춰져있기에

상대적 비교에는 유용하지만 복잡한 비교에는 어려움이 따를 수 있어요.

그럴 때 사용하는 것이 Chernoff Faces 입니다.

이런 것은 다양한 평가가 필요할 때 쓰면 유용하겠죠?

그래서 전체가 아닌 여러 통계 수치로 흩어서 각각의 unit을 보고 싶을 때

종종 사용한답니다.

복잡한 데이터를 face를 사용하여 나타내는 대신에

어려운 모형을 사용하여 추상화할 수도 있어요.

즉, 데이터의 값과 일치하도록 모양을 수정하는 것인데요.

이는 Star Chart 라고 합니다.

위 그림을 나타낼 때는

가운데는 각 변수의 최소값, 끝은 최대값을 나타냅니다.

그래서 만약 하나의 구성에 대한 차트를 그리고자 할 때,

변수에서 시작하여 다음 축의 해당 지점에 연결하는 선을 그립니다.

이런식으로 계속 그리다보면 별과 같은 어떤 모형이 나오게 되요!

하지만!

하나의 차트에 여러개의 unit를 표현할 수 있어 좋지만, 유용하지는 않아요

그래서 차트를 분리해서 비교하는 쪽을 선호한답니다.

Running in parral

★ Reducing Dimensions

Chernoff Faces와 Parallel coordinates를 사용할 때

우리는 main goal를 축소화 시키는 데요.

그런데 문제는

항상 어떤 얼굴이나 연결 라인을 보면서 시작해야될지 위치를 잘 모른다는 거에요.

그래서 보다 효과적으로 잘하기 위해서는

여러기준을 기반으로 한 클러스터 개체를 가질 수 있어야해요.

이는 multidimensional scaling (MDS)의 목적 중 하나랍니다. ~~!

★ Searching for Outliers

위 그래프를 보면 전체는 거칠게 표현되어있는데 가운데 부분만

부드럽게 표현되어 있죠?

이는 변수(Outliers)가 발생한 부분인데요.

데이터를 나타내다보면 변수가 존재하는 경우가 있는데요.

그럴 때마다 그 변수를 obvious하게 고려해보아야 한답니다.

우리는 데이터의 양이 부족하고 또한 익숙하지 못하기 때문인데요

데이터의 Source와 도움을 받길 원한다면 전문가에게 요청하세요.

그러면 유용한 quick advice과 함께 도움이 될 거에요!

만약 그럼에도 더 구체적인 데이터를 찾지 못하였다면

그래픽에 애매모호함에 대한 설명을 충분히 적어주세요~! ^ ^

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

%s에 연결하는 중