본문 바로가기
반응형

dataVisualization7

대시보드 기본 개념들 (책 '대시보드 설계와 데이터 시각화 The Big Book of Dashboards') '대시보드 설계와 데이터 시각화' 책을 읽고 배운 점과 실천해보면 좋을 점들을 정리해봤습니다. 1. 대시보드는 1. 상황을 모니터링하고 2. 데이터 관계/추세를 이해할 수 있게 돕는 시각물입니다. 다양한 요소 (주로 차트와 텍스트)를 일관되고 정돈된 하나의 시각물로 조합해 사람들이 데이터를 직관적으로 이해할 수 있게 돕습니다. 2. 다양한 scale로 실험해보기 가장 좋다고 생각하는 방법은, 어떤 scale (크기, 색, 위치 ..)이 효과적인지 계속해서 시도해보는 것입니다. 때론 이미 알려진 정보를 참고해서 scale을 골라도 좋습니다. ex. 인간은 크기와 색의 차이를 잘 구별하기 때문에 크기와 색은 비교하는 정보를 보여주기에 효과적인 scale입니다. 3. Every Chart was a Table.. 2021. 10. 8.
책 '모두의 SQL' SQL 알못일 때 이 책을 샀는데, 몇장읽고 바로 접었다. 게으름 반 이해안됨 반이다. 그 이후 딱히 따로 공부하는 것 없이, 실제 일하면서 디비와 격하게 부딪히면서 SQL 기본소양을 다졌다. 그리고 다시 이 책을 읽어보니 비로소 꽤 도움이 됐다. 정말 아~무것도 모른다면, 책부터 정독할 것이 아니라! 소소하더라도 실습으로 일단 덤비고나서! 그 실습에서 얻은 얄팍한 지식을 바탕으로 책을 읽으면 훨씬 도움이 된다는 것을 느꼈습니다 :) 혹시 이 글을 읽고 있는 당신도 SQL 알못이라면, 책은 접는 것을 추천한다. 대신 테이블을 하나 정하거나, 테이블도 너무 크다면 컬럼 하나를 정하고 그 안에서 원하는 것을 필터해서 보는 select 쿼리문을 짜보는 것을 추천한다. 어떻게? 폭풍 구글링으로! w3school.. 2021. 9. 25.
viz to dataframe 9월 3째주 데이터 공부를 좀더 루틴하고 재밌게 하기 위해 viz to df exercise를 시작한다! 모든 것의 기본은 테이블이다. 차트도 차트지만 어떤 테이블이 차트의 원형인지 아는 것이 중요하고, 또 어떤 스케일에 어떤 데이터를 매핑해서 만든 차트인지 아는 것이 중요하다. 뉴욕타임즈와 DBR에 차트를 정리해둔 섹션이 있길래 한 소스당 3개 차트씩, 일주일에 최소 한번씩 공부하려한다. 내가 그린 테이블이 정답인지 아닌지는 크게 중요하지 않다. 일단 그 번역과정이 자연스럽게 일어나기 위한 훈련이라서 캐주얼하게 해보려한다. 이렇게 좀 하다가 같은 데이터를 다른 차트로 시각화해보는 것도 재밌겠단 생각이든다. 2021. 9. 24.
데이터와 차트 매핑하기 (1): 비교할 때 Fundamentals of Data Visualizations를 공부한 내용입니다. Why 메시지 + How 차트 내가 데이터로 말하려는 바가 무엇인지 Message에 따라 차트 형태가 결정된다. a가 b보다 많다는 것을 보여주려는 것인가? a와 b가 비슷하다는 것을 보여주는 것인가? 무엇보다 먼저, Why 메세지를 명확히 해야한다. 그 다음에는 How. 이 차트가 베스트인가? 하고 계속 질문해야 한다. 보통 메세지 타입 4가지: Comparision Relationship Distribution Composition 각 카테고리에 따라 적합한 차트들이 수두룩하니 그 중에 무엇이 베스트인지 계속 실험하고 질문하자. Visualizing Amounts 뭐가 더 큼? 뭐가 더 많음? Bar Chart -v.. 2021. 9. 17.
이유있는 데이터 색칠 Fundamentals of Data Visualizations를 공부한 내용입니다. 색을 쓰는데는 3가지 이유가 있다: 구별하기 위해 대표하기 위해 강조하기 위해 이유를 가지고 차트를 그려보자! 1. 구별하기 위한 색: Qualitative Color Scale '다 다른 데이터네' 일단, 구별한다는 것은 순서가 없는 아이템에게 쓰인다 ex 나라 이름. 이 팔레트 색상은 톤은 일정하고 색상만 다르다. 톤이 일정해야 어느 한 색상이 튀지 않기 때문이다. 한 마디로, 톤온톤은 비추한다는 것이다. (반대로 어느 한 데이터만 튀어야 되면, 전략적으로 그 데이터만 다른 톤 ex. 비비드 톤을 줄 수 있을 듯? 데이터 자체/진실을 왜곡시키는 것은 아니니까.) 2. 대표하기 위한 색: Sequential Color.. 2021. 9. 16.
데이터 시각화를 연마하는 두가지 방법 2019년, 데이터의 디귿도 모르지만 데이터 시각화에 빠져있을때였다. 기회가 돼 인턴 휴가까지 내 T아카데미에서 여는 파이썬 데이터 시각화 강의를 보러갔고, 강사 이수진님이 강추해주셔서 이 책 Fundamentals of Data Visualizations (Claus O. Wilke 클라우스 윌케)를 알게됐다. 한국어로는 '데이터시각화 교과서'로 번역된 만큼 근본이 되는 책이다. 요약 이 책을 공부하는 태도 "figures will typically carry the weight of your arguments" 설득력을 기르기 위해 data viz가 필요하다. 안목을 기르기 위해선 이론과 실습이 꼭 병행되어야 한다. Simple rules/principles를 알아야하고, details that ot.. 2021. 9. 16.
[데이터모델링] PK와 UK의 차이 (Primary Key vs. Unique Key) *테이블 내 고유식별자가 PK이고, UK는 고유한 값을 가진다는 컬럼의 속성에 가깝다. 즉, UK는 PK가 가지는 유니크하다는 속성이다. A primary key is a column of table which uniquely identifies each tuple (row) in that table. A table can have more than one unique key unlike primary key. 테이블 내 중복이 가능한가? NO → PK. PK는 테이블 내 중복되거나 값이 null일 수도 없다. YES → UK. UK는 테이블 내 중복될 수 있고 (한 테이블이 여러 UK를 가질 수 있으니까, 물론 row 중복은 안됨) 값이 null일 수도 있다. PK는 테이블 내에서 해당 row를 식별하.. 2021. 9. 12.
반응형