안녕하세요 jju_developer입니다.
지난 시간에 이어서 보겠습니다.
캐글 CSV 파일을 활용한 인덱스 작성
안녕하세요 jju_developer입니다. 이번시간에는 캐글 관련하여 배운 수업내용을 정리하여 공유드립니다. 정보통신기술 ICT의 발달로 매 순간 어마어마한 데이터가 쏟아져 나오고 있습니다. 종래의
jju240.tistory.com
지난 10년간 가장 많이 만들어진 장르를 키바나의 시각화에서 그래프를 그려보겠습니다.
[미리 보기]
본격적으로 예제를 보면 인덱스가 만들어져 있는 것 중에서 해보도록 합시다.
그렇다면 인덱스가 어떠한 것이 있는지를 확인해 봐야겠죠?
1. 무슨 인덱스(파일)로 그래프를 그릴까?
인덱스가 무엇이 있는지 확인하는 방법은
Dev Tools에 가서 GET /_cat/indices?v를 눌러서 무슨 인덱스가 만들어져 있는지 확인합니다~~!
그다음 사용하고자 하는 인덱스가 있으면 다시 키바나의 비주얼라이즈에 가서 Create를 해줍니다.
2. 본격적으로 그래프를 생성해 보자~
Elastic 메뉴 > Kibana > Visualize > Create visualization을 클릭 클릭~
3. 원하는 그래프를 선택하자~
어떤 비주얼로 만들지를 선택합니다. 저는 Area를 선택했습니다.
4. 인덱스를 불러오자~ (파일을 업로드한 인덱스를 선택)
인덱스를 movie2로 선택하여 예제를 불러오겠습니다.
(인덱스는 엑셀 파일에 있는 데이터들이죠!
지난 시간에 엑셀파일을 인덱스로 업로드 하는 방법에 대해 알아보았습니다.)
movie 2 에는 연도별로 장르별 영화가 어떠한 것이 있는지에 대한 정보가 들어있습니다.
그렇다면 우리는 어떠한 정보를 가져오고 싶은지! 생각을 해보면
장르별로 10년 동안 어떠한 장르가 어떠한 변화가 있었는지를 보고 싶습니다.
그렇다면 변경을 적용해서 볼까요?
5. 인덱스를 원하는 내용으로 수정하기
*Aggregation *Field *Order by
<적용>
• 타임피커의 시간 범위를 ~10 years ago -> now로 동일하게 변경합니다.
• 버킷 집계는 X-axis를 선택하고,
Aggregation은 Terms, Field는 genres, Order by는 Metric 기준으로 상위 10개로 지정하였습니다.
6. 데이터분석 결과 확인하기!
짜잔~
장르별로 지난 10년 동안 가장 많이 만든 상위 10개가 그래프로 보이게 됩니다.
이러한 방식으로 한다면 내가 원하는 데이터가 엑셀 파일로 있고 빅데이터라면,
해당 자료를 쉽게 분석 도구인 키바나를 이용하여 원하는 그래프 (막대, 꺾은선그래프 등)를 선택하여
시각화를 할 수 있습니다.
정말 간편해진 만큼 여러 도구들을 사용해 보는 것이 좋을 듯싶습니다.
저는 이번에 배운 키바나 도구를 프로젝트에 적용을 해보고자 합니다.
그럼 다음시간에 다시 오겠습니다.
오늘도 수고하셨습니다~

'주니어 기초 코딩공부 > 빅데이터 찍먹' 카테고리의 다른 글
MacOS 유저 엘라스틱서치 & 키바나 다운로드 하기 (0) | 2023.06.12 |
---|---|
MacOs 유저 로그스테시 다운로드 하는법 (0) | 2023.06.12 |
캐글 CSV 파일을 활용한 인덱스 작성 (0) | 2023.06.07 |
05 엘라스틱 스택_키바나 소개_Visualize (0) | 2023.06.01 |
04 엘라스틱 스택_키바나 소개_discover (0) | 2023.06.01 |