2025/02/16 4

게임 데이터 대시보드 만들기: ➀ 작은 이슈들...

사용 데이터 Game Data - Utilize Advanced Data AnalysisThis dataset can be used for various machine learning.www.kaggle.com작은 이슈들...태블로 대시보드 구축 자체에 더 초점을 두기 위해 결정한 게임 데이터 대시보드 프로젝트!너무 잘 정리된 데이터이다 보니 거기에서 나오는 문제점들&아직 잘 모르겠는 부분이 좀 있다. 데이터가 너무 깔끔하다. 전처리 할 내용도 많지 않고 데이터가 너무 균등해서 시각화를 해도 예쁘지가 않다. 리텐션 시각화를 하기 위해 코호트 차트를 만들었는데 보통의 코호트 차트와 너무 다르다. 특정 기간의 데이터를 확인할 수 있게 하는 방법..! 아직 잘 모르겠다. 국가 코드 컬럼을 지도로 바꾸는 방법:..

카테고리 없음 2025.02.16

2월 2주차 WIL

이번주는 밀도 있는 한 주를 보낸 것 같다. 매일 남아서 adsp 공부도 하고 태블로도 열심히 공부했다. 아직 모르는 부분들도 많지만 새롭게 진행하는 프로젝트를 통해 태블로를 활용하는 능력을 더 기를 수 있도록 해야겠다. 사실, 다른 데이터들도 궁금하긴 했지만..! 손댔다가는 adsp  공부를 못하게 될 것 같아서 그나마 쉬워 보이는 게임 데이터를 골랐다. 그리고 이번주부터는 파이썬과 판다스도 다시 공부하기 시작했다. 기억이 너무나 많이 휘발되어 버려서....매일 꾸준히 공부를 해나가야할 것 같다. adsp 시험이 끝나면 이력서와 포트폴리오 기초를 만들어 둬야겠다. 그리고 (애)증의 컴활 자격증...🤯데이터 분석가에게 컴활 자격증이 필요하다고 할 수는 없지만.. 굉장히 기본적인 자격증도 없는 느낌이라 ..

WIL 2025.02.16

AdSP 3과목 1장: 데이터 분석 개요

데이터 마이닝 모델링데이터 마이닝 모델링은 통계적 모델링이 아니므로 지나치게 통계적 가설이나 유의성에 집착하지 말아야 함충분한 시간이 있으면 다양한 옵션을 줘서 시도해도 되지만, 그렇지 않은 경우 일정 성과가 나오면 해석과 활용 단계로 진행할 수 있도록 의사결정 해야함분석 데이터를 학습 및 테스트 데이터로 6:4, 7:4, 8:2 비율로 상황에 맞게 실시성능에 집착하면 분석 모델링의 주 목적인 실무 적용에 반하여 시간을 낭비할 수 있으므로 훈련 및 테스트 성능에 큰 편차가 없고 예상 성능을 만족하면 중단해야 함데이터 마이닝 모델링 평가 기준정확도정밀도디렉트 레이트리프트시뮬레이션 평가 기준ThroughputAverage Waiting TimeAverage Queue LengthTime in System

카테고리 없음 2025.02.16

AdSP 2과목: 데이터 분석 기획

정형 데이터&반정형 데이터&비정형 데이터정형 데이터: 명확한 스키마와 고정된 구조를 가지고 있는 데이터 / ERP, CRM, SCM 등의 정보시스템ex. 수요 예측 데이터, 경쟁사 가격, 날씨 데이터, 멤버십 프로그램 데이터, CRM 거래 데이터반정형 데이터: 고정된 스키마는 없지만, 데이터 간 구조화된 형식을 가짐 / 로그 데이터, 모바일 데이터,  센싱 데이터ex. 이메일 기록, 웹 로그, 사물 인터넷 센싱, 모바일 위치 정보비정형 데이터: 고정된 구조가 없고 다양한 형식으로 존재 / 영상, 음성 문자ex. 페이스북 상태, RFID, 트위터 피드CRISP - DM 방법론데이터 준비단계: 데이터셋 선택, 데이터 정제, 분석용 데이터셋 편성, 데이터 통합, 데이터 포맷팅 작업모델링 단계: 모델 테스트 계..

카테고리 없음 2025.02.16