분류 전체보기 140

AdSP 2과목: 데이터 분석 기획

정형 데이터&반정형 데이터&비정형 데이터정형 데이터: 명확한 스키마와 고정된 구조를 가지고 있는 데이터 / ERP, CRM, SCM 등의 정보시스템ex. 수요 예측 데이터, 경쟁사 가격, 날씨 데이터, 멤버십 프로그램 데이터, CRM 거래 데이터반정형 데이터: 고정된 스키마는 없지만, 데이터 간 구조화된 형식을 가짐 / 로그 데이터, 모바일 데이터,  센싱 데이터ex. 이메일 기록, 웹 로그, 사물 인터넷 센싱, 모바일 위치 정보비정형 데이터: 고정된 구조가 없고 다양한 형식으로 존재 / 영상, 음성 문자ex. 페이스북 상태, RFID, 트위터 피드CRISP - DM 방법론데이터 준비단계: 데이터셋 선택, 데이터 정제, 분석용 데이터셋 편성, 데이터 통합, 데이터 포맷팅 작업모델링 단계: 모델 테스트 계..

카테고리 없음 2025.02.16

AdSP 1과목: 데이터의 이해

암묵지와 형식지암묵지 (Tacit Knowledge)개인이 경험, 감각, 직관 등을 통해 내면적으로 체득한 지식으로, 말이나 글로 쉽게 표현하기 어려운 지식숙련된 장인의 기술이나 경험에서 우러나오는 노하우 등형식지 (Explicit Knowledge)문서, 매뉴얼, 데이터 등으로 명확하게 기록되고 전달 가능한 지식공식적인 교육 자료나 기술 문서, 연구 보고서 등공통화 (Socialization)내용: 개인들이 서로 만나 경험과 암묵지를 공유하는 과정예: 대면 회의, 멘토링, 현장 체험 등표출화 (Externalization)내용: 암묵지를 언어나 이미지, 모델 등의 형식지로 표현하여 전달하는 과정예: 경험을 문서화하거나, 개념 모델로 설명하는 과정연결화 (Combination)내용: 여러 형식지를 조합하..

카테고리 없음 2025.02.13

Python 코드카타: 직사각형 별찍기 | 최대공약수와 최소공배수

직사각형 별찍기이 문제에는 표준 입력으로 두 개의 정수 n과 m이 주어집니다.별(*) 문자를 이용해 가로의 길이가 n, 세로의 길이가 m인 직사각형 형태를 출력해보세요.n, m = map(int, input().split()) # 두 개의 정수 입력받기for i in range(m): print('*' * n)최대공약수와 최소공배수두 수를 입력받아 두 수의 최대공약수와 최소공배수를 반환하는 함수, solution을 완성해 보세요. 배열의 맨 앞에 최대공약수, 그다음 최소공배수를 넣어 반환하면 됩니다. 예를 들어 두 수 3, 12의 최대공약수는 3, 최소공배수는 12이므로 solution(3, 12)는 [3, 12]를 반환해야 합니다.def solution(n, m): # 최대 공약수 f..

Python 2025.02.12

[아티클] 데이터 분석가가 되고 싶은 취준생을 위한 안내서

주제: 데이터 분석가가 되고 싶은 취준생을 위한 안내서 데이터 분석가가 되고 싶은 취준생을 위한 안내서 | 요즘IT최근 저희 조직에 학부생 인턴으로 지원한 분들과 면접을 진행했습니다. 인터뷰를 통해 대학생들의 다양한 가치관과 생각, 그리고 앞으로의 목표 등을 배울 수 있는 기회였는데요. 면접에서 지yozm.wishket.com요약면접을 재미없게 만드는 데이터 특징 3가지데이터실제 현장에서는 전처리 작업을 필요로 하는 경우가 많음법과 저작권의 문제를 넘지 않는 선에서 직접 데이터 수집(크롤링) 추천목표구하기 쉽고 잘 정리된 데이터는 ‘문제를 해결하기 위해’ 데이터를 수집한 것이 아니라 ‘데이터를 위해’ 만들었기 때문에 목표에 관한 명확한 방향성을 설명하기 어려움액션데이터 분석가의 존재 의의는 조직의 문제를..

아티클 스터디 2025.02.12

태블로: 박스 플롯 | LOD | 날짜의 연속/불연속

박스 플롯강의를 들으며 박스 플롯을 만들어 보는데 시키는대로 했지만 박스 플롯이 만들어지지 않는 이슈 발생..! 팀원 지훈님의 도움을 받아 문제를 해결했는데 분석 탭 > 박스 플롯을 선택하면 해결 완료!선택하지 않아도 자동으로 만들어지는 분들도 있는듯 하다완성본은 ⬇️LOD (Level of Detail)특정 집계의 세부 수준을 지정해 데이터를 더욱 정밀하고 유연하게 분석할 수 있게 해주는 기능일반적인 집계(Aggregate) 함수보다 더 세부적인 데이터 레벨에서 계산하거나, 더 상위 수준에서 데이터를 집계할 수 있도록 해줌1. FIXED지정된 차원(필드)으로 고정된 수준의 집계 수행필터가 적용되더라도 고정된 결과를 반환ex. 특정 제품의 총 매출을 고정 값으로 사용하고 싶을 때{FIXED [차원] : ..

카테고리 없음 2025.02.11

[아티클] 이커머스에서 고객 지표 이해하는 법 (feat. 태블로)

주제: 이커머스에서 고객 지표 이해하는 법 (feat. 태블로) 이커머스에서 고객 지표 이해하는 법 (feat. 태블로) | 요즘IT태블로(Tableau)는 데이터를 연동해 지표를 시각화하여 분석하는 툴이다. 특히 이커머스에서 태블로를 활용하면, RFM(Recency, Frequency, Monetary), 최근 구매 시기, 구매 빈도, 총구매 금액을 기반으로 분yozm.wishket.com요약이커머스 고객 지표 분석하기 기본 지표: 클릭률, 유입률, 전환율 (노출한 광고 기준)클릭률: (클릭 수 / 노출 수)*100유입률: (사용자 수 / 노출 수)*100전환율: (구매자 수 / 사용자 수)*100고객 유형에 따라 기본 지표는 달라지며 고객 유형별로 타깃 고객, 상품, 전시, 광고 소재 등을 재점검하는..

아티클 스터디 2025.02.10

이번주 회고와 앞으로의 계획

데이터 분석 입문 주차 & 심화 프로젝트 기간 회고머신러닝 프로젝트 완료!하지만, 머신러닝은 여전히 어렵다.그나마 다행인 점은 데이터 분석가 신입 채용 공고에 머신러닝을 언급한 회사는 많지 않다는 점.데이터 분석가에 대한 내용들로 범벅이 된 나의 알고리즘 (인스타, 스레드 등..)에 따르면 신입 때 머신러닝 능력을 요구하는 회사는 그렇게 많지 않은 것 같다. 하지만, 시니어로 성장하기 위해/좋은 회사에 가기 위해서는 꼭 필요한 역량이라는 생각이 들고 나 역시 꼭 잘 해보고 싶은 영역이다. 부트 캠프가 끝난 후, 머신러닝에 대해 다시 공부해서 사이드 프로젝트로 진행하고 있는 마케팅레시피 뉴스레터 구독자들의 데이터를 군집화 해보는 경험을 통해 한층 더 성장하고 싶다. 데이터 분석 숙련 주차 시작데이터 분석 ..

WIL 2025.02.09

Python 코드카타: 행렬의 덧셈

행렬의 덧셈행렬의 덧셈은 행과 열의 크기가 같은 두 행렬의 같은 행, 같은 열의 값을 서로 더한 결과가 됩니다. 2개의 행렬 arr1과 arr2를 입력받아, 행렬 덧셈의 결과를 반환하는 함수, solution을 완성해주세요. 방법 1. 이중 for문 사용def solution(arr1, arr2): answer = [] for i,j in zip(arr1, arr2): # arr1의 각 행(i)과 arr2의 각 행(j) 동시 순회 row_sum = [] # 원소들의 합을 저장할 리스트 생성 for n,m in zip(i,j): # i와 j 행의 각 원소 동시 순회 row_sum.append(n+m) answer.append(row..

Python 2025.02.06

[아티클] 그 데이터는 잘못 해석되었습니다

주제: 그 데이터는 잘못 해석되었습니다 그 데이터는 잘못 해석되었습니다 | 요즘IT무엇이든 데이터가 있으면 쉽게 결정을 내릴 수 있을 것 같습니다. 하지만 현업에서는 데이터가 있어도 결정을 내리기 어려운 상황들이 있습니다. 특히 데이터를 통한 의사결정을 내릴 때, 가장yozm.wishket.com요약생존자 편향의 오류'이탈 고객 중 서비스를 장기간 이용한 고객의 비율'이 상승했다면 최근 고객들의 불만도가 높아졌다고 해석 가능하지만, 직관과 반대로 이 지표가 상승할 때 서비스가 올바른 방향으로 성장한다고 해석할 수도 있음예를 들어, 전체 이탈자가 100명일 때 아래와 같은 경우 B 서비스가 더 좋은 서비스A 서비스는 80명이 단기간 이용 유저, 20명이 장기간 이용 유저B 서비스는 20명이 단기간 이용 유..

아티클 스터디 2025.02.05