카테고리 없음

팀 프로젝트 발표 자료 구성

sawo11 2024. 12. 31. 20:48

 

  • EDA
    • visit 데이터
      • 데이터 전처리
      # 행/열 수, 컬럼 타입
      visit.info()
      
      # 결측치 확인
      visit.isna().sum()
      
      #결측치 처리, 삭제
      # 인기점수는 데이터 분석 과정에 필요하지 않은 셀이라고 판단하여 결측치 고려 대상에서 제외
      # 제목과 여행객 구분의 결측치는 아주 미미한 결측치라고 판단하여 삭제
      visit.dropna(subset = '제목', inplace = True)
      visit.dropna(subset = '여행객구분', inplace = True)
      visit.isna().sum()
      
      # 데이터프레임 전체에 True 확인 = null
      visit.isnull()
      
    • visit_detail 데이터
      • 데이터 전처리
      # 1번 데이터
      # 데이터셋의 행/열 수
      visit
      
      # 컬럼 타입
      visit.dtypes
      
      # 결측치 확인
      visit.isna().sum()
      
    • place 데이터
      • 데이터 전처리
       
    • hotel 데이터
    • review 데이터
    • ERD (필요 없을 것 같기도)
  • 프로젝트 목표
  • 제주도 관광객 트렌드 분석과 중,장기적 관광객 유치를 위한 전략 수립
  • 비즈니스 목표
    1. 신규 콘텐츠 사업을 통한 관광객 유치
    2. 기존 및 신규 콘텐츠 장소에서 관광객이 선호하는 음식을 제공함에 따라, 관광객 유치와 추가적인 제주도 지역균형발전 방향성 재정립
  • 문제 인식 (visit 데이터 활용)
    • 코로나 이후 감소 → 증가 → 감소 ⇒ 코로나 시작 전년도인 2019년과 관광객 감소 시점인 2023년을 기준점으로 데이터 분석 진행
    # 날짜를 datetime 형식으로 변환
    df = pd.DataFrame(visit)
    df['여행시작일'] = pd.to_datetime(df['여행시작일'])
    
    # 연도 열 추가
    df['연도'] = df['여행시작일'].dt.year
    
    # 연도별 관광객 수 집계
    연도별_관광객 = df.groupby('연도')['여행일정아이디'].count().reset_index()
    연도별_관광객
    
    # 이상치 삭제
    연도별_관광객.drop([0, 1, 8, 9], inplace = True)
    연도별_관광객
    
    # column 이름 변경
    연도별_관광객.rename(columns = {'여행일정아이디': '관광객수'}, inplace = True)
    연도별_관광객.head(3)
    
    # 시각화
    # 그래프 그리기
    import matplotlib.pyplot as plt
    plt.rcParams['font.family'] = 'NanumGothic'
    
    # 바차트 그리기
    sns.barplot(x = '연도', y = '관광객수', data = 연도별_관광객, color = '#6799FF')
    plt.title("연도별 관광객 수")
    plt.show()
    
  • 상황 분석
    • 연도별 여행객 유형 변화 (visit 데이터 활용) —> 가족 단위 방문객을 겨냥한 마케팅 전략을 할 것이 아니라면 불필요한 part일 수도 있을 듯
      • 가족 단위 여행객 증가
      # 연도별 설정
      target_year = 2023 
      visit2023=visit[visit['여행시작일'].dt.year==target_year]
      
      # 유형별 그래프 (절대적 수치 - 파이그래프)
      data = visit2023['여행객그룹'].value_counts()
      labels = ['부모', '아이', '커플', '친구', '혼자']
      
      colors = sns.color_palette('pastel')[0:5]
      
      # 파이 그래프 생성
      plt.pie(data, labels=labels, colors=colors, autopct='%.1f%%')
      plt.title("2023년 유형별 분포")
      plt.show()주세요
      
    • 연도별 인기 태그 비교 (visit 데이터 활용)
      • 2023년에 새로운 태그로 제주의 문화유산, 체험관광, 테마공원 키워드 등장
    • 2023년 제주도 트렌드 키워드
      • 새로 떠오른 키워드인 **“제주의 문화유산”, “체험관광”, “테마공원”**에 주목
    • 관광객이 선호하는 음식 카테고리
      • 카페를 선호하는 경향이 두드러짐을 확인
  • 인사이트
    • 2023년 제주도의 트렌드 키워드 중 새로 떠오르는 키워드인 **“제주의 문화유산”, “체험관광”, “테마공원”과 “식도락 여행”**을 활용하여 관광객을 유치하자
    • 인기 있는 장소 (기존, 신규)
      • 관광객이 선호하는 음식 위치와 콘텐츠 위치 불일치 확인
      • 콘텐츠의 위치와 인접한 지역에 관광객의 니즈가 있는 음식점 입점 필요 (식당, 카페 등)
      • 가족을 위한 콘텐츠..? (가족 할인 패키지..?)
    • 가족 단위 방문객을 겨냥한 마케팅 전략
    • 제주도 공식 유튜브 활용전략 기획
    • 리플렛 제작.,… 

https://www.notion.so/teamsparta/5-589dd873292748a4b001ba22a4badce7