데이터 분석 3

[Pandas]ParserError: Error tokenizing data. C error: Expected N fields in line K, saw N+1

공공 데이터 포탈에서 데이터를 신청해서 여러 파일들을 .csv 형태로 열다가 다음과 같은 에러를 마주하게 되었다. 내가 작성했던 코드는 아래와 같았다. import os import pandas as pd # path 찾는 code path = "./data/[데이터명].csv" df = pd.read_csv(path, encoding='utf-8') # Error df.head() csv파일의 경우 comma를 사용해 column 단위의 값들을 구분하는 파일인데, 에러메시지를 보니 13개의 속성을 기대했으나 실제 파일에는 14개가 존재한다고 한다. 그래서 해당 경로에 위치한 csv 파일을 직접 열람해서 Column으로 기재된 부분의 개수를 세었으나 13개였다. 눈으로 보기에는 잘못된 부분이 잘 보이지 ..

데이터 분석 2024.03.26

Retention 리텐션

Datarian Blog에 있는 Retention과 관련된 읽기 자료를 읽고 주요 내용과 느낀 점에 대해 정리해보고자 한다. 더 구체적인 내용 확인을 위해서는 블로그 하단에 남겨둔 참고 링크로 접속하면 된다. Retention Retention은 Lean Analytics Chapter 5에서도 등장하는 데이브 맥클루어(Dave McClure)가 만든 AARRR 지표 중에서 사용자 유치 (Acquisition) 사용자 활성화 (Activation) 사용자 유지 (Retention) 매출 (Revenue) 추천 (Referral) 세 번째에 해당하는 단계이다. Retention이 중요한 이유는 아무리 좋은 광고나 마케팅 켐페인을 통해 고객이 유입되더라도 그 고객이 일회적인 방문만 하게 된다면 밑빠진 독에 ..

데이터 분석 2024.02.07

RFM 고객 분석이란?

RFM 분석이 필요한 이유 RFM 분석은 존재하는 고객 행동을 기반으로 한 데이터를 사용해 미래에 새로운 고객이 어떻게 행동할 지를 예측하고자 하는 방법이다. (a way to use data based on existing customer behavior to predict how a new customer is likely to act in the future.) 또한 Marketing과 Customer Experience의 성공 정도를 측정하고 인지시켜줄 수 있는 강력한 KPI로 활용될 수 있다고 한다. (RFM is one of many powerful KPIs that can be used to inform and measure the success of your enterprise’s mark..

데이터 분석 2024.01.21