Data Projects/mini 데이터 분석 프로젝트5 [데이터 분석 스터디/항공사 고객 만족도 예측] 항공사 고객 만족도 예측 보충 EDA + 전처리 + 학습 항공사 고객 만족도 예측 대회 포스팅 시작하겠습니다. 프로젝트 구성은 Simple EDA -> Deep EDA -> 모델 설계 -> 모델 학습입니다. 이번 포스팅은 보충 EDA, 이상치 확인/처리, 데이터 전처리, 모델 학습, 모델 앙상블, 모델 튜닝, 제출로 구성되어 있습니다. 시작은 아래 포스팅 이후부터 다루겠습니다. 2022.02.08 - [엘리스 AI 트랙/데이터 분석 스터디] - [데이터 분석 스터디/항공사 고객 만족도 예측] 항공사 고객 만족도 예측 EDA [데이터 분석 스터디/항공사 고객 만족도 예측] 항공사 고객 만족도 예측 EDA https://www.kaggle.com/deltasierra452/airline-pax-satisfaction-survey Airline Passenger S.. 2022. 2. 11. [데이터 분석 스터디/항공사 고객 만족도 예측] 항공사 고객 만족도 예측 EDA https://www.kaggle.com/deltasierra452/airline-pax-satisfaction-survey Airline Passenger Satisfaction Predictive Analysis Airline_pax_satisfaction_survey www.kaggle.com 항공사 고객 만족도 예측 대회 포스팅 시작하겠습니다. 프로젝트 구성은 Simple EDA -> Deep EDA -> 모델 설계 -> 모델 학습입니다. 이번 포스팅은 Simple EDA의 패키지 설치, 데이터 불러오기, 결측치 확인, 기초 통계 분석, 상관관계 시각화로 구성되어 있습니다. 개발환경은 google colab이며 자세한 코드는 포스팅 끝 github주소를 첨부하겠습니다. 0. google drive.. 2022. 2. 8. [데이터 분석 스터디] 03 넷플릭스 시청 데이터로 알아보는 데이터형 변환 엘리스에서 제공하는 파이썬 실전 데이터 분석 강의 중 세 번째 주제인 넷플릭스 시청 데이터로 알아보는 데이터형 변환 리뷰 하겠습니다. 1. 주제 넷플릭스 시청 데이터 분석하기 회원 별로 시청한 작품 정리하기 두 작품의 유사도 비교하기 예상 선호도 점수 구하기 2. 필자가 해야 하는 것 preprocess_data(filename) 함수 구현 reformat_data(title_to_users) 함수 구현 get_closeness(title_to_users, title1, title2) 함수 구현 predict_preference(title_to_users, user_to_titles, user, title) 함수 구현 3. preprocess_data(filename) 세부 구현 사항 - 목적 : 입력받.. 2022. 1. 29. [데이터 분석 스터디] 02 영어 단어 모음으로 시작하는 텍스트 파일 분석 엘리스에서 제공하는 파이썬 실전 데이터 분석 강의 중 두 번째 주제인 영어 단어 모음으로 시작하는 텍스트 파일 분석 리뷰 하겠습니다. 1. 주제 두 번째 프로젝트에서는 영어 단어와 그 빈도수를 정리한 British National Corpus 단어 모음을 분석하고 시각화해봅니다. corpus.txt를 이용해 가장 많이 사용된 영어 단어 분석 matplotlib을 이용해 단어 별 사용 빈도를 보여주는 막대그래프 작성 분석 후《이상한 나라의 엘리스》동화책에 등장하는 단어 수와 BNC 데이터를 비교해보겠습니다. 가장 많이 등장하는 단어의 분포 불용어를 제외하고 가장 많이 사용된 단어 2. 필자가 해야 하는 것 import_corpus(filename) 함수 구현 create_corpus(filenames) 함.. 2022. 1. 29. [데이터 분석 스터디] 01 트럼프 대통령 트윗으로 시작하는 데이터 처리 엘리스에서 제공하는 파이썬 실전 데이터 분석 강의 중 첫 번째 주제인 트럼프 대통령 트윗으로 시작하는 데이터 처리 리뷰 하겠습니다. 1. 주제 첫 번째 프로젝트에서는 트럼프 대통령이 2017년 1월 20일 취임 이후 1년 동안 게시한 2,500여 개의 트윗을 분석해봅니다. 가장 많이 사용한 #해시태그 가장 많이 사용한 키워드 가장 많이 사용한 @멘션 월별 트윗 통계 분석 후, 데이터의 유형에 알맞은 시각화 코드를 살펴봅니다. 막대그래프 단어 구름 2. 필자가 해야 하는 것 preprocess_text(text) 함수 구현 analyze_text(words) 함수 구현 filter_by_month(tweet_data, month) 함수 구현 3. preprocess_text(text) 세부 구현 사항 - .. 2022. 1. 28. 이전 1 다음