본문 바로가기

상품 리뷰 데이터3

[SQL로 배우는 데이터 전처리 분석] 8. 상품 리뷰 데이터를 이용한 리포트 작성 (3) - Size Complain과 Clothing ID별 Size review 안녕하세요. 이번 포스팅은 review에 종종 나왔던 size에 대한 complain과 clothing id별 size review에 대해 분석해보겠습니다. Size Complain 이전 포스팅에서 살펴본 내용에 따르면, Complain 내용의 다수가 Size에 관련한 문제였습니다. 먼저 전체 리뷰 내용 중 Size와 관련된 리뷰가 얼마나 되는지 확인하기 위해서 Review Text의 내용 중 size라는 단어가 언급된 Reivew가 몇 개인지 계산해보겠습니다. SELECT `REVIEW TEXT`, CASE WHEN `REVIEW TEXT` LIKE '%SIZE%' THEN 1 ELSE 0 END SIZE_YN FROM MYDATA.DATASET2; SIZE_YN은 리뷰의 내용 중 size가 포함되어 .. 2022. 7. 21.
[SQL로 배우는 데이터 전처리 분석] 7. 상품 리뷰 데이터를 이용한 리포트 작성 (2) - 주요 Complain 및 연령 별 Worst Department 이번 포스팅은 상품 리뷰 데이터에서 평점이 낮은 상품의 주요 Complain이 무엇인지 알아보고, 연령 별 Worst Department를 분석해보겠습니다. 평점이 낮은 상품의 주요 Complain 먼저 Department별로 평점이 낮은 주요 10개 상품을 조회한 후, 해당 상품들의 리뷰를 살펴보겠습니다. 1) Department Name, Clothing Name별 평균 평점 계산 SELECT `DEPARTMENT NAME`, `CLOTHING ID`, AVG(RATING) AVG_RATE FROM MYDATA.DATASET2 GROUP BY 1, 2; 2) Department별 순위 생성 Department, Clothing id의 평균 평점을 계산하고, Department 내에서 평균 평점을 기준.. 2022. 7. 21.
[SQL로 배우는 데이터 전처리 분석] 6. 상품 리뷰 데이터를 이용한 리포트 작성 (1) - Division별 평점 분포 계산 천 대리님, 의류 회사에서 상품별 리뷰 데이터를 분석해 달라는 요청을 받았습니다. 상품 평점을 통해 상품의 문제점과 개선 방향을 찾는 것이 이 분석의 주요 목적입니다. 천 대리님이 자유롭게 분석해서 공유해 주세요. 이번 포스팅은 상품 리뷰 데이터를 이용하여 Division별 평점 분포를 계산해보겠습니다. 1) Division별 평균 평점 계산 먼저 Division별로 평점을 계산해 보고, 어떤 Division의 상품이 좋은 평가를 받는지 또는 좋지 않은 평가를 받는지 살펴보겠습니다. 해당 데이터 세트의 칼럼 구조를 살펴보겠습니다. Clothing ID : 상품 번호 (Unique Value) Age : 나이 Title : 리뷰 제목 Review Text : 리뷰 내용 Rating : 리뷰 작성자가 제출한.. 2022. 7. 20.