<DATA Literacy>
1. 소셜 데이터 분석 (빅데이터 수집, 텍스트 마이닝, 소셜 빅데이터 분석 > 시각화)
* 소셜 데이터 : 소셜 웹 상에서 사람들이 실시간으로 생산해내는 대규모 데이터 (실시간으로 발생하는 공개글). 유의미한 정보 추출 및 인사이트 획득.
* 소셜 분석의 역할
1) 사회 : 대중의 솔직한 생각 및 반응 파악, 특정 분야의 흐름 및 트렌드 예상, 사회 동향 및 트렌드 파악
2) 비즈니스 : 특정 제품과 서비스에 대한 사람들의 반응 및 요구사항 확인, 특정 주제에 대한 사람들의 생각 파악, 특정 집단의 생각과 의견 파악
2. 연관어와 감성어
3. 기업 활용 사례
<데이터 정제할 때 기억해야 할 것>
1. 필요 없는 것 과감히 삭제
2. 하나의 셀에는 하나의 값
3. 빠진 값 처리
<현업 CEO 밋업 특강>
*인도네시아 시장
- 우리나라 인구 수보다 인도네시아 MZ세대 여성 인구 수가 더 많음
- COD (Cash on Delivery)를 하던 국가 > 매우 빠르게 성장중
- 인도네시아 10대 스타트업 : 그랩, 고젝, 쇼피, 토코페디아, 주마토, 라자다, 제이디아이디, 오보, 부까라팍, 트레블로카
<통계>
‘현상’을 나타내고 있는 Data로부터 유용한 정보를 도출하여 적절한 의사결정을 하게 해주는 것
*검정 통계학 : 표본으로 전체를 설명하는 것
*가설 검정(모집단의 모수에 대한 잠정적 주장)
1. 귀무 가설 : 기존의 사실과 차이가 없다, 같다
2. 대립 가설 : 귀무 가설의 반대 (주장하고 싶은 것)
ex) 무죄추정의 원칙 : 처음에는 ‘범죄자는 범인이 아니다’라는 귀무가설을 세우고 그 귀무가설을 기각할 수 있는 ‘범죄자는 범인이다’를 입증할 수 있는 자료를 모으는 것
* P-Value < 0.05 (오차한계 5%) : 귀무 가설 기각, 대립가설 채택
** P value는 1종 오류를 범할 확률
*1종오류 vs 2종 오류
1. 1종 오류 : 귀무가설이 참인데 기각하는 경우 (ex. 무고한 사람을 감옥에 보내는 경우)
2. 2종 오류 : 귀무가설이 거짓인데 기각하지 않은 경우
<요약 정리>
1. 모집단, 전수 조사
2. 표본, 표본 조사
3. 유의수준(오차한계) : 5%
4. 신뢰수준 : 95%
5. 가설(귀무가설, 대립가설)
6. P-Value < 0.05, 대립가설 채택
<기술통계의 이해>
*산술평균(mean) : 총합을 변수 n개로 나눈 값
*중앙값(median) : 변수들을 크기순으로 배열했을 때 중앙에 있는 수
*최빈값(mode) : 가장 많이 등장한 수
*편차 : 하나의 데이터 값이 평균에서 얼마나 떨어져 있는지에 대한 값
*분산 : ‘편차’의 제곱의 합을 계산한 값
*표준편차 : 분산에서 제곱근(루트)를 씌워준 값 (절대값)
*왜도 : 데이터가 대칭을 이룰수록 왜도 값은 0, 데이터가 한쪽으로 치우칠수록 양수 또는 음수
*첨도 : 완전히 정규 분포를 따르는 데이터의 첨도값은 0, 데이터 꼬리의 모습에 따라 양수 또는 음수
*변동계수 = 표준편차 / 평균
<상관분석 Correlation Analysis>
*상관관계는 인과관계가 아니다.
https://tylervigen.com/spurious-correlations
'마케팅 공부' 카테고리의 다른 글
(230608) 퍼포먼스 마케팅 공부_마케팅리서치(시장조사) (0) | 2023.06.08 |
---|---|
(230607) 퍼포먼스 마케팅 공부 (0) | 2023.06.08 |
(230605) 퍼포먼스 마케팅 공부 (0) | 2023.06.05 |
(230602) 퍼포먼스 마케팅 공부 (0) | 2023.06.02 |
(230530) 퍼포먼스 마케팅 공부 (0) | 2023.05.30 |