[빅데이터분석기사 필기] 3-5 비정형 데이터 분석기법
1. 비정형 데이터비정형 데이터란 형식이 정해지지 않은 데이터로 구조와 형태가 다르고 정형화 되지 않은 문자, 음성, 이미지, 영상데이터이다.데이터의 유형유형내용예시정형 데이터- 형태가 있으며, 연산이 가능. 주로 RDBMS에 저장- 데이터 수집 난이도가 낮고 형식이 정해져 있어 처리가 쉬움 관계형 데이터베이스, 스프레드 시트, CSV반정형 데이터- 형태가 있으며, 연산이 불가능. 주로 파일로 저장- 주로 API형태로 저장되어 데이터 처리기술이 요구XML, HTML, JSON, 로그 등비정형 데이터- 형태가 없으며 연산이 불가능, 주로 NoSQL에 저장- 데이터 수집난이도가 높으며 텍스트 마이닝 혹은 파일일 경우 파일을 데이터 형태로 파싱해야 하기 때문에 수집 데이터 처리가 어려움소셜데이터, 영상, 이미..
2024. 8. 17.