IT/SQL2 [BigQuery] 데이터 마이닝 8장 22강을 정리한 내용입니다. 데이터 마이닝이란 대량의 데이터에서 특정 패턴 또는 규칙 등 유용한 지식을 추출하는 방법을 전반적으로 나타내는 용어 입니다. 대표적인 데이터 마이닝의 방법에는 상관 규칙 추출, 클러스터링, 상관 분석 등이 있습니다. 데이터 마이닝 방법의 대부분은 재귀 처리와 휴리스틱 처리가 필요합니다. 따라서 단순한 SQL로는 처리가 어렵습니다. 그래서 일반적으로 R과 파이썬 등의 패키지를 사용하는 경우가 많습니다. 데이터 마이닝의 대표적인 방법으로 상관 규칙 추출 방법 중 하나인 '어소시에이션 분석'을 다루고, 어소시에이션 분석의 로직을 SQL로 구현하는 방법을 소개합니다. 또한 라이브러리를 별도로 사용하지 않고 데이터를 가공해보며 어떤 형식으로 데이터 마이닝을 하는지 알아보도록 하겠.. 2022. 7. 8. [BigQuery] 검색 기능 평가하기 8장 21강을 정리한 내용입니다. 운영하는 서비스에서 내부 검색 기능을 제공할 경우, 사용자가 어떤 검색 쿼리를 입력하고 어떤 결과를 얻는지 분석하는 작업이 굉장히 중요합니다. 따라 8강 21절에서는 검색 관련 행동 로그와 미리 입력하여 준비한 평가 전용 데이터로 검색 기능을 정량적으로 평가하고 개선하는 방법을 소개합니다. - 검색하는 사용자의 행동 검색하는 사용자의 행동 패턴은 다음과 같습니다. 1. 사용자가 특정 검색 쿼리를 입력한다. 2. 사용자는 해당 검색 결과를 출력하는 화면으로 이동한다. 3-1. 사용자는 검색 결과로 원하는 정보가 나오면 해당 정보의 상세 화면으로 이동한다. 3-2. 원하는 정보가 없다면 다시 검색하거나 서비스틀 이탈한다. - 검색 기능 개선 방법 검색 기능을 개선하는 방법에.. 2022. 7. 1. 이전 1 다음