본문 바로가기
Data/AI

추천시스템 개요 - 종류와 기본적인 용어

by Christine__ 2024. 1. 10.

 

공부하는 이유 & 강의 정보

추천시스템 공부를 시작한 이유

이 블로그의 첫 게시물이 취준할 때 Movie Lens 데이터로 추천하는 Item Based Collaborative Filtering이었다. 그리고 올 해 첫 스터디의 주제를 추천시스템이 되었다. 돌고돌아 다시 온 기분.  

추천 시스템을 스터디 주제로 잡은 이유는 이커머스에서 일하면서 데이터로 매출을 끌어올릴 수 있는 주요한 방법 중 하나가 결국 적절한 상품을 추천하는 데 있다는 걸 경험적으로 느꼈기 때문이다. 적어도 추천시스템에는 어떤 것들이 있는지 이해가 있어야 나중에 회사에 필요한 추천시스템을 구축할 때, 배경지식을 갖추고 있을 것 같아 공부해보기로 했다. 

 

추천시스템 강의

강의는 Coursera 에서 University of Minnesota가 만든 Recommender Systems 과정을 들어볼 예정이다. 

과정은 총 5개의 수업으로 구성되어 있는데 영어강의라 들은 내용들을 다시 이해해볼 겸 주요한 내용들은 블로그에 다시 정리해보려고 한다. 추천시스템을 좀 대략적으로 알아보고자 하는 사람들에게 도움이 되었으면. 

오늘 작성하는 내용은 과정 중 첫 수업인 추천시스템의 기본 : 비개인화 & 콘텐츠 기반의 첫 강의 내용이다. 

 

추천시스템 

 

추천시스템은 왜 만들어졌는가

추천시스템은 수많은 선택지에 놓인 상황에서 필요한 정보를 빠르게 찾기 위한 방법이다.

가장 흔한 예시로 넷플릭스 영화 추천 알고리즘을 생각하는데 과거에도 추천시스템은 존재해왔다. 

원시인이 어떤 음식에 독이 있는지 알 수 없을 때, 직접 먹지 않고 누군가 먹는 것을 보고 괜찮은지 확인한 후에 먹는 것도 일종의 추천시스템의 예시로 생각해볼 수 있다. 

 

추천시스템의 종류

1. 정보 검색과 필터링 Information Retrieval & Information Filtering

정보 검색

: 문서와 같이 일정한 콘텐츠에 대해 각 사용자가 각자 필요한 정보를 얻고자 할 때

 - 예시: 데이터베이스에서 필요한 정보를 쿼리로 추출( 데이터는 일정, 사용자의 요구는 다양)

 - 방법 : TF-IDF 문서에 대한 등급 + 문서 내 용어에 대한 등급 매기기  

 

정보 필터링

: 변화하는 콘텐츠에서 일정한 정보를 얻고자 할 때

  - 예시: 메일이 끝없이 쌓여가는 메일함에서 필요한 메일을 찾을 때 (  데이터는 변화, 사용자 요구는 한정적)

  - 방법 : 사용자가 원하는 정보가 무엇인지를 먼저 찾고, 문서를 찾은 요구에 맞게 필터링 

 

2.협업 필터링 Collaborative Filtering

: 단순히 어떤 주제에 대한 정보 뿐 아니라 취향에 맞고 퀄리티가 좋은 정보를 찾고할 때

- 방법

  • Manual Collaborative Filtering: 유저를 비슷한 그룹으로 나눠서 그룹에서 반응이 좋은 정보를 전달  
  • Automated Collaborative Filtering : 각 유저가 매긴 등급을 바탕으로 유저들 간의 유사도를 계산하고(그룹화 x) 특정 정보에 대한 유저의 등급을 예측

추천시스템 관련 기본 용어

  • rating(등급) : 선호도를 평가 완료한 값
    • Explicit Rating : 유저가 매긴 등급 (별점)
    • Implicit Rating : 유저 행동을 기반으로 한 등급 (클릭 여부, 구매 여부 등)
  • Prediction : 선호도를 추정한 값
  •  Content : 속성 (영화 장르 등)
  • Collaborative : 다른 유저의 데이터를 사용하는 것
  • Non-Personalized and Stereotyped: 대중성, 그룹의 선호도를 기반
  • Product Association: X를 좋아하는 사람이 Y도 좋아하더라~
  • Content-Based :  내가 좋아하는 컨텐츠 속성을 학습 

 

그럼 다음 강의에서 비개인화된 추천에 대해서 설명해보겠다.

'Data > AI' 카테고리의 다른 글

영화 추천 알고리즘: Item-based Collaborative Filtering  (0) 2021.06.03