z [스터디] Recommender System : Toward the Next Generation of Recommender Systems : A Survey of the State-of-the-Art and Possible Extensions (2005) (4)
본문 바로가기

Recommender System

[스터디] Recommender System : Toward the Next Generation of Recommender Systems : A Survey of the State-of-the-Art and Possible Extensions (2005) (4)

728x90

시작하면서..

지금까지 Recommender System의 여러 방법 중 Content-based methods, Collaborative methods를 살펴보았습니다. 보시면 아시겠지만 이 각각 방법들은 결점이 존재합니다. 그래서 이 둘을 적절히 같이 사용하여 limitation을 해결하고자 한 Hybrid 방법에 대해 알아보고, 이 논문의 conclusion을 짓고자 합니다.

이번 포스트를 마지막으로 추천시스템의 대략적인 개요를 살펴보고 다음부터는 원서로 스터디를 해서 그 원서 기준으로 여러 포스트를 작성하고자 합니다.

Hybrid Methods

이번 포스트에는 Collaborative와 Content-based method를 결합하여 이 두 방법에 대한 limitation을 피할 수 있게끔 하는 hybrid approach에 대해 알아보겠습니다.

이 hybrid recommender system은 보통 4가지 기준으로 나눌 수 있는데,

  1. collaborative, content-based methods를 각각 따로 수행 후 결과를 조합하는 방식
  2. Content-based method의 몇몇 특성들을 CF(Collaborative Filtering을 의미하면 Collaborative method와 동일한 의미)에 녹이는 방식.
  3. CF의 몇몇 특성들을 Content-based에 녹이는 방식.
  4. Content-based와 Collaborative 특성을 둘 다 녹인 unifying model.

Combining Seperate Recommenders

위에서 언급한 여러 카테고리 중 첫번째인 따로 수행하는 경우를 보겠습니다.
이에 대해서는 두가지 시나리오가 존재하는데,

  1. 각각 method에 대한 outputs를 voting이나 linear combination 등을 통해 결합.
  2. 두 결과 중 더 나은 결과를 사용.

Adding Content-Based Characteristics to Colaboratie Models

이번엔 Collaborative method에 Content-based 의 특성을 녹인 경우를 보겠습니다.
이의 경우에는 전형적인 collaborative techoniques 뿐만이 아니라, 각 user에 대한 Content-based profile도 유지합니다. 여기에서 Content-based profile은 앞 Content-based method에서 나왔던 user c의 profile이라고 생각하시면 될 것 같습니다.

이로 인해 두가지 장점이 존재합니다.

  1. Purely collaborative approach의 sparsity related problem을 극복할 수 있게끔 해줌.
  2. Similar users에 의해 높게 평가된 items 뿐만이 아니라 해당 user profile에 대해 높게 score된 item도 추천.

Adding Collaborative Characteristics to Content-Based Models

이 경우는 Content-Based Model에 Collaborative 특성을 섞는 경우인데, 그냥 CF의 기법을 이용했다 라고 생각하시면 될 것 같습니다.
예를 들어 Content-based profile의 그룹에 dimensionality reduction technique을 적용한 경우가 있습니다.
(LSI,, Truncated SVD)

Developing a Single Unifying Recommendation Model

마지막 category의 경우인데, 이 경우는 single rule-based classifier에 Content-based 특성과 collaborative 특성을 녹인 경우입니다.
이 경우에 대한 예시로는 단어와 문서 사이를 잇는 잠재구조를 통한 단서와 문서 출현 확률 모델링인 pLSA, 그리고 estimation, prediction에 잇어서 MCMC(Markov chain Monte Carlo methods)를 이용한 Bayesian mixed effects regression models를 사용한 사례가 있습니다.
논문에서는 이에 대한 식이 나와있긴 하지만 좀 복잡한 내용을 겨우 두 문단 안에 정리해놓은거라 넘어가겠습니다.(나중에 배울듯)

그리고 Hybrid method는 Knowledge-based technique을 통하기도 합니다. (domain의 지식 사용) 이는 추천 시스템의 accuracy와 몇몇 한계를 다룰 때 사용되는데, 예를 들어 이 논문 Reference [17]에서는 식당, cuisines, ...에 대한 지식을 사용하여 식당을 추천해줍니다.
이에 대해 knoledge 습득이 필요하다는 단점이 있긴 한데, knowledge-based recommendation은 machine readable 한 형태로 구성된 domain knowledge가 이미 존재하는 곳에서 develope 되어왔기 때문에 이 경우에는 좀 괜찮다고 합니다.

Summary and Conclusions

지금까지 여러 technologies에 대한 것을 살펴보았습니다.

Recommender System은 두 기준으로 구별할 수 있습니다.

  • Recommendation approach에 따른 Content-based, Collaborative, Hybrid로의 categorized
  • Rating estimation에 대해 이용된 recommendation technique에 따른 heuristic, model-based cateogrized

Recommendation methods는 여러 form에서도 잘 작동 합니다.(책, CD, 식당.. 추천) 또한 몇몇 methods는 상업적인 강점을 지니기도 합니다.
하지만, CF, Content-based method 둘 다 특정한 한계가 존재합니다.
이에 대해 좀 더 나은 추천을 해주기 위해서는, 좀 더 복잡한 적용에 있어서 extention이 필요합니다. 더 복잡한 경우는 더 많은 factors로 하기도 하구요.

결국 좀 더 발전된 methods에 대한 필요성을 언급하며 Conclusion을 마칩니다.

마치면서..

Recommendation System에 대한 서베이 논문을 읽으면서 이 분야에 대한 대략적 이해를 했습니다. 실제로 사용되는 분야가 일상과 굉장히 밀접해있기도 하고 상업성도 짙어서 관심을 갖게 되었는데 이 분야에 대한 이해를 하면서 여러 방법론 (특히 CF)에 대해 신기하기도하고 약간 신선함을 느끼게 되서 더 큰 매력을 느끼게 되었습니다.

다음 포스팅부터는 원서를 기준으로 포스팅 하겠습니다. 나, 화이팅!

728x90