본문 바로가기
Recommender System

[RC] Recomender System 개요

by AteN 2022. 12. 8.

주요 추천 알고리즘

  • 추천 시스템에 사용될 수 있는 알고리즘의 종류는 자세히 분류해 보면 수천, 수만 가지가 있을 수 있지만 이들은 대체로 다음의 몇 가지 알고리즘의 변형이라고 할 수 있다

협업 필터링 (Collaborative Filtering : CF)

  • 협업 필터링이란 구매, 소비한 제품에 대한 각 소비자의 평가를 받아서 평가 패턴이 비슷한 소비자를 한 집단으로 보고 그 집단에 속한 소비자들의 취향을 활용하는 기술이다. 예를 들어 A라는 소비자와 제품 평가 패턴이 비슷한 사람들을 골라서 이 사람들이 공통으로 좋아하는 제품 중에서A가 접하지 않는 제품을 골라내서 제시하는 기술이다. 이 기술은 사람들의 취향이 뚜렷이 구분되는 제품(예를 들어 영화나 음악, 패션)을 추천할 때 더욱 정확하다고 알려져 있다
  • 이러한 협업 필터링 기술의 한 가지 한계점으로는 소비자들의 평가 정보를 구하기 어려울 수도 있다는 점이다. 소비자들에게 제품을 구입한 후에 평가 정보를 요청하면 이를 제공하는 사람이 많지 않다. 이러한 한계를 극복하기 위해서 간접적인 정보를 사용하는 경우가 많다. 예를 들어 던 제품에 대해서 게속적으로 정보를 검색하는 것이나 어떤 제품을 쇼핑 카트에 넣는 것 등은 그 제품에 대한 관심의 표현이다. 이러한 정보가 온라인에서는 클릭스트림(clickstream) 형태로 수집되기 때문에 클릭스트림의 분석을 통해서 소비자의 취향이나 니즈를 알아 낼 수 있다. 협업 필터링의 가장 대표적인 예가 아마존의 제품 추천 시스템과 넷플릭스의 영화 추천 시스템이다

내용 기반 필터링(Content-Based filtering : CB)

  • 내용 기반 필터링이란 제품의 내용을 분석해서 추천하는 기술을 뜻한다. 특히 소비자가 소비하는 제품 중 텍스트 정보가 많은 제품(예를 들어 뉴스나 책 등)을 분석하여 추천할 대 많이 이용되는 기술이다. 텍스트 정보의 분석에 대해서는 문헌 정보학 분야에서 오래 전부터 연구가 이루어져 왔다. 텍스트 중에서 형태소(명사, 동사 등)를 추려내고 이 중에서도 핵심 키워드가 어떤 것인지를 분석하는 기술이 기본적인 기술이다. 이렇게 추려낸 키워드를 활용해서 소비자의 관심사항에 대한 분석이 가능하다.
  • 예를 들어서 어떤 소비자가 현재 관심이 있는 것으로 보이는 책이나 뉴스가 있다면 그 책과 뉴스의 키워드를 추려내고 다른 책이나 뉴스 중에서 비슷한 키워드를 가진 것들을 찾아내서 화면의 상단에 보여주면 소비자가 이들을 클릭해서 볼 가능성이 높은 것이다

지식 기반 필터링 (knowledge-Based filtering :KB)

  • 협업 필터링과 내용 기반 필터링의 공통적인 단점은 전체적인 그림이 없다는 것이다. 어떤 소비자가 어던 제품을 좋아할지에 대한 분석은 가능하지만 "왜 그 제품을 좋아할 것인가?"에 대해서는 답을 해줄 수 없다
  • 지식 기반 필터링은 특정 분야(domain) 전문가의 도움을 받아서 그 분야에 대한 전체적인 지식구조를 만들어서 이를 활용하는 방법이다. 전체적인 지식 구조는 다양한 형태로 표현될 수 있다. 그 분야의 중요한 개념을 가지고 체게도(ontology)를 만드는 것이 가장 일반적인 방법이다. 우리가 동물을 종-속-과-목-강-문-계로 분류하여 쳬계도를 그리듯이 어떤 분야의 키워드와 그 관게를 그림으로 표시한 것이 이 쳬계도 이다.
  • 예를 들어 컴퓨터라는 제품 분야에서는 가장 중요한 상위 분류가 pc, 노트북, 태블릿이 될 것이며 전문가는 이들 각각에 대해서 그 밑에 어떤 것드리 있고, 다시 그 밑에는 또 어던 것이 있는지 등을 제시할 수 있을 것이다. 이렇게 작성된 체계도를 바탕으로 소비자가 구매한, 혹은 관심 있는 제품과 관련이 있는 제품을 이 쳬계도에서 찾아서 제시할 수 있다
  • 지식을 기반으로 한 필터링의 장점은 전체 적인 구조를 알 수 있다는 것이고 지식이 중요한 분야(ex, 교육, 와인, 커피 등)에서 효과가 좋다는 점이다. 그렇지만 단점으로는 각 분야에 대해서 전문가가 필요하고, 전문가의 능력에는 한계가 있기 때문에 모든 세세한 분야에 다 적용할 수 없다는 점이다

딥러닝(Deep Learning) 추천 기술

  • 딥러닝 추천 기술이란 AI 알고리즘 중에 현재 가장 많이 사용되는 딥러닝 방법을 사용하는 방식이다
  • 딥러닝의 입력으로 다양한 사용자와 아이템의 특징값(Feature)을 사용하고, 이를 통해 얻는 출력은 각 아이템에 대한 각 사용자의 예상 선호도로 사용하는 것이 보통이다. 이렇게 하면 각 사용자에 대해서 많은 아이템의 예상 선호도를 계산할 수 있고, 이 중에서 예상 선호도가 높은 아이템을 추천해 주게 된다. DL 기반 추천의 장점은 다양한 입력 변수를 사용할 수 있다는 것이다. 일반적으로 DL 기술은 이미지 인식 등에서 탁월한 성능을 발위한다. 그렇지만 연속값(예를 들어 1에서 5점)으로 표시되는 아이템에 대한 사용자의 선호도를 딥러닝을 사용하여 추천할 경우 정확도가 다른 알고리즘에 비해서 크게 우월하지는 않다고 알려져 잇다. 그래서 보통은 다른 알고리즘과 같이 사용되는 경우가 많다

하이브리드(Hybrid) 기술

  • 실제로 추천 시스템을 구축할 대는 위해서 얘기한 기술은 한가지만 사용ㅎ는 경우는 별로 없고 대부분 두 가지 이상의 기술을 혼합해서 사용하는 하이브리드 형태로 자주 사용된다. 예를 들어 아마존의 추천 시스템에서도 협업 필터링이 주가 되지만 그 외의 다양한 기술이 같이 사용된다. 연구에 다르면 하나의 기술을 사용할 대보다 복수의 기술을 사용하는 경우에 정확도가 향상되고 결합되는 기술의 종류가 많아질수록 더 큰 향상이 이루어진다고 한다. 실제로도 각 기술은 장단점이 뚜렷하기 대문에 이들을 적절히 결합하면 좋은 효과를 볼 수 있다. 이때의 과제는 가 기술을 어떤 방식으로 결합할 것인가이다. 이에 대해서는 각 기업과 산업이 처한 환경에 따라 다르기 때문에 다양한 시도를 해보면서 최적의 방법을 찾는 것이 가장 바랍직할 것이다.

댓글