TOROS (토로스)
- 개인화 추천을 위한 카카오 자체 개발 인공지능 추천 플랫폼
- 글, 사진, 음악, 뉴스 등 다양한 영역의 추천에서 사용되고 있음 (다음뉴스, 1boon, 브런치, 다음웹툰, 다음카페, 다음 TIP, 카카오 TV, 카카오뮤직, 카카오페이지, 카카오메이커스, 카카오헤어샵등 - 추후 카카오 네비도 사용 예정)
- 협업필터링(CF), 콘텐츠 기반 필터링(CB)에 더해 앙상블 기법, 멀티암밴딧(MAB), A/B테스트 등의 기술을 복합적으로 조합하여 서비스에 사용중
TOROS 추천 개요
토로스는 CF, CB 통계 모델, 일반적인 기계학습 모델 등 다양한 모델들에서 추천결과를 뽑고 뽑은 추천 결과를 앙상블하여 하나의 추천결과로 병합한다.
만들어진 추천 결과가 사용자들에게 노출되기 시작하면 MAB를 사용하 가장 좋은 추천 결과가 무엇일지 찾아낸다.
협업 필터링(Collaborative Filtering, CF)
- 인터넷 서비스들이 가장 기본적으로 사용하는 추천 기술
- 콘텐츠 사용 패턴이 비슷한 사람들이 비슷한 선호도를 가지고 있다고 가정하고 추천해 주는 방식
- 행렬 분해(Matrix Factorization, MF) 기법 - ALS, BPR-MF, LMF, LSTM 등의 MF 기법 사용중
- 서비스에 적용할 때는 규모성을 반드시 고려 - 입력되는 데이터에 대한 처리
- 장점 : 사용자 선호 데이터를 직접 사용하기 때문에 대중적이고, 친숙한 결과를 얻을 수 있음, 사용자 선호 데이터를 직접 최적화 하기 때문에 다른 추천 방법론들과 비교했을 때 성능이 우수
- 단점 : 기존 데이터에서 관측하지 못한 콘텐츠를 추천하는 것을 불가능 (콜드 스타트 문제), 실제 내용이 매우 상이한 콘텐츠도 추천결과에 논출된 위험, 인기있는 콘텐츠만 추천 결과에 너무 자주 노출되는 인기편향문제
콘텐츠 기반 필터링(Contents Based Filtering, CB)
- 사용자가 콘텐츠를 소비한 이력이 없는 경우 보완해 줄 수 있는 방법 중 하나.
- 컨텐츠의 내용 자체를 분석해 사용자가 선호하는 콘텐츠를 찾아냄
- 콘텐츠의 성향에 따라 자연어처리(NLP), 컨볼루션 신경만(CNN), 파형분석 방법 활용
- 장점 : 사용자들의 선호 데이터가 없는 콘텐츠도 추천할 수 있음, 엉뚱한 콘텐츠를 추천하지 않음
- 단점 : 사용자의 선호 데이터를 사용하지 않기 때문에 의외의 콘텐츠를 추천해주는 문제가 발생
앙상블 기법 (Ensemble Method)
- 상황에 따라 서로 다른 모델들을 잘조합 해 내는 방법 (앙상블 문제 해결을 위한 방법)
멀티암드밴딧(Multi-armed Bandit, MAB)
- 사용자 반응에 둔감한 앙상블 방법의 단점을 보완한 방법
- 서로 다른 반응률을 가진 여러 컨텐츠 중 가장 많은 클릭을 유도할 수 있는지를 찾는 머신러닝 방법
A/B테스트
- MAB의 시간에 따른 반응률의 신뢰선이 낮아지는 한계점을 보완하기 위한 방법
이곳에 더 자세한 설명이 있네요. https://brunch.co.kr/@kakao-it/72
'콘텐츠·서비스' 카테고리의 다른 글
유튜브의 티켓 판매 서비스 (0) | 2017.11.20 |
---|---|
2015 Great Calendar App Service (0) | 2015.06.03 |
Bucket List Creation Websites & Apps (0) | 2015.01.21 |
급변하는 소셜미디어 환경에서 흥하는 콘텐츠란? (0) | 2015.01.20 |
세븐나이츠 분석 (0) | 2014.12.29 |