뒤끝 베이스 Ranking #01 랭킹 시스템 이해하기
주제별 출처의 신뢰도와 인기도를 반영하는 C-Rank 알고리즘 : 네이버 블로그
그래서 그 동안 C-Rank 알고리즘으로 계산된 값은 블로그 검색 결과에서 매우 온라인 카지노 순위 제한적인 영향만 미치도록 활용되어 왔습니다. 그러나 오랜 기간 동안의 데이터 학습과 테스트, 시스템 튜닝을 통해 끊임없이 관련 알고리즘을 개선해 왔고, 2016년 ‘네이버 라이브 검색’에서 라이브 검색의 서비스 특징에 맞는 일부 요소를 추가해 비로소 ‘C-Rank’라는 이름으로 외부에 공개하기에 이르렀습니다. 따라서 ‘네이버 라이브 검색’에서는 아이돌이나 게임, 여행, 방송 등 특정 주제에 대한 관심과 집중도가 높은 블로그의 포스트가 검색 결과에 더 잘 노출되도록 검색 랭킹에서 C-Rank 알고리즘의 결과를 높은 비중으로 반영하고 있습니다.
구글 검색 알고리즘 연도별, 카테고리별 정리
또 지금까지 랭킹 시스템 명칭으로 새로운 시스템이 도입됐을 때 구글은 업데이트라는 말을 자주 사용하고 있다. 예를 들어 페이지 체험 평가 시스템을 페이지 체험 업데이트로 적고 콘텐츠 유용성을 평가하는 시스템을 유용성 업데이트라고 한다. 다만 이를 판단하는 알고리즘 기술이 더욱 개선되어, 보다 나은 품질의 검색결과를 제공할 수 있게 될 예정입니다. 인스타그램의 랭킹 시스템은 사용자가 어떤 콘텐츠를 보게 될지를 결정하는 복잡한 과정이에요. 이 시스템은 단순히 게시물의 좋아요 수나 댓글 수를 기반으로 하지 않고, 사용자 개개인의 행동 패턴과 선호도를 반영해요. 사용자가 어떤 게시물을 얼마나 오랫동안 보는지, 댓글을 남기는지, 친구와의 상호작용 등을 모두 고려하여 중요도를 매깁니다.
- 예를 들어, 누군가 ‘김치’를 검색했다면 ‘김치’라는 단어가 포함된 모든 문서를 펼쳐 놓고, 현재 시점에서 ‘김치’를 검색한 사람이 찾는 문서일 가능성이 높은 순서대로 1등부터 꼴등까지 줄 세워야 합니다.
- 또한 A가 1분 전에 다른 콘텐츠들도 좋아했는지 알아야 하기 때문에 이 정보를 순위에 최적으로 활용할 수 있습니다.
- 목록에 열거된 순위 시스템을 모두 이해한다면 오랜 SEO 경험이 있다고 자부하셔도 좋습니다.
- 포스트의 유형, 임베딩, 뷰어가 상호작용하는 경향이 있는 것을 포함하여 게시물의 가치를 예측하는 데 사용할 수 있는 많은 특징이 있습니다.
‘데이터사이언스 > 추천시스템’ 카테고리의 다른 글
ELO 시스템이 일정한 점수 변화량을 가지는 것에 비해, Glicko는 플레이어의 실력에 대한 신뢰도와 불확실성을 고려한다. BERT는 알고리즘이 자체적으로 대량의 데이터를 스스로 읽고 학습하는 방식으로 단어의 문맥, 관계 등을 판단하고 예측하는 자연어처리 언어모델입니다. 빠르게 변해가는 이용자 니즈에 맞추어 보다 좋은 결과를 제공하기 위해 꾸준히 노력하겠습니다. 랭킹에 영향을 주는 요소들을 다양화하였고, AI기반으로 수백가지의 랭킹 시그널이 빠르게 검색결과에 반영될 수 있도록 하였습니다. 사용자가 올리는 콘텐츠의 성격 및 반응 방식에 따라서 알고리즘은 그 콘텐츠의 우선순위를 다르게 매깁니다.
이런 검색 결과를 결정하는 시스템은 엄격한 테스트와 평가를 통해 정기적으로 개선되고 있으며 콘텐츠 제작자와 기타 사용자에게 유용하다고 생각되는 경우 순위 시스템 업데이트를 알린다. 그리고 만약 수입 김치에서 대장균이 검출되었다는 뉴스가 화제인 상황이라면, 아래와 같이 김치 만드는 방법보다는 대장균 검출과 관련된 내용의 블로그 포스트가 검색 결과에 먼저 나오는 것 역시 검색 모델을 통해 검색 랭킹이 결정된 결과라고 할 수 있습니다. 구글은 검색 자동 순위 시스템과 운영 방법에 대한 정보를 정기 공유하고 있으며 시스템에 대해 더 쉽게 알 수 있는 구글 검색 순위 시스템 가이드라는 페이지를 공개했다. 그러나 이른바 ‘검색에 잘 나오는 블로그’가 되려면, 그 시작 단계에서 올바른 문제 해결을 위해 잘못된 개념을 바로 잡고 어떻게 접근하는 것이 옳은 방식인지 설정하는 것이 필요하다고 생각합니다.
이러한 다양한 알고리즘 덕분에 사용자에게 맞춤형 콘텐츠를 제공할 수 있는 것입니다. 이제 우리는 모든 예측을 가지고 있고, 우리는 그것들을 하나의 점수로 결합할 수 있습니다. 이렇게 하려면 계산 능력을 절약하고 콘텐츠 유형 다양성과 같은 규칙을 적용하기 위해 여러 개의 패스가 필요합니다. 그런 다음 패스를 통과하면 경량 모델을 실행하여 A에게 가장 적합한 500개의 게시물을 선정합니다.
위 ‘산후다이어트’ 블로그 검색 결과 예시에서 보시는 것과 같이 C-Rank를 검색 랭킹 알고리즘에 반영했을 때와 반영하지 않았을 때의 검색 결과는 크게 차이가 납니다. C-Rank 적용 전에는 별다른 차별성 없는 내용의 단순 병원 홍보 글이 상단에 나오는 것과 달리. C-Rank를 적용하면 피트니스센터나 출산상담센터 등 ‘산후 다이어트’를 검색한 이용자에게 보다 더 유익한 정보가 검색 결과 상단에 노출됩니다.
네이버 검색 랭킹 알고리즘을 이해하기 위해서 먼저 알아두어야 할 개념이 ‘검색 모델(search model)’입니다. 시스템이 모든 문서의 내용을 검토해서 문서가 좋은지 나쁜지 판단하기는 어렵기 때문에 이를 평가할 수 있는 다양한 정보와 패턴을 이용하여, 검색 이용자가 찾고자 하는 문서와 그렇지 않은 문서의 표본을 구성한 것이 ‘검색 모델’이라고 할 수 있습니다. 예를 들어, 누군가 ‘김치’를 검색했다면 ‘김치’라는 단어가 포함된 모든 문서를 펼쳐 놓고, 현재 시점에서 ‘김치’를 검색한 사람이 찾는 문서일 가능성이 높은 순서대로 1등부터 꼴등까지 줄 세워야 합니다. 이처럼 기본적으로 블로그 검색에 사용하는 데이터뿐만 아니라 사이트나 인물 정보 등 다양한 데이터를 참고합니다.
Lascia un Commento
Vuoi partecipare alla discussione?Sentitevi liberi di contribuire!