用白話文談數學公式 - BM25 (Best Matching 25)
BM25 是一個經典的數學公式,廣泛應用於評估文件與查詢字串之間的相關性,因此在某些搜索引擎的搜索結果排序中扮演重要角色。例如,Elasticsearch 就內建了使用 BM25 進行結果排序的功能。
此外,在 AI 領域,像是 RAG (Retrieval-Augmented Generation) 等應用,也實作使用 BM25 來檢索(retrieve)相關文件。
對 BM25 有所理解的話,將會對從事搜索相關工作的人有所裨益。
本文將以白話文說明搭配範例的方式,介紹 BM25 公式以及如何計算。
Posted on Apr 29, 2024 in 數學概念 by Amo Chen ‐ 5 min read