白話文解說向量資料庫(vector database)
覺得我們的內容實用嗎? MyApollo 電子報讀者募集中!歡迎訂閱電子報!
簡單 4 分鐘的影片科普向量資料庫。
向量資料庫是最近崛起的一種新型的資料庫,其崛起多半與 AI 產業興盛發展有關。原因在於無論是文字型、影像型的 AI, 幾乎都需要將訓練資料進行編碼,變成ㄧ筆筆的向量(vector 或稱 embedding),然後我們就能用一些演算法計算 2 筆資料間的相似度找到類似的文字、影像等等,但通常現代資料集都非常之大,很難在有限時間內計算全部資料,所以向量資料庫多了一層索引(index),藉由索引幫助我們可以更快找出相似的資料。
現在向量資料庫也應用在大語言模型(LLM), 語意搜尋(semantic search), 相似度搜尋(similarity search), 推薦系統(recommendation engine)等領域,如果你是 AI 或機器學習相關的工作者,可以花些時間認識一下向量資料庫。