趣文分享 — 睡覺也能做好排序?
“Sleepsort: Sorting while sleeping” 是 1 篇很有趣的文章,內容是講 1 個稱為 Sleep Sort 的排序方法,沒看錯,就是 Sleep 。 Sleep Sort 據聞最早是 2011 年有人在 4Chan 提
Posted on May 6, 2024 by Amo Chen ‐ 1 min read
“Sleepsort: Sorting while sleeping” 是 1 篇很有趣的文章,內容是講 1 個稱為 Sleep Sort 的排序方法,沒看錯,就是 Sleep 。 Sleep Sort 據聞最早是 2011 年有人在 4Chan 提
Posted on May 6, 2024 by Amo Chen ‐ 1 min read
假設有以下字串: s = 'data1: {"title": "abc", "content": "123"}' 當我們想把字串切成 data1 與 {"title": "abc", "content": "123"} 2 個部分的話,多數人應該直覺會想到 s.split(': ')[0] 與 ': '.join(s.split(': ')[1:]) 這個簡單的方法。 但是上述解法有個問
Posted on May 5, 2024 by Amo Chen ‐ 1 min read
Python 的 Iterable, Iterator 與 Generator 是經常會讓人產生混淆的事物,因為這 3 個都可以用 for
迴圈走訪,因此有些熟悉 Python 的面試官很喜歡問這 3 者之間的差異,追根究底是因為對這 3 者不熟悉的話,很容易寫出類似以下的低效率程式碼:
set([x for x in iterator])
本文將透過實際範例帶大家認識 Iterable, Iterator 與 Generator! 再也不搞混!
Posted on May 3, 2024 in Python 程式設計 - 中階 by Amo Chen ‐ 4 min read
通常喜歡寫程式的人,多數都會覺得開發過程是愉悅的,而且也會認為寫測試是痛苦而且耗費時間的試煉,有時候測試做起來甚至需要耗費開發時間的 2 倍。 拜
Posted on May 2, 2024 by Amo Chen ‐ 1 min read
“I accidentally built a meme search engine” 分享如何做出以圖找圖的功能,作者拿來應用在用迷因圖去找類似的迷因圖,也有分享其 GitHub repository 給大家參考。 該文也是 1 個利用 OpenAI
Posted on May 1, 2024 by Amo Chen ‐ 1 min read
“Easy video transcription and subtitling with Whisper, FFmpeg, and Python” 1 文紀錄怎麼用 Python 自動幫影片上字幕的過程,流程相當簡單,而且不需要懂語音辨識、影片格式等知識,有需要的
Posted on Apr 30, 2024 by Amo Chen ‐ 1 min read
Python Django 是 1 套相當成熟的 Web Framework, 也是 Python 常年名列前茅的 Web 框架,儘管近年來 FastAPI 異軍突起,但 Django 仍在 Python 生態系中佔有相當重要的一席之地,不少知名公司也都還有使用
Posted on Apr 29, 2024 by Amo Chen ‐ 1 min read
BM25 是一個經典的數學公式,廣泛應用於評估文件與查詢字串之間的相關性,因此在某些搜索引擎的搜索結果排序中扮演重要角色。例如,Elasticsearch 就內建了使用 BM25 進行結果排序的功能。
此外,在 AI 領域,像是 RAG (Retrieval-Augmented Generation) 等應用,也實作使用 BM25 來檢索(retrieve)相關文件。
對 BM25 有所理解的話,將會對從事搜索相關工作的人有所裨益。
本文將以白話文說明搭配範例的方式,介紹 BM25 公式以及如何計算。
Posted on Apr 29, 2024 in 數學概念 by Amo Chen ‐ 5 min read