Amo Chen

DBSCAN 分群演算法介紹與實際應用範例

以前在開發 Chrome 擴充 NimoTab 時,有 1 個功能需要將相似/相同的網頁標題分群在一起,例如下圖:

nimotab-clustering.png

當時用的是土炮的方法(但其實類似 DBSCAN),不過後來跟從事機器學習的同事討教有沒有更好的做法時,才知道有 1 個稱為 DBSCAN 的演算法可以使用。

本文將介紹 DBSCAN 這個實用的分群演算法,並以實際範例展示如何做到將相似的資料分群在一起,藉此讓大家對 DBSCAN 有更深入的理解。

Posted on  Sep 2, 2024  in  演算法  by  Amo Chen  ‐ 7 min read

Perplexity AI 搜尋服務的開源替代品 — Perplexica

Perplexity 是知名的 AI 搜尋服務,它的運作是整合來自各個搜尋引擎、網站等資料,用語言模型統合內容後產生 1 個答案給使用者。 相較於傳統搜尋引擎的搜尋結果需要

Posted on  Aug 27, 2024  by  Amo Chen  ‐ 1 min read

Raycast 所做的工具網站 — https://ray.so/

分享 macOS 上著名的生產力工具 Raycast 所做的工具網站。 https://ray.so/ 目前上面提供: Code Images,把程式碼轉成漂亮圖片 Icon Maker,做 icon 圖片的工具 Prompts,羅

Posted on  Aug 21, 2024  by  Amo Chen  ‐ 1 min read

用 Python 實作 Floyd-Warshall 演算法:從最短路徑到尋找最便宜機票

Floyd-Warshall 演算法,又稱佛洛伊德演算法,主要用於找出圖(graph)中所有頂點之間的最短路徑,它也能用來偵測圖中是否存在閉環(cycle)。

本文將使用 Python 學習 Floyd-Warshall 演算法,並且以找出城市與城市之間最便宜機票組合作為應用範例,讓讀者對 Floyd-Warshall 演算法有深入的了解。

Posted on  Aug 16, 2024  in  Python 程式設計 - 初階 , 演算法  by  Amo Chen  ‐ 4 min read

Python aiomultiprocess 套件是如何運作的?

aiomultiprocess 是 1 個既實用又有趣的套件。

它實用的地方在於能將多個 coroutines 分散到多個 processes 執行(底層使用 multiprocessing 模組),藉此提升 asyncio 的效能。

而有趣的地方在於 multiprocessing 並不是 1 個 asynchronous 模組,而 aiomultiprocess 卻能將 multiprocessing 與 asyncio 整合在一起 ,著實相當有趣!

如果沒有相當的程式設計功力,其實也難以想像 aiomultiprocess 底層是如何實作的。因此本文將研究 aiomultiprocess 套件如何運作,以及如何整合 asyncio 與 multiprocessing 兩個模組的方法,揭開它的神秘面紗!

Posted on  Jul 31, 2024  in  Python 程式設計 - 高階  by  Amo Chen  ‐ 5 min read