60 秒新知

好影片推薦 — Let's build the GPT Tokenizer

“Let’s build the GPT Tokenizer” 是由前特斯拉 AI 部門高級總監 Andrej Karpathy 所錄製,全長 2 小時多,教你從頭到尾認識 GPT Tokenizer 的運作原理與實作,

Posted on  Mar 19, 2024  by  Amo Chen  ‐ 1 min read

工具分享 — Tiktokenizer

自然語言處理(NLP, Natural Language Processing)與機器學習(machine learning)的相關技術中,有 1 個稱為 Tokenization (或稱斷詞)。該技術是

Posted on  Mar 18, 2024  by  Amo Chen  ‐ 1 min read

好文分享 — Roadmap to Learn AI in 2024

“Roadmap to Learn AI in 2024” 1 文彙整學習人工智能與機器學習可以從哪些人、書、論文、電子報等資源著手,整理的相當完整,如果你對人工智能與

Posted on  Mar 17, 2024  by  Amo Chen  ‐ 1 min read

好文分享 — Popular git config options

俗話說的好,工欲善其事,必先利其器! 特別是每天工作在用的 git, 絕對要調整幾個能讓自己工作更順手的設定! “Popular git config options” 1 文分

Posted on  Mar 16, 2024  by  Amo Chen  ‐ 1 min read

開源 embedding 資料庫 — chroma

Embedding 資料庫,顧名思義是專門儲存/檢索 embedding 的資料庫,其實也是一種向量資料庫(vector database)。 Embedding 資料庫對於以語言模型為核心的 RAG(Retrieval-Augmented Generation) 應用

Posted on  Mar 13, 2024  by  Amo Chen  ‐ 1 min read

好文分享 — 80 行程式碼做出 1 個搜尋引擎

“A search engine in 80 lines of Python” 1 文分享怎麼用 80 行的 Python 程式碼做出搜尋引擎(含簡單的前端介面)。 其實搜尋在 AI 時代還是扮演很重要的角色,有時候我直

Posted on  Mar 12, 2024  by  Amo Chen  ‐ 2 min read