Pandas + AI = PandasAI

PandasAI 是整合著名的 Python 資料分析函式庫 pandas 與各種 LLM 的對話式 AI 工具(conversational AI tool)。

以往如果用 pandas 對資料進行分析需要熟知 Dataframe 與相關的方法(例如 filter, groupby, plot 等方法),但有了 LLM 的幫助之後,我們可以借助 AI 的推論與生成能力,將以往運用 pandas 做資料分析的流程變成典型的 AI agent 運作流程:

prompt/問題 -> LLM 推論分析步驟 -> 呼叫 pandas 相關方法 -> LLM 生成結果

也就是說,變成我們只需要輸入正確的 prompt 即可。

這就是 PandasAI 所提供的功能,因此以下程式碼是 PandasAI 目前的使用方式,先把 DataFrame 載入之後,再傳給 PandasAI 的 agent, 接著我們只要對 agent 輸入 prompt 即可,剩下的步驟就會交由 AI 執行直到最終生成回應:

df = pd.DataFrame(...略...)
agent = Agent(df)
agent.chat('Which are the top 5 countries by sales?')

這類資料分析工具無疑能夠降低學習成本與增加分析資料的效率,但缺點是我們看不到 AI 詳細運作過程,所以如果要驗證分析結果是否正確,最後還是得實際使用 pandas 或寫程式驗算一遍,但這點疑慮是源自於目前 AI 能力仍有極限,未來隨著 AI 發展持續進步,其產生的結果將會高度可信,市場大概率也會偏向採用這項工具。

另外,使用這類工具要特別注意與 AI 互動時,將機密資料外洩給 AI 服務提供商(例如 OpenAI )的問題,雖然 PandasAI 也針對這點做了一些防護(只送 Dataframe 中隨機的部分資料、敏感資料則隨機產生等等),但它畢竟還是送了⋯⋯。

如果對 PandasAI 有興趣的話,可以在 Colab 或者 Juypter Notebook 裝來玩看看,或者到它的 GitHub 研究看看原始碼也不錯。

PandasAI 官網

PandasAI GitHub Repo

FOLLOW US

對抗久坐職業傷害

研究指出每天增加 2 小時坐著的時間,會增加大腸癌、心臟疾病、肺癌的風險,也造成肩頸、腰背疼痛等常見問題。

然而對抗這些問題,卻只需要工作時定期休息跟伸展身體即可!

你想輕鬆改變現狀嗎?試試看我們的 PomodoRoll 番茄鐘吧! PomodoRoll 番茄鐘會根據你所設定的專注時間,定期建議你 1 項辦公族適用的伸展運動,幫助你打敗久坐所帶來的傷害!

贊助我們的創作

看完這篇文章了嗎? 休息一下,喝杯咖啡吧!

如果你覺得 MyApollo 有讓你獲得實用的資訊,希望能看到更多的技術分享,邀請你贊助我們一杯咖啡,讓我們有更多的動力與精力繼續提供高品質的文章,感謝你的支持!