Python 模組/套件推薦

Data Scientist 不可不知的 csvkit

CSV 大概是目前最直覺方便的資料格式,除了可以用 Excel, OpenOffice , LibreOffice 等文書處理軟體編輯之外,也可以用程式語言進行處理與分析。不過有時候還是會需要在終端機(Terminal)上進行 CSV 的簡單操作,這時候就需要方便的工具來幫我們節省時間,在此推薦 csvkit 給大家!

以下節錄幾個 csvkit 支援的好用功能:

  • csv, dbf, fixed, geojson, json, ndjson, xls, xlsx 等資料格式的轉換(轉成 CSV)
  • CSV 檔案的 grep, sort, join 等
  • CSV 欄位的簡單統計

Posted on  May 14, 2016  in  Python 模組/套件推薦  by  Amo Chen  ‐ 3 min read

Python 測試資料產生模組 - Faker

Faker 是一個有趣的 Python 模組,蠻適合用來產生測試資料集的,包含常見的姓名、地址以及隨機文章段落都能夠產生,甚至還支援各種不同語系。若能夠掌握的話,對於測試資料集的產生可以說是相當方便。

Posted on  May 2, 2016  in  Python 模組/套件推薦  by  Amo Chen  ‐ 1 min read