python

Data Scientist 不可不知的 csvkit

CSV 大概是目前最直覺方便的資料格式,除了可以用 Excel, OpenOffice , LibreOffice 等文書處理軟體編輯之外,也可以用程式語言進行處理與分析。不過有時候還是會需要在終端機(Terminal)上進行 CSV 的簡單操作,這時候就需要方便的工具來幫我們節省時間,在此推薦 csvkit 給大家!

以下節錄幾個 csvkit 支援的好用功能:

  • csv, dbf, fixed, geojson, json, ndjson, xls, xlsx 等資料格式的轉換(轉成 CSV)
  • CSV 檔案的 grep, sort, join 等
  • CSV 欄位的簡單統計

Posted on  May 14, 2016  in  Python 模組/套件推薦  by  Amo Chen  ‐ 3 min read

Python 測試資料產生模組 - Faker

Faker 是一個有趣的 Python 模組,蠻適合用來產生測試資料集的,包含常見的姓名、地址以及隨機文章段落都能夠產生,甚至還支援各種不同語系。若能夠掌握的話,對於測試資料集的產生可以說是相當方便。

Posted on  May 2, 2016  in  Python 模組/套件推薦  by  Amo Chen  ‐ 1 min read

Pytest 教學

建議本文的閱讀者可以先看過 Python unittest 了解基本觀念之後再閱讀本文。

俗話說的好:「不學測試,無以立。」想寫得一手好程式就從測試著手。

雖然 Python 內建 unittest,但畢竟還是有些許不便之處。基於不重新造輪的哲學,就來學一套坊間人人稱頌的pytest 吧!

Posted on  Mar 22, 2016  in  Python 程式設計 - 中階  by  Amo Chen  ‐ 4 min read

VIM, ctags, Python

如果你有以下 2 種煩惱不妨看看這篇文章:

  1. 在呼叫某個函數前,去看一下該函數的長什麼樣子,特別是自己寫的函數
  2. 希望更有效率的研究某個 Python 開放原始碼專案

本文將使用 VIM, ctags 來解決這 2 個煩惱。

Posted on  Mar 17, 2016  in  Vim , Python 程式設計 - 高階  by  Amo Chen  ‐ 1 min read

Django 除錯(debug)實用技巧

雖然目前 Django 1.9 (or later) 的除錯模式(debug mode)已經十分實用了,包含 exception, traceback, frame, code 都會清楚的顯示出來。但不見得每次都可以開啟除錯模式或者有最新版的 Django 可以使用,這時候還是有幾個實用的技巧能夠使用。

Posted on  Mar 15, 2016  in  Django  by  Amo Chen  ‐ 1 min read

Python 必備良藥 - virtualenv

virtualenv

現今大多數專案為了加速開發速度跟減少重複開發的成本,都不免會使用到其他方便的套件或模組,因此最好能夠對於模組的安裝與版本控管建立一套管理的機制。

所幸 Python 可以透過 virtualenv 與 pip 達到簡單的模組安裝與版本控管,提早養成此種好習慣的話,將可有效提高團隊合作開發能力,並且降低團隊成員各自開發環境相依模組版本不同可能帶來的影響,而且 virtualenv 可以有效隔離各自的開發環境,避免因為套件可能產生的衝突。

Posted on  Mar 10, 2016  in  Python 程式設計 - 初階  by  Amo Chen  ‐ 3 min read