Golang 內建 CSV 的檔案處理功能,本篇介紹 csv.Reader 及簡單的使用範例。

csv.Reader 是一個 struct ,裡面定義了 Comma , Comment , FieldsPerRecord , LazyQuotes , TrimLeadingSpace , ReuseRecord 等屬性(Golang 中稱為 fields)。其中常用屬性為 Comma ,也就是定義 CSV 的分隔符號(預設為逗號 , ),如果要讀取 TSV (以 tab 為分隔)可以更改這個屬性,例如以下範例程式,利用 csv.NewReader(strings.NewReader(in)) 取得 1 個 Reader 之後,再將 Comma 屬性更新為 \t 之後,最後透過 r.Read() 取得每列的 slice :

package main

import (
    "encoding/csv"
    "fmt"
    "io"
    "log"
    "strings"
)

func main() {
    in := "first_name\tlast_name\tusername"
    r := csv.NewReader(strings.NewReader(in))
    r.Comma = '\t'
    for {
        record, err := r.Read()
        if err == io.EOF {
            break
        }
        if err != nil {
            log.Fatal(err)
        }

        fmt.Println(record)
    }
}

執行結果:

[first_name last_name username]

csv.Reader 除了 Read 之外,還有 1 個 ReadAll 函式,差別在於 ReadAll 會一次讀完整個 CSV 資料,會同時回傳 [][]stringerror 結果,在 CSV 資料量很大的時候, ReadAll 很可能會一次消耗掉大量記憶體,必須注意。另外是, ReadAll 並不會將 io.EOF 視為 error 回傳。

A successful call returns err == nil, not err == io.EOF. Because ReadAll is defined to read until EOF, it does not treat end of file as an error to be reported.

以上就是 csv.Reader 的簡介。

References

https://golang.org/pkg/encoding/csv/