JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式,因为易读性、机器容易处理而变得流行。
JSON 语言定义的内容非常简洁,主要分为三种类型:对象(object)、数组(array)和基本类型(value)。基本类型(value)包括:
数组(array)就是方括号括 []
起来的任意值的序列,中间以逗号 ,
隔开。对象(object)是一系列无序的键值组合, 键必须是字符串
,键值对之间以逗号 ,
隔开,键和值以冒号 :
隔开。数组和对象中的值都可以是嵌套的。
JSON 官网 有非常易懂的图示,进一步了解可以移步。
JSON 不依赖于任何具体的语言,但是和大多数 C 家族的编程语言数据结构特别相似,所以 JSON 成了多语言之间数据交换的流行格式。Go 语言也不例外,标准库 encoding/json
就是专门处理 JSON 转换的。
这篇文章就专门介绍 Go 语言中怎么和 JSON 打交道,常用的模式以及需要注意的事项。
Golang 的 encoding/json
库已经提供了很好的封装,可以让我们很方便地进行 JSON 数据的转换。
Go 语言中数据结构和 JSON 类型的对应关系如下表:
golang 类型 | JSON 类型 | 注意事项 |
---|---|---|
bool | JSON booleans | |
浮点数、整数 | JSON numbers | |
字符串 | JSON strings | 字符串会转换成 UTF-8 进行输出,无法转换的会打印对应的 unicode 值。而且为了防止浏览器把 json 输出当做 html, “<”、”>” 以及 “&” 会被转义为 “/u003c”、”/u003e” 和 “/u0026”。 |
array,slice | JSON arrays | []byte 会被转换为 base64 字符串,nil slice 会被转换为 JSON null |
struct | JSON objects | 只有导出的字段(以大写字母开头)才会在输出中 |
NOTE:Go 语言中一些特殊的类型,比如 Channel、complex、function 是不能被解析成 JSON 的。
要把 golang 的数据结构转换成 JSON 字符串(encode),可以使用 Marshal
函数:
func Marshal(v interface{}) ([]byte, error)
比如我们有结构体 User
type User struct { Name string IsAdmin bool Followers uint }
以及一个实例:
user := User{ Name: "cizixs", IsAdmin: true, Followers: 36, } data, err := json.Marshal(user)
那么 data 就是 []byte
类型的数组,里面包含了解析为 JSON 之后的数据:
data == []byte(`{"Name":"cizixs","IsAdmin":true,"Followers":36}`)
相对应的,要把 JSON 数据转换成 Go 类型的值(Decode), 可以使用 json.Unmarshal
。它的定义是这样的:
func Unmarshal(data []byte, v interface{}) error
data 中存放的是 JSON 值,v 会存放解析后的数据,所以必须是指针,可以保证函数中做的修改能保存下来。
下面看个例子:
data = []byte(`{"Name":"gopher","IsAdmin":false,"Followers":8900}`) var newUser = new(User) err = json.Unmarshal(data, &newUser) if err != nil { fmt.Errorf("Can not decode data: %v/n", err) } fmt.Printf("%v/n", newUser)
那么 Unmarshal
是怎么找到结构体中对应的值呢?比如给定一个 JSON key Filed
,它是这样查找的:
Field
的字段 Field
的字段 FiElD
等大小写不敏感的匹配字段。 在定义 struct 字段的时候,可以在字段后面添加 tag,来控制 encode/decode 的过程:是否要 decode/encode 某个字段,JSON 中的字段名称是什么。
可以选择的控制字段有三种:
-
:不要解析这个字段 omitempty
:当字段为空(默认值)时,不要解析这个字段。比如 false、0、nil、长度为 0 的 array,map,slice,string FieldName
:当解析 json 的时候,使用这个名字 举例来说吧:
// 解析的时候忽略该字段。默认情况下会解析这个字段,因为它是大写字母开头的 Field int `json:"-"` // 解析(encode/decode) 的时候,使用 `other_name`,而不是 `Field` Field int `json:"other_name"` // 解析的时候使用 `other_name`,如果struct 中这个值为空,就忽略它 Field int `json:"other_name,omitempty"`
上面的解析过程有一个假设——你要事先知道要解析的 JSON 内容格式,然后定义好对应的数据结构。如果你不知道要解析的内容呢? Go 提供了 interface{}
的格式,这个接口没有限定任何的方法,因此所有的类型都是满足这个接口的。在解析 JSON 的时候,任意动态的内容都可以解析成 interface{}
。
比如还是上面的数据,我们可以这样做:
data := []byte(`{"Name":"cizixs","IsAdmin":true,"Followers":36}`) var f interface{} json.Unmarshal(data, &f)
但是要使用 f
,还是很麻烦的,我们要使用 type assertion
:
name := f.(map[string]interface{})["Name"].(string)
对于比较复杂的结构,这样的访问很麻烦,也很容易出错。
如果已经知道 JSON 数据是对象,而不是基本类型(bool,number,string,array)等,因为 JSON 对象键都是字符串,所以可以把上面的例子修改为:
var f map[string]interface{} // 省去了上面 f 的 type assertion 步骤 name := f["Name"].(string)
需要注意的是,尽管 Followers
字段没有小数点,我们希望它是整数值,解析的时候它还是会被解析成 float64
,如果直接把它当做 int
访问,会出现错误:
followers := f["Followers"].(int) // panic: interface conversion: interface is float64, not int
而必须自己做类型转换:
followers := int(f["Followers"].(float64))
在解析的时候,还可以把某部分先保留为 JSON 数据不要解析,等到后面得到更多信息的时候再去解析。继续拿 User
举例,比如我们要添加认证的信息,认证可以是用户名和密码,也可以是 token 认证。
type BasicAuth struct { Email string Password string } type TokenAuth struct { Token string } type User struct { Name string IsAdmin bool Followers uint Auth json.RawMessage }
我们在定义 User
结构体的时候,把认证字段的类型定义为 json.RawMessage
,这样解析 JSON 数据的时候,对应的字段会先不急着转换成 Go 数据结构。然后我们可以自己去再次调用 Unmarshal
去读取里面的值:
err := json.Unmarshal(data, &basicAuth) if basicAuth.Email != "" { // 这是用户名/密码认证方式,在这里继续做一些处理 } else { json.Unmarshal(data, &tokenAuth) if tokenAuth.Token != "" { // 这是 token 认证方法 } }
如果希望自己控制怎么解析成 JSON,或者把 JSON 解析成自定义的类型,只需要实现对应的接口(interface)。 encoding/json
提供了两个接口: Marshaler
和 Unmarshaler
:
// Marshaler 接口定义了怎么把某个类型 encode 成 JSON 数据 type Marshaler interface { MarshalJSON() ([]byte, error) } // Unmarshaler 接口定义了怎么把 JSON 数据 decode 成特定的类型数据。如果后续还要使用 JSON 数据,必须把数据拷贝一份 type Unmarshaler interface { UnmarshalJSON([]byte) error }
标准库
time.Time
就实现了这两个接口。另外一个简单的例子(这个例子来自于参考资料中 Go and JSON 文章):
type Month struct { MonthNumber int YearNumber int } func (m Month) MarshalJSON() ([]byte, error){ return []byte(fmt.Sprintf("%d/%d", m.MonthNumber, m.YearNumber)), nil } func (m *Month) UnmarshalJSON(value []byte) error { parts := strings.Split(string(value), "/") m.MonthNumber = strconv.ParseInt(parts[0], 10, 32) m.YearNumber = strconv.ParseInt(parts[1], 10, 32) return nil }
上面所有的 JSON 数据来源都是预先定义的 []byte
缓存,在很多时候,如果能读取/写入其他地方的数据就好了。 encoding/json
库中有两个专门处理这个事情的结构: Decoder
和 Encoder
:
// Decoder 从 r io.Reader 中读取数据,`Decode(v interface{})` 方法把数据转换成对应的数据结构 func NewDecoder(r io.Reader) *Decoder // Encoder 的 `Encode(v interface{})` 把数据结构转换成对应的 JSON 数据,然后写入到 w io.Writer 中 func NewEncoder(w io.Writer) *Encoder
下面的例子就是从标准输入流中读取数据,解析成数据结构,删除所有键不是 Name
的字段,然后再 encode 成 JSON 数据,打印到标准输出。
package main import ( "encoding/json" "log" "os" ) func main() { dec := json.NewDecoder(os.Stdin) enc := json.NewEncoder(os.Stdout) for { var v map[string]interface{} if err := dec.Decode(&v); err != nil { log.Println(err) return } for k := range v { if k != "Name" { delete(v, k) } } if err := enc.Encode(&v); err != nil { log.Println(err) } } }