转眼加入蚂蚁已经三个多月,这期间主要维护一 Go 写的服务器。虽然用的时间不算长,但还是积累了一些心得体会,这里总结归纳一下,供想尝试 Go 的同学参考。 本文会依次介绍 Go 的设计理念、开发环境、语言特性。本文在谈及语言特性的时也会讨论一些 Go 的不足之处,旨在给读者提供一个全面的视角。
简介
一般来说,编程语言都会有一个 slogan 来表示它们的特点。比如提到 Clojure,一般会想到这么几个词汇:lisp on JVM、immutable、persistent;Java 的话我能想到的是企业级开发、中规中矩。对于 Go ,官网介绍到:
Go is an open source programming language that makes it easy to build simple, reliable, and efficient software.
提取几个关键词:open(开放)、simple(简洁)、reliable(可靠)、efficient(高效)。这也可以说是它的设计目标。除了上面这些口号外,初学者还需要知道 Go 是一门命令式的静态语言(是指在编译时检查变量类型是否匹配),与 Java 属于同一类别。
Imperative | Functional | |
---|---|---|
Dynamic | Python/Ruby/Javascript | Lisp/Scheme/Clojure |
Static | Java/C++/Rust/Go | OCaml/Scala/Haskell |
由于 Hello World 太简洁,不具备展示 Go 的特点,所以下面展示一段访问 httpbin,打印 response 的完整代码。
|
|
上面的代码片段包括了 Go 的主要组成:包的声明与引用、函数定义、错误处理、流程控制、defer。
开发环境
通过上面的代码片段,可以看出 Go 语言 simple(简洁)的特点,所以找一个最熟悉的文本编辑器,一般通过配置插件,都可以达到快速开发的目的。很久之前我就已经把所有文本编辑放到 Emacs 上,这里介绍下我的配置。
除了 go-mode 这个 major mode,为了配置像 源码跳转、API 自动补全、查看函数文档等现代 IDE 必备功能,需要安装以下命令
|
|
然后再按照 setup-go.el 里的配置,就拥有了一个功能完备的开发环境。
不像 Java 语言需要运行时,Go 支持直接将整个项目 build 成一个二进制文件,方便部署,而支持交叉编译,不过在开发时,直接 go run XXX.go
更为便利,截止到 Go 1.12,还不支持 REPL,官方有提供在线版的 Playground 供分享、调试代码。
我个人的习惯是建一个 go-app 项目,每个要测试的逻辑放到一个 test 里面去,这样就可以使用 go test -v -run XXX
来运行。之所以不选用 go run
,是因为一个目录下只允许有一个 main 的 package,多个 IDE 会提示错误。
数据类型
一般编程语言,数据类型分为基本的与复杂的两类。 基本的一般比较简单,表示一个值,Go 里面就有 string, bool, int8, int32(rune), int64, float32, float64, byte(uint8) 等基本类型 复杂类型一般表示多个值或具有某些高级用法,Go 里面有:
- pointer Go 里只支持取地址
&
与间接访问*
操作符,不支持对指针进行算术操作 - struct 类似于 C 语言里面的 struct,Java 里面的对象
- function 函数在 Go 里是一等成员
- array 大小固定的数组
- slice 动态的数组
- map 哈希表
- chan 用于在多个 goroutine 内通信
- interface 类似于 Java 里面的接口,一组方法的封装
下面将重点介绍 Go 里特有或用途最广的数据类型。
struct/interface
Go 里面的 struct 类似于 Java 里面的 Object,但是并没有继承,仅仅是对数据的一层包装(抽象)。相对于其他复杂类型,struct 是值类型,也就是说作为函数参数或返回值时,会拷贝一份值。 一般来说,值类型分配在 stack 上,与之相对的引用类型,分配在 heap 上。 初学者一般会有这样的误区,认为传值比传引用要慢,实则不然,具体涉及到 Go 如何管理内存,这里暂不详述,感兴趣到可以阅读:
BenchmarkByPointer-8 20000000 86.7 ns/op
BenchmarkByValue-8 50000000 31.9 ns/op
所以一般情况下推荐直接使用值类型的 struct,如果需要改变状态,再考虑改为指针类型(&struct)
如果说 struct 是对状态的封装,那么 interface 就是对行为的封装,相当于对外的契约(contract)。而且 Go 里面有这么一条最佳实践
Accept interfaces, return concrete structs. (函数的参数尽量为 interface,返回值为 struct)
这样的好处也很明显,作为类库的设计者,对其要求的参数尽量宽松,方便使用,返回具体值方便后续的操作处理。一个极端的情况,可以用 interface{}
表示任意类型的参数,因为这个接口里面没有任何行为,所以所有类型都是符合的。又由于 Go 里面不支持范型,所以interface{}
是唯一的解决手段。
相比较 Java 这类面向对象的语言,接口需要显式(explicit)继承(使用 implements 关键字),而在 Go 里面是隐式的(implicit),新手往往需要一段时间来体会这一做法的巧妙,这里举一例子来说明:
Go 的 IO 操作涉及到两个基础类型:Writer/Reader ,其定义如下:
|
|
自定义类型如果实现了这两个方法,那么就实现了这两个接口,下面的 Example 就是这么一个例子:
|
|
由于隐式继承过于灵活,在 Go 里面可能会看到如下代码:
|
|
这是通过将 nil 强转为 *CachingFetcher
,然后在赋值时,指定 blob.Fetcher
类型,保证 *CachingFetcher
实现了 blob.Fetcher
接口。
作为接口的设计者,如果想实现者显式继承一个接口,可以在接口中额外加一个方法。比如:
|
|
这样,实现者必须实现 ImplementsFooer
方法才能说是继承了 Fooer
接口。所以说隐式继承有利有弊,需要开发者自己去把握。
map/slice
Map/Slice 是 Go 里面最常用的两类数据结构,属于引用类型。在语言 runtime 层面实现,仅有的两个支持范型的结构。 Slice 是长度不固定的数组,类似于 Java 里面的 List。
|
|
chan/goroutine
作为一门新语言,Goroutine 是 Go 借鉴 CSP 模型提供的并发解决方案,相比传统 OS 级别的线程,它有以下特点:
- 轻量,完全在用户态调度(不涉及OS状态直接的转化)
- 资源占用少,启动快
- 目前,Goroutine 调度器不保证公平(fairness),抢占(pre-emption)也支持的非常有限,一个空的
for{}
可能会一直不被调度出去。
一般可以使用 chan/select 来进行 Goroutine 之间的调度。chan 类似于 Java 里面的 BlockingQueue,且能保证 Goroutine-safe,也就是说多个 Goroutine 并发进行读写是安全的。
chan 里面的元素默认为1个,也可以在创建时指定缓冲区大小,读写支持堵塞、非堵塞两种模式,关闭一个 chan 后,再写数据时会 panic。
|
|
chan 作为 Go 内一重要数据类型,看似简单,实则暗藏玄妙,用时需要多加留意,这里不再展开叙述,后面打算专门写一篇文章去介绍,感兴趣的可以阅读下面的文章:
- Curious Channels
- Prosumer 基于 buffered chan 实现的生产者消费者,核心点在于关闭 chan 只意味着生产者不能再发送数据,消费者无法获知 chan 是否已经关闭,需要用其他方式去通信。
语言特性
Go 相比 Java 来说,语言特性真的是少太多。推荐 Learn X in Y minutes 这个网站,快速浏览一遍即可掌握 Go 的语法。Go 的简洁程度觉得和 JavaScript 差不多,但却是一门静态语言,具有强类型,这两点又让它区别于一般的脚本语言。
代码风格
Go 遵循约定大于配置(convention over configuratio)的设计理念,比如在构建一个项目时,直接 go build
一个命令就搞定了,不需要什么 Makefile、pom.xml 等配置文件。下面介绍几个常用的约定:
- 一个包内函数、变量的可见性是通过首字母大小写确定的。大写表示可见。
- 一般
{
放在行末,否则 Go 编辑器会自动插入一个逗号,导致编译错误 - 一个文件夹内,只能定义一个包
- 变量、函数命名尽量简短,标准库里面经常可以看到一个字母的变量
由于以上种种约定,在看别人代码时很舒服,有种 Python 的感觉。另外建议在编辑器中配置 goimports 来自动化格式代码。
错误处理
Go 内没有 try catch 机制,而且已经明确拒绝了这个 Proposal,而是通过返回值的方式来处理。
|
|
Go 的函数一般通过返回多值的方式来传递 error(且一般是第二个位置),实际项目中一般使用 pkg/errors 去处理、包装 err。
依赖管理
Go 的依赖管理,相比其他语言较弱。
在 Go 1.11 正式引入的 modules 之前,项目必须放在 $GOPATH/src/xxx.com/username/project 内,这样 Go 才能去正确解析项目依赖,而且 Go 社区没有统一的包托管平台,不像 Java 中 maven 一样有中央仓库的概念,而是直接引用 Git 的库地址,所以在 Go 里,一般会使用 github.com/username/package
的方式来表示。
go get
是下载依赖的命令,但一个个去 get 库不仅仅繁碎,而且无法固化依赖版本信息,所以 dep 应运而生,添加新依赖后,直接运行 dep ensure
就可以全部下下来,而且会把当前依赖的 commit id 记录到 Gopkg.lock 里面,这就能解决版本不固定的问题。
但 modules 才是正路,且在 1.13 版本会默认开启,所以这里只介绍它的用法。
|
|
更多用法可以参考官方示例,这里只是想说明 go tools 大部分已经支持,但是 godoc 还不支持,更多可参考 #24661。
GC
Go 也是具有垃圾回收的语言,但相比于 JVM,Go GC 可能显得及其简单,从 Go 1.10 开始,Go GC 采用 Concurrent Mark & Sweep (CMS) 算法,且不具有分代、compact 特性。读者如果对相关名词不熟悉,可以阅读:
而且 Go 里面调整 GC 的参数只有一个 GOGC
,表示下面的比率
新分配对象 / 上次 GC 后剩余对象
默认 100,表示新分配对象达到上次 GC 后剩余对象的两倍时,进行 GC。
- 调大 GOGC,可以减少 GC 的总体耗时
- 减小 GOGC,意味着用更多的 GC 来换取更少的内存使用
GOGC=off
可以关闭 GC,SetGCPercent 可以动态修改这个比率。
在启动一个 Go 程序时,可以设置 GODEBUG=gctrace=1
来打印 GC 日志,日志具体含义可参考 pkg/runtime,这里不再赘述。对调试感兴趣的可以阅读:
总结
Go 最初由 Google 在 2007 为解决软件复杂度、提升开发效率的一试验品,到如今不过十二年,但无疑已经家喻户晓,成为云时代的首选。其面向接口的特有编程方式,也非常灵活,兼具动态语言的简洁与静态语言的高效,推荐大家尝试一下。Go Go Go!