Go语言中的字符串处理

幸运草
幸运草
幸运草
896
文章
3
评论
2020年4月15日20:58:40 评论 168

1 概述

字符串,string,一串固定长度的字符连接起来的字符集合。Go语言的字符串是使用UTF-8编码的。UTF-8是Unicode的实现方式之一。

Go语言原生支持字符串。使用双引号(“”)或反引号(``)定义。
双引号:””, 用于单行字符串。
反引号:``,用于定义多行字符串,内部会原样解析。
示例:

// 单行
"心有猛虎,细嗅蔷薇"
// 多行
`
大风歌
大风起兮云飞扬。
威加海内兮归故乡。
安得猛士兮守四方!
`

字符串支持转义字符,列表如下:

  • r  回车符(返回行首)
  • n  换行符(直接跳到下一行的同列位置)
  • t  制表符
  • ’  单引号
  • ”  双引号
  • \  反斜杠
  • uXXXX  Unicode字符码值转义,例如 "u5eb7" 就是 “康”

Go语言中字符串的顶层结构是由一个指针和长度构成的。使用 unsafe.Sizeof(“”) 会得到16长度,其中8个字节是指针,指向字符串的内存地址,8个是存储字符串的长度。

2 常规操作

以下是针对字符串的操作总结,主要来自于Go语言的API的说明和测试。

[]索引访问

可以使用[index]方式,访问到字符串中的字符。可以访问,不可以修改。

s := "Hank"
fmt.Printf("%c", s[2])
// 返回 n

unicode/utf8 包

多字节字符的处理,请参考 unicode/utf8 包的相关说明。
例如:

import "unicode/utf8"
utf8.RuneCountInString("小韩说课")
// 返回 4

len(),字符串占用的字节数

utf-8 是变长字符集,英文标点占用1个字节,中文占用3个字节。

len("Hank康") 
// 返回 7

+,字符串连接”

"Hello" + " " + "Hank"

==, >, <

字符串比较,比较机制是字符的对称比较。

"abc" > "bbcd"
// 结果为false

strings.Compare(a, b string) int

字符串比较,比较机制是字符的对称比较。返回值为:

  • 0,表示a == b
  • -1,表示a < b
  • 1,表示a > b
strings.Compare("abc", "aacd")
// 返回 1

strings.Contains(s, substr string) bool

检测字符串 substr 是否在 s 中。

strings.Contains("foobar", "foo")
// 返回 true
strings.Contains("fobar", "foo")
// 返回 false

strings.ContainsAny(s, chars string) bool

检测字符串 chars 的中任意字符是否出现在 s 中。

fmt.Println(strings.ContainsAny("Hank", "kang")) 
// 返回 true
fmt.Println(strings.ContainsAny("Hank", "go")) 
// 返回 false

strings.ContainsRune(s string, r rune) bool

检测 rune字符是否出现在 s 中。

strings.ContainsRune("Hank", 'a')
// 返回 true
strings.ContainsRune("Hank", 97)
// 返回 true,a的码值97

strings.Count(s, substr string) int

统计字符串 s 中非重叠substr的数量。若统计空字符串””,会返回 s 的长度加1。

strings.Count("HanZhongKang", "n")
// 返回 3
strings.Count("Hank", "")
// 返回 5,"Hank"每个rune的前后都算

strings.EqualFold(s, t string) bool

检测字符串 s 和 t 在忽略大小写的情况下是否相等。

strings.EqualFold("Hank", "hank")
// 返回 true

strings.Fields(s string) []string

返回使用空格分割的字符串 s,结果为切片。

strings.Fields("Han Zhong Kang")
// 返回 []string, ["Han", "Zhong", "Kang"]

strings.FieldsFunc(s string, f func(rune) bool) []string

使用函数确定分隔符,来分割字符串 s。结果是切片。

// ,|/ 都是分隔符
fn := func(c rune) bool {
    return strings.ContainsRune(",|/", c)
}
strings.FieldsFunc("go,python,c++/c,Js|JavaScript", fn)
// 返回 ["go" "python" "c++" "c" "Js" "JavaScript"]

strings.HasPrefix(s, prefix string) bool

检测字符串 s 是否以字符串 prefix 作为前缀。

strings.HasPrefix("Gopher", "Go")
// 返回 true

strings.HasSuffix(s, suffix string) bool

检测字符串 s 是否以字符串 suffix 作为后缀。

strings.HasSuffix("Gopher", "er")
// 返回 true

strings.Index(s, substr string) int

返回字符串 substr 在字符串 s 中第一次出现的索引位置,若没有出现,返回-1。

strings.Index("Gopher", "ph")
// 返回 2

strings.IndexAny(s, chars string) int

返回字符串 chars 中的任意字符在字符串 s 中第一次出现的索引位置,若没有出现,返回-1。

strings.IndexAny("Gopher", "lmno")
// 返回 1

strings.IndexByte(s string, c byte) int

返回byte字符 c 在字符串 s 中第一次出现的索引位置,若没有出现,返回-1。

strings.IndexByte("Gopher", 'h')
// 返回 3

strings.IndexFunc(s string, f func(rune) bool) int

返回字符串 s 中第一次满足函数 f 的rune字符的索引位置,若没有出现,返回-1。

fn := func(c rune) bool {
    return strings.ContainsRune(",|/", c)
}
strings.IndexFunc("go,python,c++/c,Js|JavaScript", fn)
// 返回 2

strings.IndexRune(s string, r rune) int

返回run字符 r 在字符串 s 中第一次出现的索引位置,若没有出现,返回-1。

strings.IndexRune("小韩说课", '说')
// 返回 6

strings.Join(a []string, sep string) string

使用分隔符 sep 连接字符串切片 a。

ss := []string{"Go", "Hank", "Python", "PHP"}
strings.Join(ss, "-")
// 返回 "Go-Hank-Python-PHP"

strings.LastIndex(s, substr string) int

返回字符串 substr 在字符串 s 中最后一次出现的索引位置,若没有出现,返回-1。

strings.LastIndex("Hankang", "an")
// 返回 4

strings.LastIndexAny(s, chars string) int

返回字符串 chars 中的任意字符在字符串 s 中最后一次出现的索引位置,若没有出现,返回-1。

strings.LastIndexAny("Hankang", "lmno")
// 返回 5

strings.LastIndexByte(s string, c byte) int

返回byte字符 c 在字符串 s 中最后一次出现的索引位置,若没有出现,返回-1。

strings.LastIndexByte("Hankang", 'n')
// 返回 5

strings.LastIndexFunc(s string, f func(rune) bool) int

返回字符串 s 中字后一次满足函数 f 的rune字符的索引位置,若没有出现,返回-1。

fn := func(c rune) bool {
    return strings.ContainsRune(",|/", c)
}
strings.LastIndexFunc("go,Js|JavaScript", fn)
// 返回 5

strings.Map(mapping func(rune) rune, s string) string

返回字符串 s 中的每个字符经过映射函数 mapping 处理之后的字符串。

fn := func(c rune) rune {
    if strings.ContainsRune(",|/", c) {
        return '-'
    } else {
        return c
    }
}
strings.Map(fn, "go,Js|JavaScript")
// 返回 "go-Js-JavaScript"

strings.Repeat(s string, count int) string

返回将字符串 s 重复 count 的字符串。

strings.Repeat("la~", 3)
// 返回值 "la~la~la~"

strings.Replace(s, old, new string, n int) string

在字符串 s 中使用字符串 new 替换字符串 old,使用 n 限定替换次数,n设置为负数表示没有限制。返回替换结果。

strings.Replace("han zhong kang", "n", "N", 2)
// 返回 "haN zhoNg kang"

strings.Split(s, sep string) []string

使用分隔符 sep 分割字符串 s,返回字符串切片

strings.Split("go-Js-JavaScript", "-")
// 返回 ["go", "Js", "JavaScript"]

strings.SplitAfter(s, sep string) []string

在分隔符 sep 后分割字符串 s,返回字符串切片

strings.SplitAfter("go-Js-JavaScript", "-")
// 返回 ["go-", "Js-", "JavaScript"]

strings.SplitAfterN(s, sep string, n int) []string

在分隔符 sep 后分割字符串 s,使用 n 限定分割的元素数量,n<0全部子字符串,n>0最后一个子字符串包含余下内容,n==0返回nil。返回子字符串切片。

strings.SplitAfterN("go-Js-JavaScript", "-", 2)
// 返回 ["go-", "Js-JavaScript"]

strings.SplitN(s, sep string, n int) []string

在分隔符 sep 分割字符串 s,使用 n 限定分割的元素数量,n<0全部子字符串,n>0最后一个子字符串包含余下内容,n==0返回nil。返回子字符串切片。

strings.SplitN("go-Js-JavaScript", "-", 2)
// 返回 ["go", "Js-JavaScript"]

strings.Title(s string) string

返回Title化的字符串。

strings.Title("hello Hank's go")
// 返回 "Hello Hank's Go"

strings.ToLower(s string) string

转换字符串 s 到小写。

strings.ToLower("Hank's Go Guide")
// 返回 "hank's go guide"

strings.ToLowerSpecial(c unicode.SpecialCase, s string) string

使用特定的规则转换字符串 s 到小写。

strings.ToLowerSpecial(unicode.TurkishCase, "Önnek İş")
// 返回 önnek iş

strings.ToTitle(s string) string

返回全部字符都Title化的字符串。

strings.Title("hello Hank's go")
// 返回 "HELLO HANK'S GO"

strings.ToTitleSpecial(c unicode.SpecialCase, s string) string

使用特定的规则将全部字符都Title化。

strings.ToTitleSpecial(unicode.TurkishCase, "dünyanın ilk borsa yapısı Aizonai kabul edilir")
// 返回 "DÜNYANIN İLK BORSA YAPISI AİZONAİ KABUL EDİLİR"

strings.ToUpper(s string) string

将字符串 s 中所有字符转换为大写。

strings.ToUpper("hello Hank's go")
// 返回 "HELLO HANK'S GO"

strings.ToUpperSpecial(c unicode.SpecialCase, s string) string

使用特定的规则将字符串 s 中所有字符转换为大写。

strings.ToUpperSpecial(unicode.TurkishCase, "örnek iş")
// 返回 "ÖRNEK İŞ"

strings.Trim(s string, cutset string) string

截取字符串 s 两端包裹的特定字符集 cutset。

strings.Trim("  user name       ", " ")
// 返回 "user name"

strings.TrimFunc(s string, f func(rune) bool) string

截取字符串 s 两端满足函数 f 的字符。

fn := func(c rune) bool {
    return strings.ContainsRune(",|/", c)
}
strings.TrimFunc("|/user name,/", fn)
// 返回 "user name"

strings.TrimLeft(s string, cutset string) string

截取字符串 s 左边包裹的特定字符集 cutset。

strings.TrimLeft("  user name       ", " ")
// 返回 "user name       "

strings.TrimLeftFunc(s string, f func(rune) bool) string

截取字符串 s 左边满足函数 f 的字符。

fn := func(c rune) bool {
    return strings.ContainsRune(",|/", c)
}
strings.TrimLeftFunc("|/user name,/", fn)
// 返回 "user name,/"

strings.TrimPrefix(s, prefix string) string

截取字符串 s 的前缀 prefix。

strings.TrimPrefix("hank_goGuide", "hank_")
// 返回 "goGuide"

strings.TrimRight(s string, cutset string) string

截取字符串 s 右边包裹的特定字符集 cutset。

strings.TrimRight("  user name       ", " ")
// 返回 "  user name"

strings.TrimRightFunc(s string, f func(rune) bool) string

截取字符串 s 右边满足函数 f 的字符。

fn := func(c rune) bool {
    return strings.ContainsRune(",|/", c)
}
strings.TrimRightFunc("|/user name,/", fn)
// 返回 "|/user name"

strings.TrimSpace(s string) string

截取字符串 s 两端的空白字符。

strings.TrimSpace(" tn Hello, Gophers ntrn")
// 返回 "Hello, Gophers"

strings.TrimSuffix(s, suffix string) string

截取字符串 s 的后缀 suffix。

strings.TrimSuffix("goGuide_beta", "_beta")
// 返回 "goGuide"

完!

特别声明:以上文章内容仅代表作者本人观点,不代表变化吧观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与变化吧联系。

转载请注明:{{title}}-变化吧
  • 赞助本站
  • 微信扫一扫
  • weinxin
  • 赞助本站
  • 支付宝扫一扫
  • weinxin
幸运草
Go语言接口规则 前端框架

Go语言接口规则

Go语言接口规则 接口是一个或多个方法签名的集合。任何类型的方法集中只要拥有该接口对应的全部方法签名。就表示它 "实现" 了该接口,无须在该类型上显式声明实现了哪个接口。对应方法,是指有相同名称、参数列表 (不包括参数名) 以及返回值,该类型也可以有其他方法。 接口赋值 对象赋值给接口时,会发生拷贝,而接口内部存储的是指向这个复制品的指针,既无法修改复制品的状态,也无法获取指针。 package main import "fmt" type User struct {     id   int     name string } func main() {     u := User{18, "oldboy"}     var i interface{} = u     u.id = 20     u.name = "Golang"     fmt.Printf("u : %vn", u)     fmt.Printf("i.(User) : %vn", i.(User)) } 运行结果: u : {20 Golang} i.(User) : {18 oldboy} 接口转型返回临时对象,只有使用指针才能修改其状态。 package main import "fmt" type User struct {     id   int     name string } func main() {     u := User{18, "oldboy"}     var vi, pi interface{} = u, &u     // vi.(User).name = "Golang"     pi.(*User).name = "Golang"     fmt.Printf("vi.(User) : %vn", vi.(User))     fmt.Printf("pi.(*User) : %vn", pi.(*User)) } 空接口 只有当接口存储的类型和对象都为nil时,接口才等于nil。 package main import (     "fmt" ) func main() {     var i interface{}     fmt.Printf("i => %vn", i)     fmt.Printf("(i == nil) => %vn", i == nil)     var p *int = nil     // i 指向 p,指向的对象是个nil,但是存在类型不是nil,是个指针     i = p     fmt.Printf("i => %vn", i)     fmt.Printf("(i == nil) => %vn", i == nil) } 运行结果: i => <nil> (i == nil) => true i => <nil> (i == nil) => false 接口实现 接口只有方法声明,没有数据字段,没有实现,也不需要显示的实现。只要一个变量,含有接口类型中的所有方法,那么这个变量就实现这个接口。 package main import (     "fmt" ) type Info interface {     GetAge() int     GetName() string } type User struct {     name string     age  int } func (u User) GetAge() int {     return u.age } func (u User) GetName() string {     return u.name } func main() {     var user Info = User{"oldboy", 18}     age := user.GetAge()     name := user.GetName()     fmt.Println(age, name) } 如果一个变量含有了多个interface类型的方法,那么这个变量就实现了多个接口。 package main import (     "fmt" ) type Age interface {     GetAge() int } type Name interface {     GetName() int } type User struct {     name string...
Go语言中处理 HTTP 服务器 前端框架

Go语言中处理 HTTP 服务器

1 概述 包 net/http 提供了HTTP服务器端和客户端的实现。本文说明关于服务器端的部分。 快速开始: package main import (   "log"   "net/http" ) func main() {   // 设置 路由   http.HandleFunc("/", IndexAction)   // 开启监听   log.Fatal(http.ListenAndServe(":8888", nil)) } func IndexAction(w http.ResponseWriter, r *http.Request) {  w.Write(byte(`<h1 align="center">来自变化吧的问候</h1>`)) } 运行程序,在浏览器上请求: localhost:8888,你会看到我们的结果 Go语言构建HTTP服务器还是很容易的。深入说明。 2 http.Server 类型 HTTP 服务器在 Go 语言中是由 http.Server 结构体对象实现的。参考 http.ListenAndServe() 的实现: // 文件:src/net/http/server.go // ListenAndServe always returns a non-nil error. func ListenAndServe(addr string, handler Handler) error {   server := &Server{Addr: addr, Handler: handler}   return server.ListenAndServe() } 可见过程是先实例化 Server 对象,再完成 ListenAndServe 。其中 Serve 对象就是表示 HTTP 服务器的对象。其结构如下 : // 文件:src/net/http/server.go type Server struct {   Addr    string  // TCP 监听地址, 留空为:":http"   Handler Handler // 调用的 handler(路由处理器), 设为 nil 表示 http.DefaultServeMux   TLSConfig *tls.Config // TLS 配置对象   ReadTimeout time.Duration // 请求超时时长   ReadHeaderTimeout time.Duration // 请求头超时时长   WriteTimeout time.Duration // 响应超时时长   IdleTimeout time.Duration // 请求空闲时长(keep-alive下两个请求间)   MaxHeaderBytes int // 请求头的最大长度   TLSNextProto mapfunc(*Server, *tls.Conn, Handler) // NPN 型协议升级出现时接管TLS连接的处理器函数映射表   ConnState func(net.Conn, ConnState) // 状态转换事件处理器   ErrorLog *log.Logger // 日志记录对象   disableKeepAlives int32     // accessed atomically.   inShutdown        int32     // accessed atomically (non-zero means we're in Shutdown)   nextProtoOnce     sync.Once // guards setupHTTP2_* init   nextProtoErr      error     // result of http2.ConfigureServer if used   mu         sync.Mutex   listeners  mapstruct{}   activeConn mapstruct{}   doneChan   chan struct{}   onShutdown func() } 可见 Server 定义了服务器需要的信息。 实例化了 Server 对象后,调用其 (srv *Server) ListenAndServe() error 方法。该方法会监听 srv.Addr 指定的 TCP 地址,并通过 (srv *Server) Serve(l net.Listener) error 方法接收浏览器端连接请求。Serve 方法会接收监听器 l 收到的每一个连接,并为每一个连接创建一个新的服务进程。 该 go...
go语言动态库的编译和使用 前端框架

go语言动态库的编译和使用

本文主要介绍go语言动态库的编译和使用方法,以linux平台为例,windows平台步骤一样,具体环境如下: $ echo $GOPATH /media/sf_share/git/go_practice $ echo $GOROOT /usr/lib/golang/ $ tree $GOPATH/src /media/sf_share/git/go_practice/src |-- demo |   `-- demo.go `-- main.go 1 directory, 2 files 在$GOPATH/src目录,有demo包和使用demo包的应用程序main.go,main.go代码如下: package main import "demo" func main() {    demo.Demo() } demo包中的demo.go代码如下: package demo import "fmt" func Demo() {    fmt.Println("call demo ...") } 由于demo.go是$GOPATH/src目录下的一个包,main.go在import该包后,可以直接使用,运行main.go: $ go run main.go call demo ... 现在,需要将demo.go编译成动态库libdemo.so,让main.go以动态库方式编译,详细步骤如下: 1 将go语言标准库编译成动态库 $ go install -buildmode=shared -linkshared  std 在命令行运行go install -buildmode=shared -linkshared  std命令,-buildmode指定编译模式为共享模式,-linkshared表示链接动态库,成功编译后会在$GOROOT目录下生标准库的动态库文件libstd.so,一般位于$GOROOT/pkg/linux_amd64_dynlink目录: $ cd $GOROOT/pkg/linux_amd64_dynlink $ ls libstd.so libstd.so 2 将demo.go编译成动态库 $ go install  -buildmode=shared -linkshared demo $ cd $GOPATH/pkg $ ls linux_amd64_dynlink/ demo.a  demo.shlibname  libdemo.so 成功编译后会在$GOPATH/pkg目录生成相应的动态库libdemo.so。 3 以动态库方式编译main.go $ go...
go语言 - Scheduler原理以及查看Goroutine执行 前端框架

go语言 - Scheduler原理以及查看Goroutine执行

最近看了看go scheduler的基本原理,本文介绍go语言scheduler的基本原理以及如何查看go代码中的go routine的执行情况。 0)Scheduler(调度器) 熟悉go语言的小伙伴应该都使用过goroutine。goroutine就是Go语言提供的一种用户态线程。Scheduler是调度goroutine的调度器。 Go的调度器内部有三个重要概念:M,P,G。 M (machine): 代表真正的内核操作系统里面的线程,和POSIX里的thread差不多,也是真正执行goroutine逻辑的部分。 G (Goroutine): 代表一个goroutine。 P (Processor): 代表调度的上下文,可以理解成一个局部调度器。 Go语言实现了多个Goroutine到多个Processor的映射(调度)。注意的是,针对X个Processor,Scheduler可能创建多于X个M(有些M可能会暂时被block)。还需要理解额外两个概念:GRQ(Global Running Queue)以及 LRQ(Local Running Queue)。未指定Processor的Goroutine会存放在GRQ上,在调度到合适的Processor后,会将一个Goroutine从GRQ移动到LRQ。 Go程序中发生了四类事件,允许调程序做出调度决策。 a. 使用关键字go b. 垃圾收集 c. 系统调用 d. 同步 1)Processor的个数 Processor的个数可以通过GOMAXPROCS环境变量设置。GOMAXPROCS默认值是CPU的核数。Processor的个数可以通过如下的go代码进行查询: package main import ( "fmt" "runtime" ) func main() { // NumCPU returns the number of logical // CPUs usable by the current process. fmt.Println(runtime.NumCPU()) } 也就是通过runtime.NumCPU函数可以获得Processor的个数。查看go语言的源代码(runtime/os_linux.c),NumCPU函数的实现函数如下:  func getproccount() int32 { const maxCPUs = 64 * 1024 var buf byte r := sched_getaffinity(0, unsafe.Sizeof(buf), &buf) if r < 0 { return 1 } n := int32(0) for _, v := range buf { for v != 0 { n += int32(v...