Go 语言中 for 和 range 的性能比较

在 Go 语言开发中，for和range是我们日常编码中最常用的两种循环方式。它们看似功能相似，但在不同场景下的性能表现却有着天壤之别。本文将带你深入探索它们的性能差异，并通过实际基准测试揭示背后的真相！

语法差异

传统for循环：

// 经典三段式
for i := 0; i < len(slice); i++ {
    // 通过索引访问元素
    element := slice[i]
}

优点：精确控制迭代过程，可直接修改元素

适用场景：需要索引控制、复杂步进逻辑或元素修改

range循环：

// 遍历值
for _, value := range slice {
    // 使用value
}

// 遍历索引和值
for index, value := range slice {
    // 使用index和value
}

优点：语法简洁，自动防越界，代码可读性高

适用场景：简单遍历数组、切片、map等集合类型

从表面看，range似乎更现代化、更简洁。但这种便利背后是否隐藏着性能代价？让我们通过基准测试一探究竟。

场景测试

场景1：基本类型切片（[]int）

// 基准测试代码
func BenchmarkForIntSlice(b *testing.B) {
    nums := make([]int, 1<<20) // 100万个整数
    for i := 0; i < b.N; i++ {
        tmp := 0
        for j := 0; j < len(nums); j++ {
            tmp = nums[j]
        }
        _ = tmp
    }
}

func BenchmarkRangeIntSlice(b *testing.B) {
    nums := make([]int, 1<<20)
    for i := 0; i < b.N; i++ {
        tmp := 0
        for _, v := range nums {
            tmp = v
        }
        _ = tmp
    }
}

测试结果：

for循环：约324,512 ns/op

range循环：约322,744 ns/op

结论：对于基本类型切片，两者性能几乎无差异。此时可优先选择编码风格更简洁的range。

场景2：大内存结构体切片

type LargeItem struct {
    id  int
    val [4096]byte // 每个结构体占用4KB内存
}

func BenchmarkForStruct(b *testing.B) {
    var items [1024]LargeItem
    for i := 0; i < b.N; i++ {
        tmp := 0
        for j := 0; j < len(items); j++ {
            tmp = items[j].id
        }
        _ = tmp
    }
}

func BenchmarkRangeStruct(b *testing.B) {
    var items [1024]LargeItem
    for i := 0; i < b.N; i++ {
        tmp := 0
        for _, item := range items {
            tmp = item.id
        }
        _ = tmp
    }
}

测试结果：

for循环：约324 ns/op

range循环：约467,411 ns/op

结论：当元素为大内存结构体时，for循环性能远超range（约2000倍差异）！这是因为range在迭代过程中会对每个元素创建完整副本。

场景3：指针类型切片（[]*struct）

func BenchmarkRangePointer(b *testing.B) {
    items := make([]*LargeItem, 1024)
    // 初始化指针切片...
    for i := 0; i < b.N; i++ {
        tmp := 0
        for _, item := range items {
            tmp = item.id
        }
        _ = tmp
    }
}

测试结果：

for循环：约4,160 ns/op

range循环：约4,194 ns/op

结论：当使用指针切片时，两者性能再次接近。指针拷贝的成本远低于整个结构体的拷贝成本。

根源分析

为什么在不同场景下性能差异如此巨大？关键在于range的实现机制：

拷贝行为：range在迭代过程中会对每个元素创建拷贝

type Person struct{ Age int }
people := []Person{{30}, {40}}

// range修改无效（操作的是拷贝）
for _, p := range people {
    p.Age += 10 
}

// for修改有效
for i := range people {
    people[i].Age += 10 
}

拷贝成本差异：

基本类型（int等）：拷贝成本极低

大结构体：每次迭代完整拷贝结构体，成本高昂

指针类型：仅拷贝指针（通常8字节），成本很低

map与channel遍历

Map遍历：

m := map[string]int{"A": 1, "B": 2}
for k, v := range m {
    // 迭代顺序不确定
    delete(m, "C") // 安全删除未迭代键
    m["D"] = 3     // 新增键可能被迭代到
}

range是遍历map的唯一安全方式。

性能与for + 切片方案相当，推荐使用range。

Channel遍历：

ch := make(chan int, 10)
// ...发送数据...
for v := range ch {
    // 处理值，直到ch关闭
}

range 是消费channel的惯用方式

对nil信道的遍历会永久阻塞。

实战优化

根据上述分析，我们总结出以下性能优化指南：

基本类型切片：优先range（简洁性 > 微小性能差异）
大内存结构体：

使用传统for循环
改用指针切片[]*T后使用range
使用range只遍历索引：for i := range items { items[i]... }

需要修改元素值：

使用for循环直接修改
或使用指针切片配合range

map 和 channel：必须使用range

最后

经过多轮测试和分析，我们可以得出以下结论：

性能敏感型代码：

大结构体遍历：优先选择 for
基本类型遍历：两者均可，差异可忽略
超大数据集：考虑分片处理或并发

代码可维护性优先：

日常业务逻辑：首选 range，提高可读性
团队协作项目：保持风格统一更重要

折中方案：

兼顾性能和可读性的写法：

for i := range items {
    item := &items[i] // 获取指针避免拷贝
    item.Process()    // 直接修改原元素
}

最终选择取决于具体场景：在内存拷贝成本高的地方使用 for，在代码简洁性重要的地方使用 range 。理解其背后的机制，才能写出既高效又优雅的 Go 代码！

例外提示：Go 1.20+ 优化了 range 对切片和map的遍历性能，若仅需只读访问基本类型或小对象，两者差异可忽略，此时 range 的简洁性仍是首选。

Go 语言中 for 和 range 的性能比较

语法差异

场景测试

根源分析

map与channel遍历

实战优化

最后

推荐

解决方案

网站建设

系统开发

技术支撑

业务中台

文案策划

新媒体运营