深入理解 C++ 中的 memset：原理、实现与使用指南

在 C/C++ 编程中，memset是一个经常被使用的函数，尤其在算法竞赛、系统编程和性能要求较高的场景下。本文将从底层原理、常见用法、性能表现到潜在的陷阱，全面介绍memset。

1. memset 是什么？

memset 是 C 标准库 <cstring>提供的一个内存操作函数，用于将一块连续的内存空间按字节设置为某个值。其原型如下：

void* memset(void* ptr, int value, size_t num);

ptr：目标内存块的起始地址。
value：要设置的值（按字节存储，只取低 8 位）。
num：要填充的字节数。

例如：

int a[5];
memset(a, 0, sizeof(a));  // 把整个数组 a 填充为 0

2. 底层原理

memset 本质是一个逐字节填充的过程。现代编译器和库的实现会做优化：

按字节写入：最基本的实现就是 for 循环一字节一字节写。
按机器字大小写入：为了提速，会在对齐的情况下，按 4 字节、8字节甚至更大块拷贝。
SIMD 优化：某些库还会用向量化指令（如 SSE/AVX）来批量写。

所以 memset 的时间复杂度是 O(n)，其中 n是要填充的字节数，但常数因子极小，通常比手写循环快。

3. 常见用法

(1) 清零数组

int a[100];
memset(a, 0, sizeof(a));

(2) 设置为 -1

int a[100];
memset(a, -1, sizeof(a));

结果是每个字节都填充为 0xFF，在补码表示下就是 -1。
常用于初始化 dis[] 这种数组。

(3) 设置为一个大常数（如 0x3f）

int dis[100005];
memset(dis, 0x3f, sizeof(dis));

0x3f3f3f3f 在 int 范围内是一个比较大的正数（约1e9），常用作"无穷大"。
好处：memset 设置快，比循环 fill_n(dis,n,INF) 更高效。

4. memset 的注意事项

只能按字节填充
不能用来设置成任意整数值，比如：
int a[100];
memset(a, 1, sizeof(a)); // ❌ 错误理解
实际效果是每个字节填充 0x01，结果数组元素是0x01010101 = 16843009，而不是 1。
适合清零和 -1 初始化
- 清零：memset(a, 0, sizeof(a)) ✅
- 初始化为 -1：memset(a, -1, sizeof(a)) ✅
- 大常数：memset(a, 0x3f, sizeof(a)) ✅
复杂类型要小心
对于 struct、class，如果包含指针或非平凡成员，不推荐用memset，要用构造函数或 fill。

5. 性能分析

memset 通常由标准库用汇编优化过，远快于手写循环。
对于大数组（如 1e7 元素），memset 的速度可能是 for 循环的数倍。
fill 在 C++ STL 里也有类似优化，但在一些编译器环境下比 memset稍慢。

6. 清零前 n 个元素

int a[100005];
int n = 10;
memset(a, 0, n * sizeof(int));     // 方法 1：memset
fill(a, a + n, 0);                 // 方法 2：fill
for(int i=0;i<n;i++) a[i]=0;       // 方法 3：手写循环