- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

别让并发把你绕晕：openEuler 内核同步技术详解（像聊给同事听那样）【华为根技术】

Echo_Wish 发表于 2025/10/15 22:10:10 2025/10/15

【摘要】别让并发把你绕晕：openEuler 内核同步技术详解（像聊给同事听那样）

别让并发把你绕晕：openEuler 内核同步技术详解（像聊给同事听那样）

作者：Echo_Wish

先说结论：内核同步不是“把锁往哪里一丢就完事儿”的活儿，它是一门关于“正确性、延迟与吞吐权衡”的艺术。openEuler 继承并沿用 Linux 内核丰富的同步原语，但也在实现和调优上有它的工程细节——本文把这些东西讲清楚、讲实用，带点代码例子，帮你既能看懂原理也能上手排查性能问题。

一、为什么内核要这么多同步原语？

内核里同时跑着中断处理、软中断、内核线程、用户态系统调用、NMI（不可屏蔽中断）——这些上下文对共享数据的访问模型差别巨大。于是，内核提供了多类同步机制：**忙等（spinlock/irqsave）**用于短临界区与中断上下文，**睡眠锁（mutex/semaphore）**用于可能阻塞的长操作；还有为读多写少场景准备的 RCU、seqlock、rwlock 等专门工具。选择哪种锁，直接决定了系统延迟和吞吐。

二、常见原语与适用场景（实战派）

自旋锁（spinlock / raw_spinlock）：适合保护超短临界区（比如修改链表头、短的位操作），因为阻塞会引发上下文切换代价更大。内核自旋锁可在中断上下文使用，但要注意中断屏蔽与嵌套。
互斥锁（mutex）：可睡眠，适合可能等待 IO 或长时间操作的场景，不能在中断上下文使用。
读写锁（rwlock / queued rwlock）：当读远多于写时可以提升并发度。openEuler 对 queued readers-writer lock 有实现细节，使用队列保证 FIFO 公平性，避免写者饿死。
RCU（Read-Copy-Update）：读操作“免锁”，写操作通过复制并在安全点回收旧数据，极适合读多写少且允许短暂“陈旧读”的场景（如路由表、设备表等）。RCU 的 quiescent state 和 callback 机制是它的核心。
Seqlock（顺序锁）：写者更新时会增加版本号，读者读取前后检测版本号是否一致以判断是否发生并发写，适合短写且读可以重试的场景。

三、典型代码示例（内核风格，便于理解与排查）

1）自旋锁保护临界区（伪代码，内核风格）

spinlock_t my_lock;
unsigned long flags;

spin_lock_init(&my_lock);

/* 在可能被中断打断或多 CPU 场景下保护 */
spin_lock_irqsave(&my_lock, flags);
/* 临界区：短且必须快速完成的操作 */
modify_shared_counter();
spin_unlock_irqrestore(&my_lock, flags);

说明：用 irqsave/irqrestore 防止中断在持锁期间打断，这样能避免死锁或中断与进程互相等待。

2）RCU 的思路（伪代码）

rcu_read_lock();
/* 读：不加传统锁，读取共享数据结构指针 */
ptr = rcu_dereference(shared_ptr);
use(ptr);
rcu_read_unlock();

/* 写更新：复制-修改-交换-回调回收 */
new_ptr = kmalloc(...);
copy_and_modify(new_ptr);
rcu_assign_pointer(shared_ptr, new_ptr);
synchronize_rcu(); // 或者 call_rcu() 延迟回收
kfree(old_ptr) after grace period;

说明：读非常快，写把回收推迟到所有 reader 通过 quiescent state 后再回收，从而实现免锁快速读。([openeuler.org][3])

四、性能与死锁常见坑（读这段，少踩血本）

锁抢占顺序错误：在持有自旋锁时调用可能睡眠的操作（如 mutex）会死锁。反之亦然也可能引起大问题，要严格遵循“高层锁→低层锁”的获取顺序。内核文档里有指引（锁类型与嵌套规则）。
长临界区用错自旋锁：自旋锁会 busy-wait，占用 CPU，长时间持锁会拖垮系统；应改用 mutex 或把工作拆小。
RCU 不等于万能：RCU 适合允许短暂陈旧读的结构，不适合需要強一致性或频繁写的场景。误把写密集场景放到 RCU，会导致内存大量增长与延迟的不确定性。
排队锁与公平性/延迟权衡：queued rwlock 等实现倾向公平（FIFO），避免写者饥饿，但在极端负载下可能牺牲吞吐。工程上要根据场景权衡。

五、openEuler 的工程实践（我见过、也试过的几招）

在 cloud/edge 场景下，openEuler 跑的是 kernel 5.10 / 6.x 系列，对锁的调度与 PREEMPT/RT 有差别。部署时注意内核配置（是否启用 CONFIG_PREEMPT、CONFIG_PREEMPT_RT 等），因为这些会影响锁的行为和延迟特性。
性能排查建议流程：perf top/perf record 找热点，再看是否是锁竞争（perf lock、lockstat），锁是热点就要看临界区长度、是否可以切换为读优化（RCU/seqlock）、或拆分数据结构到 per-cpu。实战中，per-cpu 数据结构常常是提升并发最直接的办法。

六、我的一点感想（写给运维与内核开发的小伙伴）

内核同步看起来是“理论化”的东西，但真正干起来是工程问题：你要了解业务（哪个路径要求低延迟、哪个是吞吐瓶颈）、了解硬件（中断分布、NUMA）再选择合适的同步策略。别总把 RCU 当作万能钥匙，也别把 spinlock 当作万能锤子。多做剖析（profiling）+ 小步改造，才能既安全又高效地优化系统。

七、结语

同步机制是内核稳定与性能的守护者。openEuler 作为社区发行版，继承了 Linux 的成熟同步原语，同时在实现与工程实践上有社区积累的经验。学会识别场景、用对工具、避免常见反模式，你的系统就会少些夜间“被叫醒”的电话，多些平稳运行的“安睡”。

想要我把上面那段性能排查流程写成一份可复制的 checklist（含 perf/lockstat 命令示例）吗？我可以直接给你一个实用清单，手把手教你找锁瓶颈。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

别让并发把你绕晕：openEuler 内核同步技术详解（像聊给同事听那样）【华为根技术】

别让并发把你绕晕：openEuler 内核同步技术详解（像聊给同事听那样）

一、为什么内核要这么多同步原语？

二、常见原语与适用场景（实战派）

三、典型代码示例（内核风格，便于理解与排查）

1）自旋锁保护临界区（伪代码，内核风格）

2）RCU 的思路（伪代码）

四、性能与死锁常见坑（读这段，少踩血本）

五、openEuler 的工程实践（我见过、也试过的几招）

六、我的一点感想（写给运维与内核开发的小伙伴）

七、结语

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

别让并发把你绕晕：openEuler 内核同步技术详解（像聊给同事听那样）【华为根技术】

别让并发把你绕晕：openEuler 内核同步技术详解（像聊给同事听那样）

一、为什么内核要这么多同步原语？

二、常见原语与适用场景（实战派）

三、典型代码示例（内核风格，便于理解与排查）

1）自旋锁保护临界区（伪代码，内核风格）

2）RCU 的思路（伪代码）

四、性能与死锁常见坑（读这段，少踩血本）

五、openEuler 的工程实践（我见过、也试过的几招）

六、我的一点感想（写给运维与内核开发的小伙伴）

七、结语

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品