1.源码详解系列(八)--全面讲解HikariCP的源码使用和源码
2..cp是什么意思?
3.[转]Megatron-LM源码系列(八): Context Parallel并行
4.linuxä¸cpå½ä»¤å¦ä½ç¨ Cè¯è¨å®ç°
5.剖析Linux内核源码解读之《配置与编译》
6.Nacos 服务注册源码分析
源码详解系列(八)--全面讲解HikariCP的使用和源码
源码详解系列(八):HikariCP深度剖析
HikariCP是一个高效数据库连接池,它的解析核心在于通过“池”复用连接,减少创建和关闭连接的源码开销。本文将全面介绍HikariCP的解析使用方法和源码细节。使用场景与内容
本文将涉及HikariCP的源码以下内容:如何获取连接对象并进行基本操作
项目环境设置,包括JDK、解析retrofit框架源码Maven版本和依赖库
如何配置HikariCP,源码包括依赖引入和配置文件编写
初始化连接池,解析以及通过JMX进行管理
源码分析,源码重点讲解ConcurrentBag和HikariPool类,解析以及其创新的源码“标记模型”
HikariDataSource的两个HikariPool的用意和加载配置
核心原理
HikariCP的性能优势主要源于其“标记模型”,通过减少锁的解析使用,提高并发性能。源码它使用CopyOnWriteArrayList来保证读操作的解析效率,结合CAS机制实现无锁的源码借出和归还操作。源码亮点
源码简洁且易读,9417源码网特别是ConcurrentBag类,它是HikariCP的核心组件。类结构与DBCP2类似,包含一个通用的资源池,可以应用于其他需要池化管理的场景。总结
通过本文,读者可以深入了解HikariCP的工作原理,掌握其配置和使用技巧,以及源码实现。希望本文对数据库连接池有深入理解的开发者有所帮助。参考资料:
.cp是什么意思?
.cp是C++源代码文件的常见后缀。当程序员用C++编写程序时,他们通常会使用文本编辑器(如Notepad++或Sublime Text)编写代码并将其保存为.cp文件。这样做有助于进行版本控制,可以记录代码的出单源码修改历史并对比不同版本。打开和编辑.cp文件需要使用专业的文本编辑器或编程工具,如Visual Studio。这些工具能自动识别和突出显示C++关键字,提高编程效率。要运行.cp文件,需要使用C++编译器将其转换为可执行文件,然后在计算机上运行。
[转]Megatron-LM源码系列(八): Context Parallel并行
原文链接: Megatron-LM源码系列(八): Context Parallel并行
Context Parallel并行(CP)与sequence并行(SP)相比,核心差异在于SP只针对Layernorm和Dropout输出的activation在sequence维度进行切分,而CP则进一步扩展,对所有input输入和所有输出activation在sequence维度上进行切分,形成更高效的并行处理策略。除了Attention模块外,其他如Layernorm、Dropout等模块在CP并行中无需任何修改,简易完整源码因为它们在处理过程中没有涉及多token间的交互。
Attention模块之所以特殊,是因为在计算过程中,每个token的查询(query)需要与同一sequence中其他token的键(key)和值(value)进行交互计算,存在内在依赖性。因此,在进行CP并行时,计算开始前需要通过allgather通信手段获取所有token的KV向量,反向计算时则通过reduce_scatter分发gradient梯度。
为了降低显存使用,前向计算阶段每个GPU仅保存部分KV块,反向阶段则通过allgather通信获取全部KV数据。这些通信操作在特定的rank位置(相同TP组内)进行,底层通过send和recv等操作实现allgather和reduce_scatter。
以TP2-CP2的大仔源码transformer网络为例,CP并行的通信操作在Attention之前执行,其他则为TP通信。AG表示allgather,RS表示reduce_scatter,AG/RS表示前向allgather反向reduce_scatter,RS/AG表示前向reduce_scatter反向allgather。
TP2对应为[GPU0, GPU1], [GPU2, GPU3],CP2指的就是TP组相同位置的rank号,即[GPU0, GPU2], [GPU1, GPU3]。CP并行类似于Ring Attention,但提供了OSS与FlashAttention版本,并去除了冗余的low-triangle causal masking计算。
LLM常因序列长度过长而导致显存耗尽(OOM)。传统解决方法包括重计算或扩大TP(tensor parallel)大小,但各自存在计算代价增加或线性fc计算时间减少与通信难以掩盖的问题。CP则能更高效地解决这一问题,每个GPU处理一部分序列,同时减少CP倍的通信和计算量,同时保持TP不变,使得activation量也减少CP倍。性能优化结果展示于图表中,用户可通过指定--context-parallel-size在Megatron中实现CP。
具体源码实现以Megatron-Core 0.5.0版本为例进行说明。
参考资料:
linuxä¸cpå½ä»¤å¦ä½ç¨ Cè¯è¨å®ç°
1ï¼é¦å éè¦äºè§£cpçåçã2ï¼å¯ä»¥åècpçæºç å»äºè§£å ¶åç
3ï¼cpå½ä»¤çæºç å¯ä»¥å¨linuxå æ ¸ä¸æ¾å°ã
4ï¼æè ä¸è½½busyboxå ¶ä¸ä¹ä¼æcpçæºç
åªæäºè§£å ¶åçä¹åæè½è°å¦ä½å®ç°ãåè代ç å¦ä¸ï¼
#include <stdio.h>#include <stdlib.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <fcntl.h>
#include <errno.h>
#include <unistd.h>
#include <string.h>
#define BUF_SIZE
#define PATH_LEN
void my_err(char *err_string, int line )
{
fprintf(stderr,"line:%d ",line);
perror(err_string);
exit(1);
}
void copy_data(const int frd,const int fwd)
{
int read_len = 0, write_len = 0;
unsigned char buf[BUF_SIZE], *p_buf;
while ( (read_len = read(frd,buf,BUF_SIZE)) ) {
if (-1 == read_len) {
my_err("Read error", __LINE__);
}
else if (read_len > 0) { //æ读åé¨ååå ¥ç®æ æ件
p_buf = buf;
while ( (write_len = write(fwd,p_buf,read_len)) ) {
if(write_len == read_len) {
break;
}
else if (write_len > 0) { //åªåå ¥é¨å
p_buf += write_len;
read_len -= write_len;
}
else if(-1 == write_len) {
my_err("Write error", __LINE__);
}
}
if (-1 == write_len) break;
}
}
}
int main(int argc, char **argv)
{
int frd, fwd; //读åæ件æ述符
int len = 0;
char *pSrc, *pDes; //åå«æåæºæ件路å¾åç®æ æ件路å¾
struct stat src_st,des_st;
if (argc < 3) {
printf("ç¨æ³ ./MyCp <æºæ件路å¾> <ç®æ æ件路å¾>\n");
my_err("arguments error ", __LINE__);
}
frd = open(argv[1],O_RDONLY);
if (frd == -1) {
my_err("Can not opne file", __LINE__);
}
if (fstat(frd,&src_st) == -1) {
my_err("stat error",__LINE__);
}
/*æ£æ¥æºæ件路å¾æ¯å¦æ¯ç®å½*/
if (S_ISDIR(src_st.st_mode)) {
my_err("ç¥è¿ç®å½",__LINE__);
}
pDes = argv[2];
stat(argv[2],&des_st);
if (S_ISDIR(des_st.st_mode)) { //ç®æ è·¯å¾æ¯ç®å½ï¼å使ç¨æºæ件çæ件å
len = strlen(argv[1]);
pSrc = argv[1] + (len-1); //æåæåä¸ä¸ªå符
/*å æ¾åºæºæ件çæ件å*/
while (pSrc >= argv[1] && *pSrc != '/') {
pSrc--;
}
pSrc++;//æåæºæ件å
len = strlen(argv[2]);
// . 表示å¤å¶å°å½åå·¥ä½ç®å½
if (1 == len && '.' == *(argv[2])) {
len = 0; //没æç³è¯·ç©ºé´ï¼åé¢å°±ä¸ç¨éæ¾
pDes = pSrc;
}
else { //å¤å¶å°æç®å½ä¸ï¼ä½¿ç¨æºæ件å
pDes = (char *)malloc(sizeof(char)*PATH_LEN);
if (NULL == pDes) {
my_err("malloc error ", __LINE__);
}
strcpy(pDes,argv[2]);
if ( *(pDes+(len-1)) != '/' ) { //ç®å½ç¼ºå°æåç'/'ï¼åè¡¥ä¸â/â
strcat(pDes,"/");
}
strcat(pDes+len,pSrc);
}
}
/* æå¼ç®æ æä»¶ï¼ ä½¿æéä¸æºæ件ç¸å*/
fwd = open(pDes,O_WRONLY | O_CREAT | O_TRUNC,src_st.st_mode);
if (fwd == -1) {
my_err("Can not creat file", __LINE__);
}
copy_data(frd,fwd);
//puts("end of copy");
if (len > 0 && pDes != NULL)
free(pDes);
close(frd);
close(fwd);
return 0;
}
剖析Linux内核源码解读之《配置与编译》
Linux内核的配置与编译过程详解如下:配置阶段
首先,从kernel.org获取内核源代码,如在Ubuntu中,可通过`sudo apt-get source linux-$(uname -r)`获取到,源码存放在`/usr/src/`。配置时,主要依据`arch//configs/`目录下的默认配置文件,使用`cp`命令覆盖`/boot/config`文件。配置命令有多种,如通过`.config`文件进行手动修改,但推荐在编译前进行系统配置。配置时注意保存配置,例如使用`/proc/config.gz`,以备后续需要。编译阶段
内核编译涉及多种镜像类型,如针对ARM的交叉编译,常用命令是特定的。编译过程中,可能会遇到错误,需要针对具体问题进行解决。编译完成后,将模块和firmware(体系无关)分别存入指定文件夹,记得为某些硬件添加对应的firmware文件到`lib/firmware`目录。其他内容
理解vmlinux、vmlinuz(zImage, bzImage, uImage)之间的关系至关重要。vmlinuz是压缩后的内核镜像,zImage和bzImage是vmlinuz的压缩版本,其中zImage在内存低端解压,而bzImage在高端解压。uImage是uBoot专用的,是在zImage基础上加上特定头信息的版本。Nacos 服务注册源码分析
文章标题:Nacos 服务注册源码深度剖析
作者郑哥在微信公众号运维开发故事中,详细解析了Nacos服务注册过程中服务端和客户端的运作机制。以Spring-Boot为基础,Nacos在服务架构中扮演着中心角色,与Eureka、Zookeeper等其他中间件相区分,其特点是支持AP和CP模式,并采用Raft协议保证分区一致性。
客户端注册服务是主动的,通过Spring-Cloud Alibaba组件集成。关键配置类NacosServiceRegistryAutoConfiguration定义了核心Bean,如NacosAutoServiceRegistration,它负责将服务实例注册到Nacos。NacosServiceRegistry则负责实际的注册操作,通过心跳机制保持与服务端的连接。
服务端,Nacos根据客户端注册时的ephemeral属性决定使用Distro(AP)或Raft(CP)协议。AP模式下,Nacos通过udp更新服务实例信息,而CP模式下,会触发raftCore.signalPublish进行数据同步和通知。
对于源码调试,郑哥分享了如何定位启动类com.alibaba.nacos.Nacos,以及如何通过IDEA进行启动和调试。要深入了解Nacos的源码,可以参考nacos.io和github.com/alibaba/nacos...的文档。