1.Ӳ?硬盘源码̲???Դ??
2.文件系统概述:性能指标、设计思路、擦除可靠性保障
3.nfs copyånfs opençåºå«
4.linux内核源码:内存管理——内存分配和释放关键函数分析&ZGC垃圾回收
5.撕码是硬盘源码什么意思?
6.ROMçå®ä¹
Ӳ?̲???Դ??
Linux计算机安装后,在我们不断的擦除使用过程中,因为添加、硬盘源码删除软件和上网冲浪、擦除fah源码调试程序等行为,硬盘源码硬盘中会产生各种各样的擦除垃圾文件,而随着这些垃圾文件的硬盘源码不断膨胀,它们不仅会平白吞噬掉我们宝贵的擦除硬盘空间,更会拖累机器的硬盘源码运行速度,影响我们的擦除工作效率。本文介绍一下给 Linux 系统减肥的硬盘源码方法和工具的使用技巧,本文使用的擦除 Linux 发行版本是Ubuntu. 。本文介绍的硬盘源码工具包括:Activity Log Manager、BleachBit、find、fdupes、Geeqie、GConf Cleaner,这些工具都是开源工具,Linux 用户可以通过下载编译源代码在其他流行的 Linux 版本(如 Redhat、SUSE 等)上使用。Linux 下哪些文件属于垃圾文件
软件安装过程中产生的临时文件
许多 bin 格式的软件在安装时,首先要把自身的安装文件解压缩到一个临时目录(一般为/tmp 目录)然后再进行安装。如果软件设计有疏忽或者系统有问题,当安装结束后,这些临时文件就会变得并不临时,成为硬盘里的一堆垃圾,很多时候它们以*.tmp 的面孔出现。
软件运行过程中产生的临时文件
和安装过程一样,在软件的办公软件源码代码运行过程中通常也会产生一些临时交换文件,有些软件运行过后遗留下来的垃圾甚至多达数百兆,比如ssh服务器和客户端连接过程中时产生的文件。还有虚拟机运行时产生的文件。另外我们删除一个账户之后,还会存在一些无用垃圾文件及目录。
上网冲浪产生的临时文件
我们在上网的时候,浏览器总是将网页文件下载到本地机器上,这些缓存文件不但占用了宝贵的磁盘空间,还常常会把我们的个人隐私公之于众。
一些不常用的鸡肋文件
比如一些应用软件自带的帮助和系统手册页等。既然食之无味索性也将它们视作垃圾文件的一种表现。占用空间甚大,更会严重拖累系统和一些图形处理软件的运行速度。另外还有一些损坏的桌面文件,它包括损坏的应用程序菜单按钮和文件关联。
各种缓存文件
如果 Linux 用户安装使用 GIMP 或者 Geeqie 等图形编辑工具,在这些软件都有预览功能,在保存了的文件夹下会产生一个名为Thumbs.db的文件,这个文件会随着文件的增加而膨胀。还有就是.DS_Store 文件,DS_Store 文件是用来存储这个文件夹的显示属性的:比如文件图标的摆放位置。删除以后的副作用就是这些信息的失去。另外还有使用 apt 或者yum软件包安装过程中生成的缓存文件。
使用 Linux 命令删除垃圾文件 删除用户后遗留下的垃圾文件
这里我们使用到的主要命令是 find 。举个例子: 我们删除一个账户之后,还会存在一些无用垃圾文件及目录,我们要找出属于这个用户的垃圾东西,使用 find / -user 用户名 :就可以找到根目录下属于这个用户的相关文件 ,使用命令:
#find ./ -nouser |xargs rm rf
core 文件
当我们在系统下运行某个程序出错的时候,系统会自动将残留在内存中的数据存成 core 文件,久而久之,系统中遗留下来的 core 会越来越多,就像灰尘一样散落在系统的每一个角落里很是烦人。这个时候,ipz275源码我们就可以应用 find 命令加上exec参数来清理它们。使用命令:
# find / -name core -print -exec rm -rf { } ;
多余的手册页
另外 Linux 提供了众多语言的手册页(man)比如 Ubuntu 的 手册页位于/usr/share/man 目录下 ,可以使用命令删除多余语言的手册页保留中英文即可。
# cd /usr/share/man # find ./ -maxdepth 1 -type d | tail -n +2 | grep -E -v '(en|zh|man).*' | while read d; do rm -rf $d; done
说明:关键字是(en|zh|man) ,您可以根据自己的情况修改。
使用 fdupes 工具删除指定目录下重复文件
fdupes 是一个命令行工具,它会查找和删除指定目录的重复文件,它通过文件的大小和 MD5 值进行比较 。一个字节一个字节进行对比。 首先安装这个工具
# apt-get install fdupes
在 /etc 目录查找重复文件 ,使用如下命令:
#fdupes /etc
可以与 Linux 命令组合使用,删除文件 :
#fdupes -r -f . | grep -v ^$ | tee duplicate.txt cat duplicate.txt | while read file; do rm -v $file; done
另外也可以与sed命令组合使用,删除文件 :
# fdupes -r -n -S /tmp | sed -r s/^/#rm / | sed -r s/$// duplicate-files.sh
删除缓存文件
清理旧版本的软件缓存
# apt-get autoclean
清理所有软件缓存:
#apt-get clean
使用 Geeqie 工具找出相似图像文件
现在的硬盘容量是越来越大,出于备份的考虑,很多朋友会采取宁滥勿缺的原则保存,这就可能出现文件重复的情况,造成文件搜索的效率低下。要在海量的存储空间中找出重复的文档,并不是一件容易的工作。其实借助著名的图像浏览工具 Geeqie 可以很轻松地找出系统中的重复和相似图像文件。这些文件相比文本文件更大,时间长了会占用很多硬盘空间。使用上面介绍的 fdupes 工具就不行,因为 fdupes 工具只能删除完全相同 (md5sum相同) 的重复文件, 但若要剔除 相似 的文件, 则可使用 geeqie 工具。首先安装这个工具:
# apt-get install gqview
下面运行这个工具,在要搜索的目录上按鼠标右键, 选择 Find duplicates recursive...见图 1 。
选择左下角的 Compare by: 下拉菜单可选择比对方式 Similarity (custom)找出相似度 % 以上的,另外可以勾选 Thumbnails 可显示缩略图见图 2
下面在被选取的项目上按鼠标右键, 点选 Delete 即可删除所有被选取的, 删除前会有一个的确认界面以免误删。说明 %是相似度的缺省值,用户可以通过如下方式修改参数:在 Edit Preferences Preferences... Behavior Miscellaneous: Custom similarity threshold 见图 3 。高尔夫球源码
使用 BleachBit 清理文件 简介
BleachBit 是一款开源免费的系统清理工具,功能类似 Windows 平台的 CCleaner。BleachBit 能够删除隐藏的垃圾文件,以及简单的保护你的隐私。擦除缓存,删除 cookies 文件,清除互联网浏览历史,删除未使用的本地化碎片日志,删除临时文件,是一款非常实用的跨平台的系统清理工具。BleachBit 提供有rpm和 deb 二进制包,适用于Fedora/CentOS/RHEL、Debian/Ubuntu 等 Linux 发行版。其它 Linux 用户可以选择 BleachBit 的源码包(下载地址:mit、install三步。
write log就是写日志,日志中最主要的内容是,一个事务中被修改后的block的数据和block的位置。
commit是写日志结束的标志,同时也是一个写事务完成的标志,我们可以认为在commit之后,消息就已经被安全地写入了,应用程序可以响应用户。
install则发生在commit之后任何一个可能的时间,其将写操作真正应用到文件系统的其他位置,即将这些block的数据写入block的位置。注意这一步是幂等的,即不管执行多少次,甚至在install的过程中发生了崩溃,只要最终执行完成即可。
如果在commit前系统崩溃/断电了,python 音乐爬虫源码则程序没有响应用户,这条日志最终也不会被install。如果在commit后系统崩溃/断电了,则在之后某次系统上线后,会install这条日志。如果在install的时候系统崩溃/断电了,则下次系统上线会重新install这条日志且不会发生重复写错误。
并发和事务在同一时间,可能多个程序同时向操作系统提交了写操作。如果每个程序的文件IO操作串行执行的话,硬盘会反复发起IO完成的中断,带来多次CPU上下文的切换。同时硬盘本身也无法充分发挥自己的写性能(比如SSD 1ms 可以写入1M,但是操作系统和CPU 1ms内最多提交一个k的写请求),且无法优化随机写的性能(比如因为HDD的寻址优化)。因此文件系统总是会尽可能多地将多个写请求(程序 -> 文件系统)合并为一个写事务(文件系统 -> 硬盘驱动)。
具体而言,合并的方式比较多样,比如根据时间片来划分,每ms内的写请求进行一次合并;或者根据写入的数据的大小做划分,每1MB写入一次;或者采用一些混合策略,或者启发性策略。
一般而言,所有的写请求(比如在C语言中的write函数调用)并不会立马发生磁盘IO,从write函数中返回也不意味着这个写操作已经成功了;这只意味着文件系统已经了解了这个写操作。只有从flush函数中返回,才意味着这个写操作已经随着事务commit了。
和数据库中类似,文件系统的每个事务也都有唯一的id,而且id会不断增长。这个id需要持久化保存。
commit的标志有些人可能会疑问,为什么我们要单独强调commit这个操作呢?write log写完,不就是写日志结束吗?这是因为write log的过程中,系统也可能会崩溃,进而我们可能无法区分硬盘上的数据,到底是我们写入的,还是由于硬盘的惰性擦除而留下的脏数据。因此对于文件系统而言,需要将commit单独拎出来,视为非常重要的一步。
因此这里的核心问题和计算机网络中某些问题很像:怎么验证消息没有被篡改?最自然而然的方式是,给消息添加一个校验码(hash值)。当文件系统在内存中准备好日志之后,我们可以计算日志的hash值,并放入到日志之前。然后将hash值和日志的写请求一起交给硬盘。
只有hash值和日志都完整写入,之后install前的校验(hash(日志) == hash值)才能通过。有任何一块没写入,或没有完整写入,则校验无法通过,则认为这条日志没有commit,不需要install。
install的时机commit之后,数据还没有在其应该在的位置。假如我们修改了一个文件的1字节,并在commit之后,跳过文件系统去查看磁盘的内容,会发现该文件并没有发生改变。但是如果我们通过文件系统去读取这个文件,会发现文件改变了。
在读取过程中,我们可能会命中文件系统的page cache,所以根本不会发生硬盘IO。如果没有命中page cache,则我们要去读硬盘了。而在读硬盘前,我们会检查一下将要读取的block是
nfs copyånfs opençåºå«
åµå ¥å¼çæ件系ç»æ¯ææåµå ¥å¼ç³»ç»æåºç¨çæ件系ç»ã大å¤æ°åµå ¥å¼ç³»ç»éç¨äºLinuxãåµå ¥å¼ç³»ç»å¯¹æ件系ç»çè¦æ±è¦æ±æ件系ç»å¨é¢ç¹çæ件æä½ï¼ä¾å¦ï¼æ°å»ºï¼å é¤ï¼æªæï¼ä¸è½å¤ä¿æè¾é«ç读åæ§è½ï¼è¦æ±ä½ç¢çåãæ¥å¿æ件系ç»ï¼XFS,ReiserFS,Ext3çï¼è½ä¿ææ°æ®çå®æ´æ§ï¼ä½æ¶èè¿å¤ç³»ç»èµæºçå¼±ç¹ä½¿ä¹ä¸è½æ为åµå ¥å¼ç³»ç»ä¸ç主æµåºç¨ã并ä¸è¿äºé½æ¯ä¸é¨ä¸ºç¡¬çè¿ç±»çåå¨è®¾å¤ä¼åï¼å¯¹äºflashè¿ç±»çåå¨ä»è´¨å¹¶ä¸éç¨ãåµå ¥å¼æ件系ç»çè½½ä½æ¯ä»¥Flash为主çåå¨ä»è´¨ï¼Flashçæ¦é¤æ¬¡æ°æ¯æéçï¼æ以为äºå»¶é¿Flashç使ç¨å¯¿å½ï¼åºè¯¥å°½éåå°å¯¹Flashçåå ¥æä½ãåµå ¥å¼æ件系ç»çè½½ä½æ¯ä»¥Flash为主çåå¨ä»è´¨ï¼Flashçæ¦é¤æ¬¡æ°æ¯æéçï¼æ以为äºå»¶é¿Flashç使ç¨å¯¿å½ï¼åºè¯¥å°½é使对Flashçåå ¥æä½åååå¸å¨æ´ä¸ªFlashä¸ãNFSæ¯NetFileSystemçç®åï¼å³ç½ç»æ件系ç»ãç½ç»æ件系ç»æ¯FreeBSDæ¯æçæ件系ç»ä¸çä¸ç§ï¼å®å 许ä¸ä¸ªç³»ç»å¨ç½ç»ä¸ä¸å®äººå ±äº«ç®å½åæ件ãéè¿ä½¿ç¨NFSï¼ç¨æ·åç¨åºå¯ä»¥è±¡è®¿é®æ¬å°æ件ä¸æ ·è®¿é®è¿ç«¯ç³»ç»ä¸çæ件ãYAFFSï¼YetAnotherFlashFileSystemï¼æ¯ç¬¬ä¸ä¸ªä¸é¨ä¸ºNANDFlashåå¨å¨è®¾è®¡çåµå ¥å¼æ件系ç»ï¼éç¨äºå¤§å®¹éçåå¨è®¾å¤ï¼å¹¶ä¸æ¯å¨GPLï¼GeneralPublicLicenseï¼åè®®ä¸åå¸çï¼å¯å¨å ¶ç½ç«å è´¹è·å¾æºä»£ç ã
linux内核源码:内存管理——内存分配和释放关键函数分析&ZGC垃圾回收
本文深入剖析了Linux内核源码中的内存管理机制,重点关注内存分配与释放的关键函数,通过分析4.9版本的源码,详细介绍了slab算法及其核心代码实现。在内存管理中,slab算法通过kmem_cache结构体进行管理,利用数组的形式统一处理所有的kmem_cache实例,通过size_index数组实现对象大小与kmem_cache结构体之间的映射,从而实现高效内存分配。其中,关键的计算方法是通过查找输入参数的最高有效位序号,这与常规的0起始序号不同,从1开始计数。
在找到合适的kmem_cache实例后,下一步是通过数组缓存(array_cache)获取或填充slab对象。若缓存中有可用对象,则直接从缓存分配;若缓存已空,会调用cache_alloc_refill函数从三个slabs(free/partial/full)中查找并填充可用对象至缓存。在对象分配过程中,array_cache结构体发挥了关键作用,它不仅简化了内存管理,还优化了内存使用效率。
对象释放流程与分配流程类似,涉及数组缓存的管理和slab对象的回收。在cache_alloc_refill函数中,关键操作是检查slab_partial和slab_free队列,寻找空闲的对象以供释放。整个过程确保了内存资源的高效利用,避免了资源浪费。
总结内存操作函数概览,栈与堆的区别是显而易见的。栈主要存储函数调用参数、局部变量等,而堆用于存放new出来的对象实例、全局变量、静态变量等。由于堆的动态分配特性,它无法像栈一样精准预测内存使用情况,导致内存碎片问题。为了应对这一挑战,Linux内核引入了buddy和slab等内存管理算法,以提高内存分配效率和减少碎片。
然而,即便使用了高效的内存管理算法,内存碎片问题仍难以彻底解决。在C/C++中,没有像Java那样的自动垃圾回收机制,导致程序员需要手动管理内存分配与释放。如果忘记释放内存,将导致资源泄漏,影响系统性能。为此,业界开发了如ZGC和Shenandoah等垃圾回收算法,以提高内存管理效率和减少内存碎片。
ZGC算法通过分页策略对内存进行管理,并利用“初始标记”阶段识别GC根节点(如线程栈变量、静态变量等),并查找这些节点引用的直接对象。此阶段采用“stop the world”(STW)策略暂停所有线程,确保标记过程的准确性。接着,通过“并发标记”阶段识别间接引用的对象,并利用多个GC线程与业务线程协作提高效率。在这一过程中,ZGC采用“三色标记”法和“remember set”机制来避免误回收正常引用的对象,确保内存管理的精准性。
接下来,ZGC通过“复制算法”实现内存回收,将正常引用的对象复制到新页面,将旧页面的数据擦除,从而实现内存的高效管理。此外,通过“初始转移”和“并发转移”阶段进一步优化内存管理过程。最后,在“对象重定位”阶段,完成引用关系的更新,确保内存管理过程的完整性和一致性。
通过实测,ZGC算法在各个阶段展现出高效的内存管理能力,尤其是标记阶段的效率,使得系统能够在保证性能的同时,有效地管理内存资源。总之,内存管理是系统性能的关键因素,Linux内核通过先进的算法和策略,实现了高效、灵活的内存管理,为现代操作系统提供稳定、可靠的服务。
撕码是什么意思?
撕码(Shred Code)是指将源代码或二进制代码彻底摧毁的过程,其目的是为了保护个人隐私或避免代码泄露。撕码可以将代码彻底删除,不留任何痕迹,极大地增强了数据安全性。
撕码应用广泛,尤其对于那些需要保护知识产权的企业是非常重要的。例如IT安全公司中对于源码的安全保密、司法机关中嫌疑人电脑硬盘数据的处理、个人因泄露而需要删掉代码等这些场景都需要用到撕码。
撕码有多种实现方式,一般可以通过覆盖数据、磁盘擦除、磁盘碎片化等技术手段来实现,同时还有一种专门的边缘设备撕码机,撕完码的芯片也会被粉碎。而在企业中,很多开发人员也使用特殊的插件和软件,将源码进行压缩、加密等操作,从而达到对源代码的保护和限制。
ROMçå®ä¹
ROM æ¯ ROM imageï¼åªè¯»å åéåï¼çç®ç§°ï¼å¸¸ç¨äºææºå®å¶ç³»ç»ç©å®¶çååä¸ãæºè½ææºé ç½®ä¸çROMæçæ¯ EEProm (çµæ¦é¤å¯ååªè¯»åå¨å¨)ï¼ç±»ä¼¼äºè®¡ç®æºç硬çï¼ä¸è¬ææºå·æºçè¿ç¨ï¼å°±æ¯å°åªè¯»å åéåï¼ROM imageï¼åå ¥åªè¯»å åï¼ROMï¼çè¿ç¨ã
常è§ç ROM image æ imgãzip çæ ¼å¼ï¼åè é常ç¨fastbootç¨åºéè¿æ°æ®çº¿å·å ¥ï¼çº¿å·ï¼ï¼åè éå¸¸ç¨ recovery 模å¼ä» sdå·å ¥ï¼å¡å·ï¼ï¼åº img éåä¹è¢«ç§°ä¸ºçº¿å·å ï¼zip éåä¹è¢«ç§°ä¸ºå¡å·å ã
å 为 ROM image æ¯å®å¶ç³»ç»æ常è§çåå¸å½¢å¼ï¼æ以é常ç©å®¶ä¼ä½¿ç¨ ROM è¿ä¸ªè¯æ代ææºçæä½ç³»ç»ã
å½å çå®å¶ç³»ç»å¼åè ï¼ç»å¸¸ä¼é·å ¥èªå·±ç产å究ç«æ¯åºè¯¥ç§°ä¸º OS è¿æ¯ UI çäºè®ºï¼ä¸ºäºé¿å æ¤ç±»äºè®ºå表示谦èï¼ä¼èªç§°ä¸º ROMãå¾å¤å®å¶ç³»ç»ç©å®¶ä¹ä¼ç»ä¸å°å®å¶ç³»ç»ç§°ä¸º ROMã
å 为系ç»æºç éè¦æå æè½æ为éåï¼æ以 ROM ä¹ä¼è¢«ç§°ä¸ºãå ãã