`

Linux系统编程学习笔记(七)内存管理

阅读更多
内存管理:
对于一个进程来说,内存是最基本的也是最重要的资源之一。内存管理包括:内存分配、内存操作和内存释放。
1、进程地址空间:
Linux将物理内存虚拟化,内核为每一个进程维护一个特殊的虚拟地址空间。这个地址是线性的,从0开始,
到某个最大值。
1)页和页面调度
虚拟地址空间由很多页组成。系统的体系结构和机型决定了页的大小,典型的页大小包括4kb(32位系统)
和8k(64位系统)。每个页面都只有无效和有效两种状态:一个有效的页面和一个物理页或者一个二级存储
介质相关联(一个交换分区或者一个一盘文件),一个无效页没有关联,代表没有分配或者使用。地址空间
无须是连续的,虽然是线性编址,但是中间也有很多未编址的小区域。
2)共享和复制
虚存中的多个页面,甚至是属于不同进程的虚拟地址空间,也有可能被映射到同一个物理页面。这样允许不同
的虚拟地址空间共享物理内存的数据。
另一种情况是MMU会截取这次写操作并产生一个异常;作为回应,内核会透明的创造一份这个页的拷贝以供该
进程进行写操作,这种方式被称为写时拷贝。
3)内存区域
每一个进程都有以下区域:
1)文本区域:包含了程序的代码,字符串,常量和一些只读数据。在Linux中,文本段被标示为只读,并且直接
从目标文件映射到内存。
2)栈段(stack segment)包括了一个进程的执行栈,随着栈的深度动态的增长和收缩。包括程序的局部变量和函数的返回值。
3)数据段,又叫堆,包含了一个进程动态存储空间。它的大小可以变化,是有malloc动态申请,free动态释放的。
4)bss段(bss segment)包含了没有被初始化的全局变量。这些变量根据不同的c标准都有相应的初始值。
Linux从两个方面优化:首先,这个段是用来存放没有初始化的数据,所以连接器实际并不会将特殊的值存储在对象文件,
这样可以减少二进制代码文件的大小。其次,当这个段被加载到内存时,内存只需要简单的根据写时复制的原则将它们
映射到一个全是0的页上,这样非常高效的设置了初始值。
5)很多地址空间包含多个映像文件,比如可执行文件的本身、c和其他的链接库,还有数据文件。可以查看/proc/self/maps
或者pmap的输出查看进程的映像文件。
2、动态申请内存:
内存可以通过自动变量或者静态变量获得,但是所有的内存管理系统的基础都是动态内存的分配、使用和最终的释放。
动态内存是在进程运行时才分配的,而不是在编译时就分配好了,分配的大小也只有在分配时才确定。
1)C中最经典的为获得动态内存的接口是malloc:
#include <stdlib.h>

void *malloc(size_t size);

成功时,malloc会得到size大小的内存区域,并返回一个指向这部分内存首地址的指针。这块内存区域内容未定义,不要自认为
全是0,失败是返回NULL,并设置errno错误值为ENOMEM。
例子:
char *p;

p = malloc(2048);
if(!p)
	perror("malloc");

或者这样的:
struct treasure_map *map;

map = malloc(sizeof(struct treasure_map));
if(!map)
	perror("malloc");

每次调用时,c会自动把返回值由void指针转换为需要的类型,但是c++不提供这种自动转换。
因而需要使用者强制转换。
2)数组分配:
当所需分配的内存大小本身是可变时,动态内存将更复杂。为数组分配动态内存是一个很好的例子:
数组元素的大小已经确定,但是元素的个数是变化的,为了处理这种情况,c提供了一个calloc函数:
#include <stdlib.h>

void *calloc(size_t nr,size_t size);

成功返回指向一个可以存储下整个数组的内存(nr个元素,每个size个字节),
失败返回NULL,并设置errno为ENOMEM。
以下是使用malloc和calloc申请方法:
int *x, *y;
x = malloc(50 * sizeof(int));

if(!x){
	perror("malloc");
	return -1;
}

y = calloc(50,sizeof(int));
if(!y){
	perror("calloc");
	return -1;
}

但这两个函数的行为是有区别的,与malloc不同的是,calloc将分配的区域全部初始化为0。
memset可以用指定得值填充指定的内存块,但calloc会更快,因为内核可以提供本已清0的
内存块。
3)调整已存在内存大小:
C语言提供了一个接口来改变已经得到的动态内存大小:
#inlcude <stdlib.h>

void *realloc(void *ptr, size_t size);

成功调用realloc将ptr指向的内存区域的大小为size字节。它返回一个指向新空间的指针,当
试图扩大内存空间时,由于不能在已有的空间增加size大小,返回的指针可能不再是ptr,这需要
申请另外一块size大小的空间,将原本的数据拷贝到新空间中,然后再将旧的空间释放,所以
可能相当耗时。
如果size是0,效果就跟ptr上调用free相同。
如果ptr是NULL,则效果和malloc一样,如果ptr是非NULL的,那么它必须是malloc,calloc和
realloc之一的返回值。
失败时返回NULL,并设置errno为ENOMEM,这时ptr指向的内存区域没有改变。
p = calloc(2,sizeof(struct map));
if(!p){
	perror("calloc")
	return -1;
}
/**使用p[0],p[1]**,使用完想复用p的内存空间**/
 
r = realloc(p,sizeof(struct map));
if(!r){
	perror("realoc");
	return -1;
}
free(r);

3、动态内存的释放:
自动内存分配,当栈不在使用,空间会被自动释放,而动态内存空间需要显示的释放,否则会一直占用进程的地址
空间,导致内存泄露。
当通过malloc、calloc、realloc分配到的内存不再使用的时候,需要使用free来将内存归还给系统:
#include <stdlib.h>

void free(void *ptr);

ptr可能是NULL,但是free这时候什么不做就返回了,不需要调用free之前检查ptr是否为NULL。
4、对齐:
数据对齐是指数据地址和由硬件确定的内存块之间的关系,一个变量的地址是它大小的整数倍,就叫做自然对齐。
如果一个32bit长的变量,它的地址是4(字节)的整数倍,那么这就是自然对齐了。所以一个大小为2n个字节的
变量,那么它的地址中,至少低n为是0,才能自然对齐。
对齐是由硬件规定的,载入一个没有对齐的数据可能导致处理器错误或者性能的下降,在编写可移植的代码时,应
注意对齐问题。
在大多数情况下,编译器和c库会自动处理对齐问题。POSIX规定通过malloc、calloc、realloc返回的内存对于c中
的标准类型应该是对齐的,在linux中,这些函数返回的地址在32位系统中以8字节为边界对齐,64为则以16字节为
边界对齐。
有时候,对于更大的边界,例如页面,程序员需要动态的对齐。POSIX提供了一个叫posix_memalign的函数:
#include <stdlib.h>

int posix_memalign(void **memptr, size_t alignment, size_t size);

成功返回0,并且保证按照alignment对齐。参数aligment必须是2的整数幂和void指针大小的倍数。
失败返回:
EINVAL:参数不是2的幂,或者不是void指针的整数倍。
ENOMEM:没有足够的内存。
例子:
char * buf;
int ret;
ret = posix_memalign(&buf,256,1024);//申请1kb,256-byte边界对齐
if(ret){
	fprintf(stderr,"posix_memalign: %s\n",strerror(ret));
}
free(buf);

其他对齐问题:
比如复杂的类型,不同类型的指针进行赋值以及强制类型转换。
使用时可以按照下列四条规则:
1、一个结构的对齐要求和它的成员中最大的那个类型是一样的。
2、结构体也引入对填充的需求,以此来保证每一个成员都符合各自对齐要求。
如果一个char后跟着一个int,编译器会自动插入3个字节作为填充来保证int
是4字节对齐的。程序员应该注意成员变量的顺序,来减少填充导致的空间浪费,比如
可以按照成员变量的大小顺序来排序。gcc编译加入-Wpadded选项可以帮助你应付这个问题。
3、一个联合的对齐和联合最大的类型一致。
4、一个数组的对齐和数组元素类型一致。
指针从一个较少的字节对齐强制转化成一个较多字节的对齐类型,当通过这样的指针访问时,
会导致处理器不能对较多字节类型的数据正确对齐。比如:
char greeting[] = "Ahoy Matey";
char * c = greeting[1];
unsigned long badnews = *(unsigned long *) c;

后果不同的系统各部相同,小则性能损失,大则整个程序崩溃。在发现不能处理对齐错误的体系
结构中,内核向出问题的进程发送SIGBUS信号来终止进程。

5、数据段的管理:
linux提供了直接管理数据段的接口,然而由于malloc和其他的方法更强大和易于使用,大多数程序
都不会使用这些结构,但是如果你想基于堆的动态分配机制,可以使用这些接口。
#include <unistd.h>

int brk(void *end);
void *sbrk(intptr_t increment);

堆中动态存取器的分配有数据段底部向上生长,栈从数据段的顶部向下生长。堆和段之间的分界线
叫做中断(break)或者中断点(break point)。
调用brk会设置中断点(数据段的末端)地址为end。成功返回0,失败返回-1,并设置errno为ENOMEM。
sbrk可以将数据末端增加increment字节,increment可正可负。
POSIX和C没有定义这些函数,但几乎所有的UNIX系统都至少支持其中之一。

6、变长数组:
C99引入了变长数组,变长数组的长度在运行时决定,而不是编译的时候:
void fun(int size){
	char foo[size];
	/* do something with foo */
}

foo被动态的创建,并且在作用域之外自动释放。
int open_sysconf(const char *file, int flags, int mode){
	const char *etc = SYSCONF_DIR;
	char name[strlen(etc) + strlen(file) + 1];
	strcpy(name,etc);
	strcat(name,file);
	return open(name,flags,mode);
}

7、存储器操作:
C语言提供了很多函数进行内存操作。这些函数的功能和字符串操作函数(strcmp,strcpy)类似,但他们处理的对象
是用户提供的内存区域,而不是字符串。这些函数不返回错误信息,因此防范错误时程序员的责任。
1)字节设定:
#include <string.h>

void *memset(void *s, int c, size_t n);

将从s指向区域开始的n个字节设置为c,并返回s,它经常被用于将一块内存清零:
memset(s,'\0',256);

calloc从内存中获得一个已经清零的内存,效果会更好。
2)字节比较:
#include <string.h>

int memcmp(const void *s1, const void *s2, size_t n);

比较s1和s2的头n个字节,如果内存相同则返回0,如果s1 < s2则返回小于0的数,否则返回大于0的数。
3)字节移动:
memmove复制src的前n个字节到dst,返回dst:
#include <string.h>

void * memmove(void *dst, const void * src, size_t n);

memmove可以安全的处理内存区重叠的问题。
C标准定义了一个不支持内存区域重叠的memmove的变种,效率可能更高一些:
#include <string.h>

void *memcpy(void *dst, const void *src, size_t n);

如果重叠,结果未定义。
另一个安全的复制函数memccpy():
#include <string.h>

void *memccpy(void *dst, const void *src, int c, size_t n);

这个函数和memcpy类似,但如果它在src的前n个字节发现c,那么就停止拷贝,返回指向dst中c后一个字节的指针,
或者没有找到c时返回NULL。
#include <string.h>
#include <stdio.h>

int main(){
	char a[] = "string[a]";
	char b[] = "string[b]";
	memccpy(a,b,'b',sizeof(b));
	printf("memccpy():%s\n",a);
}

mempcpy:
#include <string.h>

void *mempcpy(void *dst, const void *src, size_t n);

和memcpy功能类似,但是返回的是被复制内存的最后一个字节的下一个字节指针。当在内存中有连续的
一系列数据需要拷贝时比较有用。
4)字节搜索:
#include <string.h>

void *memchr(const void *s, int c, size_t n);

函数返回指向第一个匹配c的字节指针,如果没有找到c则返回NULL。
memrchar和memchr类似,只是从反向搜索:
#include <string.h>

void *memrchr(const void *s, int c, size_t n);

memrchr是GNU的扩展函数,不是C语言的一部分。
在一块内存中搜索任意的字节数组:
#include <string.h>

void *memmem(const void *haystack, size_t haystacklen, const void *needle, size_t needlelen);

这个函数名字比较烂,它在指向长度为haystacklen的内存块haystack中查找,并返回第一块和长为needlelen
匹配的子块指针。如果找不到,返回NULL,这个同样是GNU的扩展函数。

0
0
分享到:
评论

相关推荐

    Linux系统编程学习笔记

    它涵盖了多个方面,包括文件操作、进程管理、内存管理、网络编程等。 Linux系统编程涵盖了众多领域,从基础的文件操作到高级的网络通信和多线程编程,为开发者提供了广泛的功能和灵活性。在这个领域工作的开发者需要...

    linux网络编程学习笔记

    片是低字节在内存地址的低端,高字节在高端,而 alpha 芯片却相反. 为了统一起来,在 Li nux 下面,有专门的字节转换函数. unsigned long int htonl(unsigned long int hostlong) unsigned short int htons(unisgned ...

    linux学习笔记(包含Linux系统和shell编程).rar

    系统内存管理 内核通过硬盘上称为交换空间(swap space)的存储区域来实现虚拟内存。内核在交换空间和实际的物理内存之间反复交换虚拟内存中的内容。这使得系统以为自己拥有比物理内存更多的可用内存。 内存被划分为...

    Posix多线程编程学习笔记1~6

    Posix多线程编程学习笔记1~6,包括线程基础,线程属性,信号灯,条件变量,互斥变量,共享内存六部分内容。很有助于linux下多线程的开发。文档主要包含介绍相应的pthread接口函数,并举了部分相应的例子。

    02_Linux内核分析及编程高清pdf版(2-2)

    全书分为20章,内容包括进程管理、进程间通信、内存管理、文件系统、I/O接口及资源管理、内核的编译及调试原理、网络通信、内核安全、USB驱动程序等。 对于想了解Linux开发,以及从事Linux内核编程的开发人员来说,...

    嵌入式ARM linux学习资料集合

    这是本人集合了一些ARM linux学习资料,包含了《ARM体系结构与编程-杜春雷》,linux物理内存管理,linux下的连接脚本基础,嵌入式linux系统开发技术等一些相关资料,希望对爱好者有用!

    c#学习笔记.txt

    c#学习笔记(1) 51099在线学习网发布 文章来源:网络收集 发布时间:2006-05-25 字体: [大 中 小] 51099在线学习网 http://www.51099.com 1, 结构(struct) 与 类(class) [attributes] [modifiers] struct ...

    java jdk8 学习笔记

    windows系统的可执行文件是.exe和.bat ,Linux系统的可执行文件是有执行权限的文档。 6.java -cp/-classpath .;C:\workspace;C:\lib\abc.jar 指定jvm寻找.class文件路径的方法有三种,分别是从当前目录下寻找、...

    关于学习笔记整理,包括Linux、Java、数据结构和算法,和一些IT工具的使用.zip

    Java是一种高性能、跨平台的面向...自动内存管理(垃圾回收): Java具有自动内存管理机制,通过垃圾回收器自动回收不再使用的对象,使得开发者不需要手动管理内存,减轻了程序员的负担,同时也减少了内存泄漏的风险。

    Linux-Cpp-Development-Advanced-Learning::smirking_face:Linux Cpp 后台开发进阶学习,校招必学:操作系统、计算机网络、网络编程、并发实战、数据库原理、设计模式、Linux内核笔记、Linux命令和Git等。校招笔记、项目,你值得拥有

      本项目用于Linux Cpp后台开发秋招学习,内容主要涵盖以下几个部分:Cpp进阶,操作系统, 计算机网络, Linux内核,MySQL数据库, Redis数据库, 数据结构与算法,Leetcode刷题等内容。我会对校招所需掌握的基础...

    Linux的常用命令cat、sed、zip等用法,以及shell编程的基本语法,以及makefile编写方式等等

    这个是我在学习Linux的时候做的思维导图笔记,主要是Linux的一些基础知识。免费提供下载,学习分享。 该文档分为以下几个部分: 1.shell语法:包含格式化输入输出、数组定义、变量定义方法、运算方法、流程控制、...

    java基础学习笔记 java整合技术 java工具类.rar

    简单性:相对于其他编程语言而言,java较为简单,例如:java不再支持多继承,C++是支持多继承的,多继承比较复杂,C++中有指针,java中屏蔽了指针的概念,避免了绝大部分的指针越界和内存泄露的问题,这里说明一下,...

    国嵌笔记。全集全集

    本人学习的国嵌笔记。操作详细! 第一季 精通嵌入式 4 一. 安装tftp服务器 4 二. Samba服务器安装 4 三. NFS服务器 5 四. 安装vsftpd FTP服务器 5 第2季-裸奔吧-ARM 6 一. 安装交叉编译器 6 二. 安装驱动 6 三...

    java面试笔试题库java学习笔记开发教程互联网公司面试资料大全合集.zip

    JavaEE学习笔记.pdf java_Java_学习笔记.pdf Java_Performance.pdf java代码效率优化.docx Java内存模型的历史变迁.docx Java在游戏服务器开发中的应用.docx java基础总结大全.txt Java开发与技术挑战——关于技术的...

    LearningNote:C++和Linux学习笔记

    提高C++程序员的自我修养 from 剖析STL内存分配器 编译器优化之 Empty Base Class Optimization 走近 std::tuple,揭秘异质容器 走近vtpr、vtbl,揭秘动态多态 走近 name mangling,揭秘函数重载本质 多线程编程...

    CSAPP(深入理解计算机系统)

    本书的主要论题包括:数据表示、C程序的机器级表示、处理器结构,程序优化、存储器层次结构、链接、异常控制流、虚拟存储器和存储器管理、系统级I/O、网络编程和并发编程。书中所覆盖的内容主要是这些方面是如何影响...

    深入理解计算机系统(英文版)

    本书的主要论题包括:数据表示、C程序的机器级表示、处理器结构,程序优化、存储器层次结构、链接、异常控制流、虚拟存储器和存储器管理、系统级I/O、网络编程和并发编程。书中所覆盖的内容主要是这些方面是如何影响...

    自己动手写操作系统(含源代码).part2

    首先是操作系统的名字改变了,原因在于虽然我们的试验性 OS从前辈们那里借鉴了很多东西,但其各个部分的设计(比如文件系统和内存管理)往往有其独特之处,所以我将原先的 Tinix(本意为 TryMinix)改成了新名字...

Global site tag (gtag.js) - Google Analytics