历史上的今天
返回首页

历史上的今天

今天是:2024年12月14日(星期六)

2021年12月14日 | Exynos4412 内核移植(四)—— MMU 相关知识解析

2021-12-14 来源:eefocus

一、MMU的产生


      许多年以前,当人们还在使用DOS或是更古老的操作系统的时候,计算机的内存还非常小,一般都是以K为单位进行计算,相应的,当时的程序规模也不大,所以内存容量虽然小,但还是可以容纳当时的程序。但随着图形界面的兴起还用用户需求的不断增大,应用程序的规模也随之膨胀起来,终于一个难题出现在程序员的面前,那就是应用程序太大以至于内存容纳不下该程序,通常解决的办法是把程序分割成许多称为覆盖块(overlay)的片段。覆盖块0首先运行,结束时他将调用另一个覆盖块。虽然覆盖块的交换是由OS完成的,但是必须先由程序员把程序先进行分割,这是一个费时费力的工作,而且相当枯燥。人们必须找到更好的办法从根本上解决这个问题。不久人们找到了一个办法,这就是 虚拟存储器(virtual memory).虚拟存储器的基本思想是程序,数据,堆栈的总的大小可以超过物理存储器的大小,操作系统把当前使用的部分保留在内存中,而把其他未被使用的部分保存在磁盘上比如对一个16MB的程序和一个内存只有4MB的机器,OS通过选择,可以决定各个时刻将哪4M的内容保留在内存中,并在需要时在内存和磁盘间交换程序片段,这样就可以把这个16M的程序运行在一个只具有4M内存机器上了。而这个16M的程序在运行前不必由程序员进行分割。


      任何时候,计算机上都存在一个程序能够产生的地址集合,我们称之为 地址范围。这个范围的大小由CPU的位数决定,例如一个32位的CPU,它的地址范围是0~0xFFFFFFFF (4G)而对于一个64位的CPU,它的地址范围为0~0xFFFFFFFFFFFFFFFF (64T),这个范围就是我们的程序能够产生的地址范围,我们把这个地址范围称为 虚拟地址空间,该空间中的某一个地址我们称之为 虚拟地址。与虚拟地址空间和虚拟地址相对应的则是 物理地址空间和物理地址,大多数时候我们的系统所具备的物理地址空间只是虚拟地址空间的一个子集,这里举一个最简单的例子直观地说明这两者,对于一台内存为256MB的32bit x86主机来说,它的虚拟地址空间范围是0~0xFFFFFFFF(4G),而物理地址空间范围是0x000000000~0x0FFFFFFF(256MB)。


     在没有使用虚拟存储器的机器上,虚拟地址被直接送到内存总线上,使具有相同地址的物理存储器被读写。而在使用了虚拟存储器的情况下,虚拟地址不是被直接送到内存地址总线上,而是送到内存管理单元—— MMU(主角终于出现了)。他由一个或一组芯片组成,一般存在与协处理器中,其功能是 把虚拟地址映射为物理地址。

 


二、MMU工作过程


      大多数使用虚拟存储器的系统都使用一种称为分页(paging)。虚拟地址空间划分成称为页(page)的单位,而相应的物理地址空间也被进行划分,单位是页框(frame).页和页框的大小必须相同。接下来配合图片我以一个例子说明页与页框之间在MMU的调度下是如何进行映射的:

       这里提到了一个概念,就是 页表,下面将详细介绍 页表。


三、页表


         首先让我们来介绍一个概念-页表(page table)。页表就是存储在内存中的一张表,表中记录了将虚拟地址转换成物理地址的关键信息。MMU正是通过对页表进行查询,实现了地址之间的转换。也就是说,MMU每次工作的时候都要去查这张表,从中找出与虚拟地址相对应的物理地址,然后再进行数据存取。页表的作用如下图所示。

       页表中的条目被称为页表项(page table entry),一个页表项负责记录一段虚拟地址到物理地址的映射关系,稍后我们会详细介绍。


       既然页表是存储在内存中的,那么程序每次完成一次内存读取时都至少会访问内存两次,相比于不使用MMU时的一次内存访问,效率被大大降低了,如果所使用的内存的性能比较差的话,这种效率的降低将会更明显。因此,如何在发挥MMU优势的同时使系统消耗尽量减小,就成为了一个亟待解决的问题。


     于是,TLB产生了。TLB是什么呢?我们叫它转换旁路缓冲器,它实际上是MMU中临时存放转换数据的一组重定位寄存器。既然TLB本质上是一组寄存器,那么不难理解,相比于访问内存中的页表,访问TLB的速度要快很多。因此如果页表的内容全部存放于TLB中,就可以解决访问效率的问题了。

         然而,由于制造成本等诸多限制,所有页表都存储在TLB中几乎是不可能的。这样一来,我们只能通过在有限容量的TLB中存储一部分最常用的页表,从而在一定程度上提高MMU的工作效率。


        这一方法能够产生效果的理论依据叫做存储器访问的局部性原理。它的意思是说,程序在执行过程中访问与当前位置临近的代码的概率更高一些。因此,从理论上我们可以说,TLB中存储了当前时间段需要使用的大多数页表项,所以可以在很大程度上提高MMU的运行效率。


       让我们接着聊页表。页表是由页表项组成的,每一个页表项都能够将一段虚拟地址空间映射到一段物理地址空间中。这里所谓的这段虚拟地址空间,更专业地讲,应该叫页,一个页对应了页表中的一项,页的大小通常是可选的。在ARM中,一个页可以被配置成1K、4K、64K或1M大小(ARM v6体系以后,不再支持1K大小的页),分别叫做微页、小页、大页和段页。页的大小决定了映射的粒度,是根据实际应用有选择地配置的。以1M为例,按照我们前面的描述,假设系统中将有64M内存需要被映射,那么我们一共需要64M/1M个页表项,而每个页表项需要占据4个字节,也就是说,有256字节的内存要专门负责地址映射,不能用于其他用途。


       对于1K、4K和64K大小的页,MMU采用二级查表的方法,即首先由虚拟地址索引出第一张表的某一段内容,然后再根据这段内容搜索第二张表,最后才能确定物理地址。这里的第一张表,我们叫它一级页表,第二张表被称为是二级页表。采用二级查表法的主要目的是减小页表自身占据的内存空间,但缺点是进一步降低了内存的寻址效率。不同大小的页对查表方法的支持程度如表3-1所示。


表3-1  不同大小页的查表方法

 image.png?imageView2/2/w/550

下面,首先来研究一下相对简单的一级查表。


1、一级查表


       一级查表只支持大小为1M的页。准确地讲,这里所谓的1M大小的页,应称为段(section)。此时,一级页表也被称为段页表。图3-4描述了段页表的内存分布情况和段页表项的具体格式。

图3-4  段页表项的结构


      段页表中的每一项都类似于上图中的形式,其中:


      (1)31~20位段表示物理地址的基地址,一共12位,也就是说,如果我们通过虚拟地址找到某一个段页表项,那么就可以确定这段虚拟地址所对应的物理地址的高12位了。因为段页表项后20位正好可以描述1M的内存,因此基地址每增加一个单位,物理地址就会增加1M空间。所以,我们也可以说该基地址表示了虚拟地址属于哪1M范围的物理地址。由此可知,使用段页表进行地址映射时,每一页能够描述1M的物理地址空间。进一步讲,段页表最多支持1024个页,最多占用系统4K字节的内存来存放页表。


      (2)11~10位是AP位,区分了用户模式和特权模式对同一个页的不同访问权限。例如,当AP位为"11"时,表示任何模式下都可以对该空间进行读写,"10"则表示特权模式可读写该页,而用户模式只能读取该页。对AP位详细的描述请参考页权限一节。


      (3)8~5位代表该页所属的域。在ARM体系结构中,系统中规定了16个域,因此使用4个位就能表示该页属于哪个域,而每一个域又有各自独立的访问权限,从而实现了初级的存储器保护。


      (4)3位和2位分别代表cache和write buffer。相应的位为1则表示被映射的物理地址将使用cache或write buffer。关于cache和write buffer的有关内容,我们稍后会详述。


      (5)1~0位。这两位用来区分页表类型,对于段页表,这两位的值总是为"10"。


        总的来说,段页表项的内容虽然复杂,但归结起来无非就是两个问题,一是,如何解决某一虚拟地址属于哪段物理地址,二是,如何确定这段地址的访问权限。使用其他形式的页表,本质上也是要解决这两个问题。


       现在,假设段页表已经被成功地添加到内存之中了,那么接下来的问题是我们应该怎样通过一个虚拟地址找到与之对应的段页表项呢?找到页表项之后,又是怎样找到对应的物理地址的呢?


      很显然,虚拟地址本身就可以解决上述问题。


      如下图所示,首先,我们要让MMU知道段页表在内存中的首地址,也就是图中所说的页表基地址,因为段页表是我们通过程序确定的,存储在什么位置程序员自然清楚。然后,在CPU需要寻址的时候,MMU就可以自动地利用页表将虚拟地址映射为物理地址并寻址物理地址,其步骤如下:


    (1)MMU取出虚拟地址的前12位作为页表项的偏移,结合页表基地址,找到对应的页表项。具体来说,就是将这12位数取出,然后左移两位和页表基地址相或,就能得到相应页表项的地址了。例如,页表基地址是0x10000000,如果虚拟地址是0x00101000,则前12位数是0x001,那么根据上述步骤将其左移两位,结果为0x004,那么页表项地址就应该是0x10000000|0x004=0x10000004,从该地址中读取的32位的数据即是该虚拟地址所对应的页表项。


     (2)找到与虚拟地址对应的页表项之后,就可以从该页表项中读出一个重要信息,如图3-4所示,页表项的前12位定位了该虚拟地址所对应的物理地址在哪个范围内。例如,从0x10000004中读出的页表项的内容为0x30000c12,那么我们就已经知道了,虚拟地址0x00101000对应的物理地址在0x30000000与0x30100000之间。既然地址范围已经清楚了,那么虚拟地址又该定位到该范围的哪个位置呢?这就要靠虚拟地址的后20位了。

图3-5  段页表映射过程


        3)MMU将虚拟地址后20位和页表项内容清除掉后20位之后的结果做与的操作,就得到了与虚拟地址对应的实际物理地址了。例如,页表项的内容为0x30000c12,清除掉后20位的结果为0x30000000,虚拟地址的后20位为0x01000,将其和0x30000000相与,结果为0x30001000,这便是最终的物理地址。


      当然,MMU在进行地址映射期间,还要进行访问权限的检查,方法是读出页表项的权限位,按照既定规则去检查,如果允许对该地址进行访问则正常访问,如果不允许访问,则抛出异常,通过程序将其捕获并处理。这便是使用段页表时MMU的地址映射过程。

示例:viraddr是0xc000 0000 映射到 phyaddr 0x2000 000

2、二级页表:


可以让我们访问的内存不是连续的


我们也可以选择使用二级查表的方式去实现地址映射。从原理上讲,一级查表和二级查表其实并没有太大的差别。使用二级查表法,经过一级页表得到的数据不再是记录了物理地址信息的数据了,而是二级页表项的索引信息。而这些信息除了相应位和标志与一级页表项略有不同之外,与一级查表并无不同。


线性地址高10位---------索引页目录表----------->找到相应页表


线性地址中间10位---------索引页表----------->得到页表中相应的项,其中的高20位就是物理地址的高20位


线性地址低12位-------------------->物理地址的低12位

推荐阅读

史海拾趣

B&K Precision公司的发展小趣事

为了进一步拓展国际市场,B&K Precision在全球范围内设立了多个分公司和办事处。其中,2012年在中国设立的分公司百科中国仪器有限公司是一个重要的战略布局。这一举措不仅加强了公司在亚洲市场的地位,也为各地客户提供了更为迅速和便捷的售后服务保障。同时,通过与国际知名企业的合作与交流,B&K Precision不断吸收先进的技术和管理经验,为公司的持续发展注入了新的动力。

以上五个故事,展现了B&K Precision公司从车库起步到成为全球电子测量领域领导者的发展历程。通过不断创新和拓展业务,公司成功应对了市场变化和挑战,成为了电子行业中的佼佼者。

EDI [Electronic devices inc.]公司的发展小趣事

在1950年代,Eclipse Magnetics公司决定将他们的磁铁涂上红色,并与马蹄形标志和公司颜色相匹配。这个简单的改变在当时看似微不足道,但却成为了一个重要的转折点。红色磁铁不仅提升了产品的视觉吸引力,还增强了品牌识别度。随着红色磁铁的广泛应用,Eclipse Magnetics开始逐渐在电子行业中崭露头角。

富之光(Fujicon)公司的发展小趣事

为了寻求更广阔的发展空间,富致科技积极参与各类产业交流活动。例如,在2023年7月,富致科技的董事长陈继圣和总厂长叶敬强前往中国大陆芜湖市进行考察交流,参观了奇瑞新能源汽车股份有限公司等企业,并与芜湖宏景电子、安瑞光电、致通汽车电子等产业链相关企业进行了深入交流。这些交流不仅让富致科技更加了解大陆市场的需求和潜力,也为双方未来的合作奠定了良好的基础。

Gigavac LLC公司的发展小趣事

随着全球化进程的加速,富致科技也积极实施国际化战略。公司不仅在欧洲、北美等地设立了销售和服务网络,还通过参加国际展会、建立海外研发中心等方式,不断提升品牌影响力和市场竞争力。同时,富致科技还注重与全球顶尖企业和研究机构的合作,共同推动PPTC技术的创新与发展。

Electronic Sensor + Resistor GmbH公司的发展小趣事

Electronic Sensor + Resistor GmbH(简称ESR公司)的创立源于两位电子工程师的远见卓识。他们发现市场上对于高精度电子传感器和定制电阻器的需求日益增长,但现有产品往往无法满足特定应用的性能要求。于是,ESR公司应运而生,专注于研发和生产高性能的电子传感器和电阻器。

在创业初期,ESR公司面临着资金、技术和市场的三重挑战。但凭借其卓越的研发实力和坚持不懈的市场推广,公司逐渐在市场上树立起高品质、高可靠性的品牌形象。通过与多家知名企业的合作,ESR公司的产品逐渐获得了市场的认可。

Honeywell公司的发展小趣事

背景:随着科技的进步,霍尼韦尔开始将目光投向更广阔的领域,其中航空航天成为重要的发展方向。

发展:霍尼韦尔在航空航天领域取得了多项技术突破,其仪器仪表和控制系统在多个重要项目中发挥了关键作用。其中,最著名的莫过于1969年阿波罗11号登月任务中,霍尼韦尔的仪器仪表为宇航员提供了稳定的控制和导航支持。

关键事件:阿波罗11号任务的成功不仅展示了霍尼韦尔在航空航天领域的实力,也进一步提升了公司的国际声誉和市场地位。

问答坊 | AI 解惑

TMS320x280x DSP 引导ROM

TMS320x280x DSP 引导ROM…

查看全部问答>

DIY三轴加速度传感器STEP 1:震动报警

基于LPC1343与三轴加速度传感器 的震动报警装置 Author: chenzhufly Email: chenzhufly@126.com 2010-05-18 系统硬件框图: 系统硬件主要有以下几部分组成: LPC1343: 主控,协调各部分的工作; SYS_LED: 指示系统正在工作; BEEP: ...…

查看全部问答>

YLP2440核心板内存能扩到256M吗

YLP2440核心板内存能扩到256M吗. YLP2440核心板带有64M RAM, 由于项目需要扩到256M,请问这个好能实现吗,是不是仅添加两根地址线就可以了? 2440的BANK为128M,这样需要2个BANK,硬件上需要那些改动?…

查看全部问答>

在at91rm9200上使用u-boot-1.1.4加载linux-2.6.17问题

我是新手请请教      在at91rm9200上使用u-boot-1.1.4加载linux-2.6.17问题 现在的问题: 1:u-boot不能自动加载内核,必须在u-boot的命令提示符下自己输入装载命令bootm 10080000         & ...…

查看全部问答>

求助!!EVC对话框程序退出后桌面显示不正常

在网上找到一个隐藏任务栏的代码: HWND hTaskBarWnd=::FindWindow(_T(\"HHTaskBar\"),NULL);              if   (hTaskBarWnd)           &nb ...…

查看全部问答>

更新IV:FirmwareLib在EK_STM32F上的学习体会(I2C/IWDG)

继续,上一贴是:更新III:Firmware Lib在EK_STM32F上的学习体会(FLASH/GPIO)再早的几个帖子链接可以在上一贴内找,就不一个一个列出来了,等全系列结束了来个总集。-----------------------I2C分隔线-----------------------------------Exem ...…

查看全部问答>

【MSP430共享】基于全球移动通信系统网络的远程数据监控系统的设计

介绍了一种基于全球移动通信系统 ( G S M )网络的远程数据监控系统。硬件部分包括 T C 3 5 模块、单片机 M S P 4 3 0 F 1 4 7 、电平转换电路、传感器和电源,系统采用单片机控制 T C 3 5 模块,在软件设计方面,通过把与短消息服务有关的 A T ...…

查看全部问答>

msp430 编程问题

#pragma dataseg = DATA__no_init uint16 StackCheck @ 0x350;#pragma dataseg = default 上面语句啥意思啊,希望大侠们帮帮忙。有资料的话,希望发份给我看看 …

查看全部问答>

【C2000 LaunchPad】单相交流电压+电流表__显示篇

春暖花开,我为TI C2000 LaunchPad“画”外围! 显示部分兼容1602及12864(控制器T7290,带字库)。 管脚定义: RS————GPIO17 RW————GPIO16 VO————GPIO12 D0————GPIO0 .           &nbs ...…

查看全部问答>

编译出错 can't resolve multiple constant drivers for net cnt_count[3]

请求大侠 以下程序cnt_count哪边出错了啊 module tx_uart(clk_100, rst, tx_shuju, tx_flag, tx_data, tx_finish_flag); input                clk_100; input      &nb ...…

查看全部问答>