[经验] (转) F2FS文件系统架构与原理分析(一)——设计背景与功能

白丁   2015-12-27 12:38 楼主
转自http://blog.chinaunix.net/uid-28989651-id-3878690.html

        1 F2FS文件系统简介
        F2FS (Flash Friendly File System) 是专门为基于 NAND 的存储设备设计的新型开源 flash 文件系统。特别针对NAND 闪存存储介质做了友好设计。F2FS 于2012年12月进入Linux 3.8 内核。目前,F2FS仅支持Linux操作系统。
        F2FS 选择 log-structured文件系统方案,并使之更加适应新的存储介质(NAND)。同时,修复了旧式日志结构文件系统的一些已知问题,如(1)wandering tree 的滚雪球效应和(2)高清理开销。
        根据内部几何结构和闪存管理机制(FTL),闪存存储设备有很多不同的属性,所以F2FS的设计者增加了多种参数,不仅用于配置磁盘布局,还可以选择分配和清理算法,优化性能(并行IO提高性能)。
        1.1 F2FS文件系统的设计背景和要解决的主要问题        1.1.1 LFS(Log-strctured File System)
        为管理磁盘上的大的连续的空间以便快速写入数据,将 log 切分成 Segments,使用 Segment Cleaner 从重度碎片化的 Segment 中转移出有效的信息,然后将该 Segment 清理干净用于后续写入数据。
        1.1.2 Wandering Tree 问题
        在 LFS 中,当文件的数据块被更新的时候是写到 log 的末尾,该数据块的直接指针也因为数据位置的改变而更改,然后间接指针块也因为直接指针块的更新而更新。按照这种方式,上层的索引结构,如 inode、inode map 以及 checkpoint block 也会递归地更新。这就是所谓的 wandering tree 问题。为了提高性能,数据块更新的时候应该尽可能地消除或减少wanderingtree 的更新节点传播。
       
        1.1.3 Cleaning 开销
        为了产生新的 log 空闲空间,LFS 需要回收无效的数据块,释放出空闲空间,这一过程称为 Cleaning 过程。Cleaning 过程包含如下操作:
        (1)    通过查找 segment 使用情况链表,选择一个 segment;
        (2)    通过 segment summary block 识别出选中的 segment 中的所有数据块的父索引结构并载入到内存;
        (3)    检查数据及其父索引结构的交叉引用;
        (4)    选择有效数据进行转移有效数据。
        Cleaning  工作可能会引起难以预料的长延时,因而 LFS 要解决的一个重要问题是对用户隐藏这种延时,并且应当减少需要转移的数据的总量以及快速转移数据。
        2 F2FS文件系统特性和功能        2.1 F2FS不支持的特性和功能(后续可能会支持)
        当前F2FS不支持如下的特性,但是这些特性在以后如果必要的话也会支持:
        (1)    快照
        (2)    用户配额——最难实现
        (3)    不支持NFS
        (4)    不支持“security”方面的扩展特性(xattrs)
       
        2.2 F2FS的特性和功能
        F2FS具有以下特性和功能:
        (1)    最大文件系统16TB;
        (2)    32位块寻址空间;
        (3)    最大文件大小3.94TB;
        (4)    Log-structured;
        (5)    Flash 感知
        a) 扩大随机写区域(元数据区域,two-location)以获取更好的性能;
        b) 尽量使 F2FS 的数据结构与 FTL 的运算部件对齐。
        (6)    解决Wandering Tree 问题
        a) 用术语“node”表示 inode 以及各种索引指针块;
        b) 引入 Node Address Table (NAT) 包含所有“node”块的位置,这将切断数据块更新的递归传播。
        (7)    最小化Cleaning 开销
        a) 支持后台 Cleaning 进程;
        b) 支持 greedy 和 低成本(转移数据最少)的待清理 Section 选择算法;
        c) 支持 multi-head logs 用于动态/静态 hot 与 cold 数据分离;
        d) 引入自适应 logging 用于有效块分配。


training

回复评论

暂无评论,赶紧抢沙发吧
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 京公网安备 11010802033920号
    写回复