单机架构:该架构方案把所有目录树单机全内存,可做到低延迟,但是无法横向扩展,最大规模仅支持 10 亿文件数,代表产品为 HDFS。
基于子树划分: 该架构方案通过将层级目录树拆分成多个子树,并将每颗子树按照相应的负载策略部署到不同的 Meta 节点中,但缺点是容易产生热点,负载均衡难以实现,扩展性不够好,同时难以做到跨子树的 Rename,典型的实现如 HDFS Federation、CephFS、IndexFS。
基于分布式事务数据库:上层维护了一层元数据语义层,该层将目录树操作转化为数据库事务请求。下层是分布式数据库,负责元数据的存储管理,目录树中的每个 inode 节点对应数据库中的一行记录。此方案可以做到单集群文件数规模无上限,这也是目前的技术趋势,典型的实现如 Facebook Tectonic。