X

Web3.0专题:基于区块链构建基础设施,有望加速部署分布式存储

(报告出品方/作者:东方证券,张颖,周天恩,王婉婷)

一、 Web 3.0:概念由来与发展方向

2021 年 12 月 8 日,美国众议院金融服务委员会在国会山举行了“数字资产和金融的未来:了解 美国金融创新的挑战和利益”为题的听证会,包括共和党和民主党在内的两党议员都有参与。出 席的加密公司分别来自 FTX,Circle,Coinbase、Bitfury、Paxos、Stellar。而在此次听证会上, BitFury 的首席执行官 Brian Brook 还向议员科普了“Web3.0”概念。

2022 年 3 月 11 日,日本自民党代表盐崎明久在众议院财政金融委员会上表示,日本应该将 Web3.0 作为国家战略的中心,并任命一位负责 Web3.0 的官员;2022 年 3 月 15 日,美国德克萨 斯州奥斯汀市长已经指示城市经理帮助创造一个有利的政府和社区环境,支持区块链和 Web 3.0 等新技术的创建。

2022 年 3 月 17 日,中国证监会科技监管局局长姚前在《中国金融》发表文章表示,Web3.0 是 渐行渐近的新一代互联网。随着当前各类信息技术的迭代创新,互联网正呈现向下一代互联网演 进的趋势。这一演进或将引发新一轮的信息革命,进一步深刻改变人们的生活、工作以及社会的 方方面面。

1.1、 概念演进

不同阶段的互联网根据技术的演进,同时针对用户的需求提供不同的服务。互联网的历史中已经 历了 Web 1.0 与 Web 2.0 两个时代,现阶段行业正对于 Web 3.0 的架构、技术进行探索。

Web 1.0 即第一代互联网,主要由基本的网页、Web 浏览器、简易 Web 开发工具构成。而这些基 础的网页可以第一次被访问并实现商业化。同时 Web 1.0 时期也涌现出了 HTTP,HTML 和 XML 等协议,Java 和 Javascript 等软件语言也起源于这段时间。

Web 2.0 即第二代互联网。在这一时期,网络创建者更注重用户的交互作用:用户既是网站内容 的消费者(浏览者),也是网站内容的制造者。Web 2.0 网站内容基于用户提供,网站的诸多功 能也由用户参与建设,实现了网站与用户双向的交流与参与。因此,用户在 web2.0网站系统内拥 有自己的数据。

Web 3.0 的核心理念是将数据的所有权归还给用户,允许用户控制自己的数据,在保障安全性的 前提下,实现数据的互操作性。

1.2、 区块链在 Web 3.0 中的重要性

Web 3.0 提出了一种去中心化的替代方案,这种去中心化模式可以应用于网络生态系统的任何部 分,包括虚拟主机、存储、域名系统、应用程序和搜索功能。在这一过程中,区块链在改变传统 的数据存储和管理方法方面发挥着至关重要的作用。区块链提供了一个独特的数据集合或一个通 用状态层,它受到集体管理的约束。独特的状态层为在互联网上开发价值结算层提供了机会。状 态层有助于以复制权受保护的方式发送文件,以便在没有任何中介的情况下实现有效的 P2P 交易。 Web 3.0 包括统一身份认证系统、数据确权与授权、隐私保护与抗审查、去中心化运行等关键特 征。基于区块链思维而进化出的全新网络形态如以太坊,以及在以太坊上所建立的一些去中心化 的应用是目前 Web 3.0 的代表性应用。

1.3、 Web 3.0 的优势

与 Web 2.0 对比,Web 3.0 通过区块链、去中心化身份等方式解决了 Web 2.0 下数据安全的隐 患,并几乎根除了虚假信息流通的可能。另外,在 Web 3.0 的概念下,用户所创造的数字内容所 有权明确为用户所有、由用户控制,其所创造的价值也将根据用户与他人签订的协议进行分配。 即,数据变为数字资产,可以得到资产级别的保障。 总结从 Web 1.0 到 3.0 的演进,从最初 Web 1.0 用户只能读取信息而不能与 Web 产生交互,到 Web 2.0 中产生了大量用户创造的信息,再到构想中 Web 3.0 用户可以拥有并控制互联网的信息。 Web 3.0 在优化底层性能的同时,也给予了用户一定的权限。


二、 Web 3.0 基础设施

为了实现 Web 3.0 设想的状态,需要从底层的基础设施环节搭建 Web 3.0 网络,现阶段的基础设 施进展主要集中于技术端的研发与应用。

2.1、 跨链技术

跨链技术可以帮助 Web 3.0 的开发者和用户在区块链的可信保障下创造价值流通。而在区块链技 术应用方面,多链并存的格局预计将一直存在。不同区块链生态的 Web3.0 用户有进行交互的需 求,跨链技术会在这个过程中发挥重要作用。

2.2、 去中心化身份

去中心化身份(Decentralized Identification,DID)是互联网上的一个地址,用户可直接拥有和 控制。它可以用来寻找并连接 DID 文件,这些文件包含与 DID 相关的信息。DID 文件包含相关信 息以实现用例,如签到、数据加密、通信等。加密证明,如数字签名,允许实体证明对这些标识 符的控制。

DID 可被看做 Web 3.0 中的身份中心。由于用户控制着 DID 的中枢,他们可以决定何时、与谁以 及在什么条件下透露他们的数字身份要素。围绕 DID 与区块链技术,已有许多项目建成 DID 生态 系统,DID 作为 Web 3.0 的基础设施之一初显雏形。

2.3、 分布式存储

随着 Web 服务变得更加集中,用户严重依赖少量的服务提供者。HTTP 是一种脆弱的、高度集中 的、低效的、过度依赖协议的骨干,集中式服务器很容易成为目标。目前,为了维持服务器的正 常运行,服务提供商不得不使用各种昂贵的安全解决方案,防止被攻击的成本越来越高。 分布式存储是一种数据存储技术,通过网络使用企业中的每台机器上的磁盘空间,并将这些分散 的存储资源构成一个虚拟的存储设备,数据被分散地存储在企业的各个角落。分布式网络存储系 统采用可扩展的系统结构,使用多个存储服务器共享存储负载,利用位置服务器定位存储信息, 不仅提高了系统的可靠性、可用性和访问效率,而且易于扩展。

行业生态发展:传统 IT 巨头布局。2021 年 7 月 15 日,由中国(西部)电子信息博览会主办的 2021Web3.0 中国峰会暨 IPFS 分布式储存大会在成都开幕,AMD、西部数据、华为、阿里云、 希捷、东芝、铠侠、浪潮、联想、曙光、戴尔、中国电信、中国移动、神州数码等知名企业参展。

2.4、 隐私计算

从已商用场景分析,安全多方计算、联邦学习与机密计算商用进展较为领先,零知识证明 主要被运用于区块链场景中。 由于隐私计算可以解决一组互不信任的参与方之间,在保护隐私信息以及没有可信第三方的前提 下的协同计算问题,在 Web3.0 中,具备隐私计算功能的基础设施不仅可以保护用户的个人数据, 而且可扩展应用程序的设计空间。

三、 Web 3.0 搭建:区块链与分布式存储的意义

在下游应用方面,Web 3.0 可应用于许多场景,包括金融、认证、票据、政务、版权、溯源、医 疗、公益、游戏、艺术等。而现阶段 Web 3.0 尚处于概念阶段或初级部署阶段,底层基础设施的 搭建更为关键,而分布式存储在 Web 3.0 的底层基础设施中至关重要。

3.1、 区块链网络中的分布式存储项目

Dfinity 与互联网计算机 ICP Dfinity 基金会是非营利性组织,目标是帮助开发者、企业、个人及政府更好地融入到区块链网络 中来。Dfinity 创建了互联网计算机,在互联网计算机的容器 Canister 上所有的应用、智能合约都 是去中心化的,互联网计算机没有主网只有子网,目前是世界上唯一一个可以去除智能合约局限 性的计算机。

Dfinity 基于互联网计算机协议使用新的加密算法,使得互联网计算机实现世界计算机的功能。通 过互联网计算机区块链,可以存储所有软件,包括分布式应用、DeFi、Web3 游戏等。而且,互 联网计算机在自主物理网络上进行的,在这样的架构中没有云计算架构。

Dfinity 采用了分层结构,自下而上可以分为数据中心(Data Centers)、节点(Nodes)、子网 (Subnets)和软件容器(Canisters)。Dfinity 最底层的数据中心共有 20 个,主要位于美国、欧 洲和新加坡。其中,11 个数据中心位于美国,6 个位于欧洲,3 个位于新加坡。

星际文件传输系统 IPFS

全球去中心存储领域出现了包括 Filecoin(IPFS)、Sia、StorJ、Burst、Bluzelle 等一批区块链 项目,它们都能够提供类似的去中心化存储功能。 其中,星际文件传输系统 IPFS(InterPlanetary File System)是一个基于内容寻址的、分布式的、 新型超媒体传输协议。IPFS 支持创建完全分布式的应用。它旨在使网络更快、更安全、更开放。 IPFS 是一个分布式文件系统,它的目标是将所有计算设备连接到同一个文件系统,从而成为一个 全球统一的存储系统。

IPFS 采用为数据块内容建立哈希去重的方式存储数据,数据的存储成本将会显著下降。同时,与 HTTP 相比,IPFS 将中心化的传输方式变为分布式的多点传输。IPFS 使用了 BitTorrent 协议作为 数据传输的方式,使得 IPFS 系统在数据传输速度上大幅度提高,并且能够节省约 60%的网络带 宽。因此,IPFS 可被用于 Web 3.0 中多个领域。

3.2、 云计算下的分布式存储服务

提供云计算服务的厂商优先布局分布式存储技术:分布式存储技术可以在普通的 PC 服务器上, 对外提供各种计算和存储服务。AWS、微软、阿里、腾讯、Google 等云厂商均已布局分布式存 储技术,中兴通讯、紫光股份子公司新华三、浪潮信息等也为各厂商提供分布式存储通信设备。

阿里云:混合云分布式存储以阿里云为例,阿里云旗下混合云分布式存储产品已落地。阿里云混合云分布式存储具备弹性灵 活的特性,适用于业务快速发展的私有云和互联网应用场景。因为分布式存储服务可通过增加节 点数可以实现容量和性能的线性增长,因此服务支持海量非结构化数据存储。

AWS:分布式存储引擎 Dynamo 基于分布式存储引擎,Amazon DynamoDB 是一种完全托管式、无服务器的 NoSQL 键值数据库, 旨在运行任何规模的高性能应用程序。DynamoDB 提供内置安全性、连续备份、自动多区域复制、 内存缓存和数据导出工具。

浪潮:“分布式云+”与分布式存储 分布式云(Distributed Cloud)是浪潮云的一种云计算服务,即云服务提供商管(Cloud Service Provider,CSP)将公有云服务分发到不同的物理位置,由 CSP 统一负责云服务的运营、治理、 更新和演进。 浪潮云依托在全国布局的 7+69 个云数据中心构建浪潮分布式云,具备统一技术架构、统一用户 体验、适配国产多 CPU 等特点。浪潮分布式云的节点类型分为:中心节点、区域节点、边缘节点, 所有节点接入 OpsCenter 进行统一的运营、治理、更新和演进,在可满足低延迟、本地化、跨云 场景、混合场景等用户需求的同时,还可实现地缘政治相关的解决方案,比如审查制度、安全性、 隐私权和数据主权等。

此外,浪潮云文件存储 ICFS(Inspur Cloud File Storage)也为用户提供基于分布式系统的文件存储 服务,可通过标准的 NFS 等协议挂载文件系统,并使用标准的 POSIX 接口对文件系统进行访问, 多计算节点可挂载同一文件系统,共享文件和目录。浪潮分布式存储 AS13000G5 基于底层的存储资源池共享,可根据用户需求,对存储资源进行灵 活配置,在同一集群内,提供给块、文件、对象使用;其次,分布式块、文件、对象灵活调整。 随着业务发展,当所需的存储类型发生了巨大变化,可以将原来用于块的资源进行释放,配置为 文件资源,从而避免资源的浪费和重复投资;最后,分布式块、文件、对象采用统一管理界面, 资源共享,可以较好地降低管理复杂度和维护成本。

2021 年 7 月,存储性能委员会(Storage Performance Council)公布最新的 SPC-1 基准评测报 告,浪潮分布式存储 AS13000G5 获得 6,300,529 IOPS(每秒读写操作次数)、0.781ms 时延、 单节点 210,018 IOPS 的评测值,获得 2021 年分布式存储性能全球最高成绩。

3.3、 从英伟达 DPU 看分布式存储的技术如何拓展

底层硬件 无论是分布式存储项目还是公有云巨头发展的分布式存储产品,其内在的硬件设备仍需使用高效 的存储与计算器件。在分布式存储底层硬件环节,主要需解决“存算分离”以及安全性能两个问 题。在这一领域,英伟达拥有领先的计算专业知识与高性能的网络技术,可优化整体计算、网络 和存储等数据中心级工作负载,实现更高的性能、更高的计算资源利用率和更低的运营成本。

针对上述两点挑战,英伟达通过不同的方式进行了优化: (1) 在实现高效“存算分离”环节,利用 NVIDIA BlueField DPU 系列提供的 NVMe SNAP 技 术,使客户能够对于远程服务器中的 NVMe Flash 存储,像访问本地存储一样对其进行 访问。可实现广泛的加速存储、软件定义网络和应用程序解决方案。 (2) 在存储安全环节,NVIDIA ConnectX SmartNIC 支持独特存储功能硬件加速器和卸载, 以确保主机上有效的 CPU 利用率。通过利用 NVMe-oF Target 卸载、T10Diff 和纠删码 的硬件卸载等技术,释放了 CPU 在存储 Target 端的利用率,并提供极高的 IOPS。 另外,Nvidia ConnectX系列网卡也可以通过硬件对于数据直接进行加解密,不管是数据 传输中的 IPSec、TLS 等,还是数据在落盘时的 AES 等操作,都可以有网卡硬件来完成, 实现了在数据加密的同时以线速传输。

网络架构

为了提升分布式存储的性能与效率,英伟达推出了基于白盒 CLOS 架构和 IP Fabric 的数据中心组 网方案。 在分布式存储应用方面,英伟达面向客户的数据中心采用基于 NVIDIA 的 SN 系列白盒以太网交换 机构造的三层五级 CLOS 架构,IP Fabric 形式组网,并使用基于 EVPN-VxLAN 提供的业务层服 务。方案采用了现代数据中心的典型架构,在规划和部署上应用了大量的基于最佳实践的优化技 术。在适配 RDMA/RoCE 应用方面,NVIDIA 提供了从驱动、网卡、交换、网管方面的全线支持, 甚至超低误码率的 AOC 和光模块都为 RDMA 所需的无损网络带来了贡献;在可部署性方面,NVIDIA 网络支持 ROCE Over VXLAN 技术,从而使 RDMA 应用有了良好 的可部署性,更加适合客户的基础设施。



(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

精选报告来源:【未来智库】未来智库 - 官方网站