当前位置: 首页  >  面向产业界  >  成果发布  >  信息领域  >  正文

基于闪存与FPGA的存算一体化图计算平台

2021/06/22

01

所属领域

边缘计算,边缘存储,智能图计算

02

项目介绍

2.1 痛点问题

图作为一种重要的数据类型,越来越多的大规模数据是以这种方式而存在的,例如生物信息网络数据、社交网络数据、搜索网页数据、知识图谱等图数据的规模正变得越来越大,图中的结点数已达到十亿,边数已达到上百亿甚至上千亿。因此,如何高效的处理如此大规模的图数据是图计算所面临的严峻挑战。与传统大型数据处理常见的结构化数据相比,图模型数据的特点是,数据规模极其庞大且稀疏度高,因此其I/O访存非常不规则,稀疏的数据导致了数据不能连续访存,从而造成了I/O性能的下降。除此之外,巨大的存储开销,使得整个图模型数据只能部分缓存在内存中,然后再根据实际需求从外存储中读取所需要的数据,造成了外存和内存之间数据的大量移动,产生大量的I/O开销,从而使得图计算的计算效率很低。

2.2 解决方案

(1)核心技术概览:如图1所示,基于可重构处理器FPGA与高性能大容量的闪存盘可以使图计算处理单元更靠近数据,并将图计算的核心算子迁移到离存储数据更近的地方(图1绿色箭头所示),提出基于FPGA与闪存的存算一体化图计算平台,其计算效能远高于传统的计算架构(图1红色箭头所示)。

undefined

图1 近数据存算融合基本原理

(2)系统硬件优势:如图2所示,本项目提出的面向超高清图像识别的近数据存算融合单元,通过PCB板级直连,将可重构芯片FPGA与大容量非易失存储闪存芯片直接相连,其中FPGA芯片内部集成了传感器的载荷接口、高性能智能计算加速器、SSD控制器。SSD访存带宽可达2GB/s、存储容量达到1TB、且容量可灵活扩展,高性能智能计算加速器可支持高性能且定制化的图计算、智能计算、科学计算任务,该系统集成度高并且可进行高吞吐率的实时智能计算。

undefined

图2 近数据存算融合硬件架构

(3)系统软件优势:如图3所示,本项目提出的存算融合软件系统主要由存储计算一体化请求管理技术、闪存设备高并发I/O管理技术、和近数据图计算硬件加速技术这三部分组成。该软件栈通过在文件系统与闪存SSD的固件层进行构建,让用户能够在文件系统的用户态直接发起存储与计算一体化的请求,打破了传统存算一体化设备的编程与使用壁垒,并且通过软件系统对于硬件的感知,提高了存储访问的并行度与计算的效能,有利于快速构建相关的软件生态。

图3近数据存算融合软件架构

2.3 竞争优势分析

(1)对标企业:美国的ScaleFlux公司的可计算存储产品(Computational Storage Drive, CSD)。

(2)性能、成本、成熟度分析:美国ScaleFlux公司的CSD产品可以支持存储原生的数据压缩、去重等操作,理论峰值带宽可达到5GB/s,存储容量达到10TB级。基于本技术的原型系统通过软硬件协同优化,充分利用了固态存储通道级别并行度,极大的提高了读写带宽并降低了尾延迟;通过构建用户友好的文件系统,为固态存储设备与智能计算单元提供了统一的存算融合管理框架;对于应用的支持,不仅可以支持存储原生的数据压缩、去重等操作,还可以支持用户态常见的机器学习、科学计算等常见计算任务。本项目目前实现的原型机的带宽为2GB/s、存储容量为1TB,暂低于竞品CSD系列的产品性能指标,但本技术的技术拥有更加高度集成的高性能硬件平台与用户友好的软件接口与开发环境,在硬件的具体指标方面拥有更大的提升潜力,在软件方面更容易通过工程化的打磨快速构建软件生态,进而超越CSD系列竞品。此外,由于本项目的产品相比国外拥有国产化的优势,在国内许多垂直领域可以更早布局,让产品率先落地。

(3)知识产权布局:本项目已获得1项中国发明专利,另有1项正在申请。竞争对手专注于提供存储原生的近数据计算的加速与支持,而本项目则着眼于拥有更大适用范围和市场的用户态通用计算,拥有更广阔的应用场景。

2.4 市场应用场景

(1)应用领域:航空航天、气象、电力、环境监测等。

(2)目标客户:航空航天科研院所、省市县气象局、电力企业(国家电网、国电南瑞、中国铁塔)等。

(3)市场规模:可计算存储属于下一代存储技术,据Markets&Markets预测,下一代可计算存储技术的中国市场将由2020年的300亿元增长至2025年的800亿元,其中本项目涵盖的市场估计可占到15%左右,预估2025市场总量将达到120亿元。

(4)盈利模式:出售技术服务或者完整软硬件产品。

2.5 发展规划

本项目拟以作价入股新设公司的形式进行转化:

(1)公司成立后一年内:利用种子轮融资,将原型系统进行工程化打磨,将性能提高到与国外竞品ScaleFlux同级的水平进行对标;与此同时与航空航天、电力与气象部门进行产品原型的推广,为产品销售打开市场。

(2)公司成立后第二年:拟进行天使轮融资,同时扩张团队的技术与销售团队至20人;完成3-4款存算融合系统的完整产品。

(3)公司成立后第三年:拟进行A轮融资,公司销售额达到千万级,服务客户达到50家,实现10款存算融合系统的产品,在性能指标方面全面优于国外竞品ScaleFlux公司的CSD全系列产品。

03

合作需求

1. 孵化资源:初期3-6个月用于工程化、产品化需要约300万元资金,需要10-15人场地,离清华大学较近的场地30平米左右。

2. 应用场景:航空航天物体识别、知识图谱等图计算边缘端应用。

3. 资源对接:航空航天、电力、能源等企业。

04

团队介绍

王硕,2020年于北京大学高能效计算与应用中心获理学博士学位,攻读博士学位期间发表8篇电子设计自动化与计算机体系结构顶级学术论文,并于2020年加入清华大学计算机系高性能所舒继武教授团队进行博士后的相关研究,在此期间设计并研发了基于闪存与FPGA的存算融合系统。

舒继武,南京大学计算机博士,清华大学长聘教授、厦门大学信息学院院长(双聘)、博士生导师、教育部长江学者特聘教授、国家杰出青年科学基金获得者,国际电气和电子工程师协会会士(IEEE Fellow),中国计算机学会会士(CCF Fellow),曾荣2020年华为首届唯一“奥林帕斯奖”、2020年中国计算机学会科学技术奖发明一等奖、2019年教育部科学技术发明奖一等奖。

陆游游,清华大学计算机系博士,清华大学副教授,曾获得CCF优秀博士学位论文奖、清华大学优秀博士后、ACM中国操作系统分会新星奖、首届中国科协“青年人才托举工程”、国家优秀青年科学基金,共发表录用CCFA类计算机系统顶会论文30余篇,获NVMSA 2014最佳论文奖和MSST 2015最佳论文提名。

05

联系方式

联系人:刘老师

E-mail:liuyi2017@tsinghua.edu.cn

成果编号:2021070

注:转载请注明出处。

-分享-