KubeCASH

融合计算

从单机计算到集群计算,从服务器机房到云计算,再到算力网络。计算已经变得非常的复杂,是一项庞大的系统工程。

从微观芯片到宏观数据中心甚至云边端,全方位、多层次的软硬件综合优化和深层次的软硬件架构重构,实现最优性能和最低成本计算。

三个维度的融合

  • X轴,异构融合
  • 通过异构融合计算,把各类异构算力的价值发挥到极致。

  • Y轴,软硬件融合
  • 核心的KubeCASH,融合软硬件堆栈,开源开放。

  • Z轴,云边端融合
  • 跨算力中心、跨不同云运营商、跨云边端的融合计算。

Converged Computing
CASH-X

1. 异构融合

计算架构从同构、异构走向多异构,未来会进一步走向异构融合。2023年9月份,工信部电子五所《异构融合计算技术白皮书》正式发布。

Heterogeneous Converged Whitepaper

异构融合计算技术白皮书

  • 2023年9月15日,湖南长沙,世界计算大会,由工信部电子五所发布。
  • 组织单位:工信部电子五所。
  • 矩向科技参与核心的策划和撰写工作。
  • 其他参与厂家和科研院所包括:浪潮、电信、清华、中科软件所、国防科大、复旦、中电长城、工信部电子四院、曙光、同方、熠知、阿里云、中科计算所、紫光等。

第三代通用计算:通用异构融合

  • 定制芯片覆盖场景少,生命周期短,难以大规模落地。
  • 系统规模越来越大,通用性比性能更重要。
  • 相比专用,通用是更高级的能力。
  • 随着系统规模越来越大,系统的“二八定律”特征越来越明显,共性部分硬件加速,个性部分软件编程。
  • 异构融合,更强调多处理器之间的深度协同和融合。
  • 通用异构融合计算,给了我们“弯道超车”的时机。历史机遇稍纵即逝,需要快马加鞭,加大投入。
General purpose HCU
CASH-X

2. 软硬件融合

系统越来越复杂,从大系统进化成宏系统。面对复杂的宏系统,无法单独进行软硬件划分。于是,将宏系统拆分成大系统,每个系统进行软硬件划分和协同,并且大系统间再协同。众多的软硬件协同组成的新的集合,称之为软硬件融合。

软硬件划分和协同

  • 指令(集)是软件和硬件之间的接口。软硬件划分,就是确定指令复杂度的过程。
  • 按照指令的复杂度,典型的处理器平台大致分为CPU、协处理器、GPU、FPGA、DSA、ASIC。
  • 指令复杂度,决定了系统的软硬件解耦程度。
  • 深度思考软硬件划分的准确,确保接口解耦、清晰、高效。
  • 软硬件解耦之后,没有了相互掣肘,可以更大限度的发挥各自的“创造力”,实现更加强大的软硬件功能/性能。
Hardware and software cooperation

Hardware and software cooperation to convergence

从软硬件协同到软硬件融合

  • 软硬件结合适合于小系统:软硬件划分比较随意,软硬件紧耦合,并且相互掣肘。软硬件协同适合于大系统:软硬件划分之前需要慎重的系统分析和架构映射,实现软硬件解耦,并且持续迭代。
  • 系统越来越大,从大系统进化成宏系统;宏系统太过复杂,无法单独进行软硬件划分;需将宏系统拆分成大系统,每个大系统软硬件协同,并且大系统间再协同。
  • 众多的软硬件协同组成软硬件融合。

软硬件共同定义系统堆栈

  • 处理器类型越来越多,每种类型还有很多不同的架构。上层的软件更加丰富,不同的业务领域都有各自的框架,即使同一领域,也有多种流行的框架。
  • 如同LLVM/MLIR等编译框架一样,系统堆栈也需要一个中间层,北向对接主流业务框架/软件,南向对接各种类型/架构的处理器或引擎。
  • 增加一种新的业务框架,只需要实现一个新的北向对接。支持一种新的处理器平台,只需要实现一个新的南向对接。
Hardware and software stack
CASH-X

3. 云边端融合

cloud edge endpoint

计算系统不再是微观的单个节点或集群,而是宏观的云边端。云边端融合成一个超级大系统,在这个系统里,要同时考虑数以亿计不同用户不同业务的运行,同时还要考虑不同业务运行的高效性和低成本。

云(网)边端融合,被诸多权威机构确定为全球算力基础设施未来十年的主要发展趋势,最终实现“算力无处不在,唾手可得”。