克雷西 |奥飞斯量子比特公众号QbitAI地面算力“涉足”,终于突破了大气限制。据介绍,由 NVIDIA H100 驱动的 Starcloud-1 卫星搭乘 SpaceX 的猎鹰 9 号火箭成功进入轨道,标志着打造“太空超级计算机”的重要一步。谷歌紧随其后,很快透露了其“Suncatcher”计划,计划部署一组 TPU 卫星。 “太空超级计算”的概念正在迅速从科幻小说走向工程现实,计算能力基础设施正在物理位置发生重大变化。在这条前沿道路上,中国的科研能力已经深耕多年。 2019年以来,中科院信息技术研究所、武汉大学、北京邮电大学等研究机构开始在智能空间计算方面进行探索和工作ing。中国科学院信息技术研究所是计算能力研究的国家团队。该公司很早就开展了天基计算能力基础设施的研究工作,主导开发了极光POPS级空间智能计算有效载荷和大型天基智能模型和机构,并已在开展应用工作。武汉大学牵头研制“东方之眼”智能遥感星座。该星座采用“光学+雷达+高光谱”协同观测系统,推进智能星上处理、高效图像压缩等核心技术。大学北京邮电部门牵头建设“天顺星座”,通过“北邮一号”、“北邮2/3”等卫星验证在轨星地IP网络、星间激光通信等技术。浙江再保险中科院今年5月成功发射“三体星座”计算卫星,并开始测试空间计算星座网络。与此同时,中国民用航天公司中科天顺也开始进行这一领域的设计。中科天算是国内最早从事“空间计算”的团队之一。团队核心成员来自中科院信息技术研究所、航天部、之江研究院等有利部门。他们兼具“互联网”和“航天”基因。他们不仅继承了地面超级计算的成功经验,也继承了航天工程的严谨作风。他们自2019年起深耕空间智能计算,在高功率空间计算、在轨协同计算、大空间模型等关键技术上相继取得突破。计划是完成 i2024年引入并在轨部署大型模型,构建从感知到决策的“智慧空间链”。他们致力于突破“超算上天”、“人工智能面向太空”核心技术,建立智能计算软硬件系统和应用服务生态系统。目前,他们已在近地轨道建造了真正的“太空超级计算机”,并启动了“天守计划”,试图在真空和辐射的绝境中研制出人类“第二大脑”。空间计算新范式:空间互联网应用生态系统随着遥感精度的不断提高和通信需求的爆炸式增长,传统的“空地计算”模式面临物理瓶颈。长期以来,卫星主要充当“传感器”和“路由器”,但真正的“大脑”一直在地面。中科天算CEO刘耀奇表示,当前空间信息n 基础设施是:地面互联网1G时代,价格昂贵,功能有限。与地面互联网的发展类似,当算力演进成为智能化的基础时,互联网应用生态迎来了4G时代的爆发,各种应用应用如雨后春笋般出现。天基网络基础设施的创建将迎来太空2G时代,任何人都可以拨打卫星电话、发送卫星短信。然而,这还不足以维持整个太空经济。空间算力的应用将助力空间互联网4G时代的到来,构建整个空间互联网生态系统。通过将算力带入数据源头,直接在卡车侧完成“感知-理解-决策”的闭环,其应用价值创造了质的飞跃。以深海捕鱼为例。和在轨决策中,未来的渔民将能够通过太空基础设施提供的“上帝之眼”,随时随地看到哪里的鱼最多。高光谱卫星实时观测海洋环境,导航卫星提供定位。在整合和分析数据后,太空中的大型人工智能模型将决策标准直接发送到用户的设备:“30分钟内,一群金枪鱼将向东北方向行驶20海里。”地面超级计算受到物理延迟以及地面和卫星带宽瓶颈的限制,难以满足这种迫切的服务需求。只有在轨道侧部署计算能力才能立即做出反应。中科天算认为,从海量空间数据的诞生,到空间互联网的编织和互联网的兴起,“天数-天王-天数”的演化过程是技术发展的必然路径。太空中的智能决策。天守计划就是在这个想法下诞生的。该计划旨在建设真实空间超级计算中心,实现算力高达10EOPS的天基万卡超级智能集群在轨部署。该集群由三个主要模块组成,具有模块化组装、部署和替换能力。 100MW动力舱采用灵活的太阳能电池板和模块化储能系统,为太空中无限昼夜供电。利用限制实现绿色能源的无限供应。在10Tbps通信舱内,超过100束100G激光链路可以实现空间节点和地空节点之间的按需互连,从而创建高速数据传输网络。 10EOPS级算力模块将高性能算力集群部署入轨,集成数万块高性能算力卡,突破功耗和散热极限在地面上。通过ISTE计划,中科天双寻求开启“自然辐射冷却、绿色能源无限供应、全球算力共享”的空间计算新范式。但在绝望的物理情况下,工程上的突破是将地球超级计算机的巨大计算能力直接传输到太空。它根本不是一个简单的物理运动,而是针对极端物理环境的系统重构。在距地球 500 公里的轨道上,工程师必须面临两大物理挑战。一是用高能粒子辐射对精密芯片进行微观照射,这对计算的准确性和生存率有影响。其次是真空环境下的全面热管理,这决定了大功率芯片能否继续运行而不烧坏。这两个大问题却像横亘在高性能之间的两座大山计算能力和空间,迫使研究人员在架构层面寻找进步。从辐射防护的角度来看,太空环境与地面超级计算也存在根本区别。天空中的高能粒子会产生两种截然不同的致命后果。其中之一是“缺陷”,例如总剂量效应和保留效应。高能粒子引起电流浪涌,直接烧毁芯片。另一种是“内部损伤”或单个粒子的逆转。尽管硬件没有损坏,但逻辑电平可能会跳跃,导致计算不准确或系统“崩溃”。传统的航空航天工程长期以来依赖“抗辐射”芯片。此类芯片通过电路强化等物理手段提高了生存能力,但代价是制造工艺落后、算力较弱,无法完全支持现代人工智能模型。为了克服这个问题我中科天算团队在研究中利用了半导体物理特性。实验结果表明,采用先进制造工艺的芯片很容易出现“单粒子翻转”,从而导致逻辑电平跳变和计算错误,但不太容易出现“老化”。只要你还有筹码,就不用担心计算不准确。考虑到这种“不能死,但经常失算”的特点,工程团队提出了软硬件容错互补的想法。采用冗余多模块架构,让多个计算单元相互支持并实时比较。他们正在用计算架构中的冗余来换取嵌入商用先进工艺芯片中的应用程序的可行性。传统航天计算机的寿命只有 10 年,而地面芯片的性能每 18 个月就会翻一番。这个想法使得航空航天计算系统目的是为了省去漫长的研发周期,将地面上的尖端芯片快速适应太空环境。与辐射引起的软错误相比,真空环境下的散热问题是更为关键的硬约束。在地面上,芯片产生的热量通过空气对流或液体冷却循环释放到环境中。然而,在外太空的真空中没有空气,因此热对流机制不能完美工作,热量仅以低效传导的形式传递。对于功耗极高的先进芯片来说,热流密度远远超出依赖坚固结构和均温板的传统航天器所能承受的范围。芯片表面的热量积聚可能会导致立即停机或物理损坏。为此,中科天算使用流体电路主动散发高功率芯片的热量。它开发了一种混合主动/被动冷却NG架构取代了地面上使用的空气冷却方法。它还结合结构导热和辐射散热技术,实现微重力环境下的高效散热。该设计解决了微重力和严酷温差条件下的工作流体循环和相变问题,支撑高密度算力的稳定运行。智能基础设施深入太空太空超级计算的重要性远远超出了商业竞争的范围。也是人类未来利用太空、甚至走向深空的重要基础设施。很多人担心,如果卫星距离地球太远,太空中的计算能力会出现明显滞后。事实上,与跨越数千公里的跨区域地面算力调度项目相比,距地面500公里的近地轨道在物理距离上更具优势。此外,空间算力中心具有全球广域覆盖的优势,有利于向偏远地区的汽车、无人机、移动设备等提供持续的算力输送,为自动驾驶和低空经济提供强大的发展动力。此外,地面算力中心还面临台风、地震等自然灾害。一旦发生灾难或者地面设施受损,太空算力自然立于不败之地,可以在关键时刻充当后备中心。如果太空算力网络成为现实,它将不仅是地面算力网络的补充。相反,太空将成为计算能力和网络的主要战场。从长远来看,随着人类探索月球甚至火星,在这些天体表面重建一套计算设施的成本将令人望而却步。通过预先部署通用算力和通信通过在轨道上的节点,SIT将成为连接地球和深空的数字桥梁。最初的 IA 芯片验证已在完整的 GPU 和团队中实现了实际进展,Wanka、CADA 先进技术累积在人类未来数字化领域的真空世界和辐射领域。文明前沿的基础。陆地表面的深度整合、信息与航空航天工程的深度整合,限制了陆地信息能力的极限,允许信息能力在世界范围内广泛传播。 —完—
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如果有)已上传由网易号用户发布,网易号是一个仅提供信息存储服务的社交媒体平台。