三个人能力突出,做什么都能做的非常好,除了不务正业。三个老板不时吐槽游戏制作人不去做游戏、动画片导演不拍动画片、电影导演不拍电影,问的话就是积累灵感。也就由着他们吧。
张教授老家是山城的,同组的一个科学家也是山城的,两个人一起回山城休息一段时间。刚好张教授要闭关完成他的研究。
研究院科学计算和人工智能专用加速芯片也已经定型进入开始生产了。其实设计芯片倒不是很难,被加速卡互联卡住了。不管科学计算集群还是人工智能集群都是10万张卡起步,卡间互联非常重要。假设每张卡的算力是1,理论上10万张卡组成的集群算力应该是10万,但是考虑到卡间互联肯定达不到。卡间互联做不好的话撑死到2万,目前能做到5万就谢天谢地了。
一开始研究院从计算机的角度出发解决卡间互联,效果不理想。一次开会的时候通信组的科学家听说了给出了一个思路:“卡间互联本质上是加快不同芯片的数据交换,将多个加速卡虚拟成一个卡。反正也是信息传输,用计算机的技术是传输,用通信的也是传输,要不要试一试通信的技术?”
加速卡项目组的科学家想了一下,也对啊,什么方式不都是信息交换,说话是传递信息的方式,写字就不是了吗?通信组正式进入加速卡项目。很快就有了方案,对那款基带芯片进行魔改,冲破了无线的束缚,传输速率暴增。
当然也有问题,经过讨论决定使用光传输技术。有EIGO做后盾,研究院在激光的调制处理上没有任何困难,但是在传输上研究院确实不太行。不过无所谓,找来菊花、华兴两家通信巨头合作,很快就把所有问题解决了。因为通信技术天然的强调多设备的互联互通,用在集群联通上再合适不过了。
设计了两个设备,卡间互联的和柜间互联的。生产出样品后小规模测试后效果出奇的好,能达到集群理论算力的85%,已经不能再好了。
立刻开足马力生产了一批,把蛋白质预测中心的互联设备进行了升级,仅仅升级了数据互联就实现了算力翻2番,并且运行稳定。新的加速卡立刻投入生产。
这时候谷歌已经在试用研究院的服务器样机,对性能非常满意。正在翘首以盼的谷歌收到了研究院新的样机。这次不是单台服务器,而是10个服务器组成的小规模集群。谷歌测试后大吃一惊,他们可没想到仅仅是优化数据联通就能实现算力翻番。谷歌还是毫不犹豫地追加了订单,由5千台增加到1万台。
<
本章未完,请点击下一页继续阅读! 第2页 / 共3页