国内外服务器差距

HW,inspur, Lenovo v.s. ??? DELL & HP & IBM(??)

细分硬件平台:CPU GPU 主存 外存

<1>CPU & 主板

申威 & 飞腾 & 龙芯 & ??? v.s. Intel & AMD & ARM & supermicro

中国CPU的发展起步较早,由于中间战略调整错失了和美国齐头并进的机会,目前最自主的CPU基于永久的架构授权,自主设计然后找代工厂生产,但由于代工厂的全球协约同样收到打压,目前看在供应链方面的瓶颈成了新问题。

目前国产起量的CPU有ARM、x86、MIPS和α架构,还有宏芯获得的Power8架构。由于政策、市场、技术等多方面原因,ARM的势头占优,特殊领域基于MIPS的龙芯表现也很不错。

国产cpu发展现状:

按照指令集的复杂程度划分,我们可以把CPU简单划分为两种架构,一类是RISC(精简指令集处理器, 如),另一种是CISC(复杂指令集处理器, 如X86处理器)

按照基础指令集的不同,目前世界上的CPU可以分为五大体系,分别RISC类别的ARM体系、MIPS体系、Power体系、Alpha体系、ARM体系和 CISC类别的X86体系

1. 国内MIPS体系处理器的现状-充满生机与活力

MIPS的意思是“无内部互锁流水级的微处理器”(Microprocessor without interlocked pipedstages),其机制是尽量利用软件办法避免流水线中的数据相关问题

国内MIPS处理器的代表有两家,一家是大家都经常能听到的龙芯,另一家为君正。

龙芯是2002年由中国科学院计算所开始研发, 第一代产品发布时是没有经过MIPS正式授权的,有侵权的嫌疑, 但龙芯支付了一笔费用永久性获得了MIPS32和MIPS64架构的授权,现在龙芯完全是自主可控的,将来不会再出现被别人卡脖子受限于人的局面。

龙芯经过这么多年的发展也早已不是简单的其他MIPS处理器仿制版,在MIPS固有指令集上龙芯还添加了不少自主研发的指令集,指令集数量是原有两倍。

目前龙芯最新的产品是2019年年底发布的龙芯3A4000 与 3B4000:

3A4000是面向桌面台式机和笔记本,采用28nm打造,4核4线程,主频为1.8~2.0GHz(也就是支持睿频),面向科学计算、高密度数值信息处理的峰值计算性能是上代产品龙芯3A3000的4倍以上,通用处理性能基本打平AMD的末代28nm产品“挖掘机”

3B4000属于龙芯服务器CPU产品线,在核心线程、频率上与芯3A4000一致,但支持双路、四路服务器,即在一台服务器主板上安装2个或者4个龙芯3B4000芯片,一台服务器最多包含16个处理器核。所有CPU之间通过高速总线接口直接互联,共享使用物理内存。龙芯3B4000专门优化了CPU之间的高速互连总线,跨片访存实际带宽提升400%以上。

目前龙芯的发展势头还是十分不错的,已经不需要国家经费支持完全实现自给自足,公司收入主要来源为太空芯片销售、高温芯片销售、对外IP授权销售、嵌入式方案销售和党政军采购,在19年年底的发布会上龙芯中科董事长胡伟武表示龙芯在2019年出货量达到50万颗,净利润达上亿元,合作伙伴已经增至近千家,下游基于龙芯的开发人员达到数万人,使用龙芯的笔记本、一体机、服务器、云终端、网络安全设备、工业控制计算机等产品已经运用于我国的各行各业。

国内MIPS处理器虽然发展地不错,但是由于最新的微软Windows系统只支持X86处理器和部分ARM处理器,我们普通人一般是接触不到MIPS处理器,认知不足也可以理解,就算买来龙芯的笔记本,由于生态和软件的问题,对普通人来说也是浪费钱。

2.国内ARM体系处理器的现状-星星之火已成燎原

ARM全称为Advanced RISC Machines(高级RISC核心, 大家手中的手机就是用ARM处理器的,使用32位精简指令集,ARM处理器具有低功耗高性能、大量使用寄存器读取指令快、体积小、指令长度固定、节省存储空间等特点。

ARM处理器也是一个商业化十分成功的处理器,只要你向ARM公司支付一笔费用,就能获得ARM处理器的授权. (授权的模式有三种,第一是架构/指令集层级授权,授权后你可以对ARM架构进行大幅度改造,甚至可以对ARM指令集进行扩展或缩减,比如苹果、华为就是这种;其二是内核层级授权,你可以以一个内核为基础添加其他模块;其三是使用层级授权,意思是你只能使用,不能魔改。)

国内发展ARM处理器体系主要有四家,分别是华为海思、飞腾、展讯。

华为海思应该是国内ARM处理器商业化最成功的公司了。华为海思的处理器主要应用于移动端产品,应用场景包括但不仅限于手机、监控设备、机顶盒、电视和路由器等,最新的代表产品就是麒麟990 5G版了,7nm euv工艺打造,集成5G基带,其CPU性能可与目前世界一流水平的手机处理器骁龙865、A13同台竞技

华为海思在服务器领域也有涉足,最新产品为鲲鹏920,7nm工艺打造,最高可扩展为64核,主频为2.6GHz,支持8通道DDR4内存和PCIe 4.0。不过鲲鹏920目前还处于华为自用阶段,作为于华为云服务的服务器内核,而且目前高性能服务器基本都是X86处理器的天下,鲲鹏920暂时不会对服务器市场造成多大的影响。

飞腾公司是中国国防科技大学高性能处理器研究团队建立的企业. 一开始飞腾是做逆向工程的, 后来转向做Sparc处理器. 010年国防科大的银河一号超算进行扩容时加入了2048颗FT-1000处理器,虽然相比于超算其他的AMD、Intel处理器数量来说微不足道但也足以振奋国内研发人员,激发了当时国人的民族自豪感. SPARC架构母公司被Oracle收购之后, 飞腾果断就转向做更火的ARM架构处理器。

 飞腾也是购买了ARMv8指令集的永久授权,最新产品2019年9月发布的FT-2000/4处理器,4核4线程,16nm工艺打造,最高主频为3.0GHz,最大功耗仅为10W,主要面向台式机或者笔记本。目前FT-2000/4已和国产银河麒麟操作系统(PC版)完成了全部适配工作,因为不使用Windows系统,主要客户也是军队、政府等单位了。

展讯公司是一个不得不提的国内ARM处理器设计公司,根据统计展讯每年出货6亿片芯片,占据全球手机芯片25%的市场,仅次于高通和联发科,在去年展讯旗下的SC6531芯片击败了高通华为联发科三星成为单芯片出货量世界第一。 手机芯片主要用于老人机、三防手机上,主打耐用性与超长续航,仅支持GSM、GPRS两种网络制式,主要市场也集中于非洲、东南亚等低收入海外市场,是真正走出去的国产芯片。

3.国内Power体系处理器的现状-胎死腹中?

Power架构是蓝色巨人IBM开发的指令系统架构,大到超算,小到车载音响都有它的身影。Power价格昂贵.2016年国内企业中昊宏芯获得了POWER 8芯片架构和指令系统的永久授权,但中昊宏芯研发过程并不顺利,期间还遇到股权变更和欠薪事件,国产Power也就一直难产,至今都没有影子

2019年8月POWER指令集架构正式开源,或许这能促进国产Power处理器出现。

4. 国内Alpha体系处理器的发展-已成独苗

Alpha是DEC公司制造的处理器架构,后来DEC公司被美国惠普收购,而惠普的精力主要在“X86架构”的个人电脑,所以对Alpha架构的指令集早已很久没有更新. 恰逢我们国家全力发展自主科技,所以我们无锡的江南计算所(军方研究机构)买了Alpha架构的所有设计资料,制造了完全自主可控的国产Alpha处理器,也就是大名鼎鼎的申威,申威处理器也是目前Alpha架构处理器的独苗了。

江南计算所在原有Alpha指令集的基础上增添了SIMD等特色的扩展指令集,还拓展了多核架构,把Alpha架构处理器发展到新的高度,现在的申威处理器和以前的Alpha处理器已经不可同日而语,最新的申威SW26010处理器使用了申威为高性能计算自主研发的指令集.

此前多次夺得超算排名第一的神威·太湖之光超算就用了多达40960颗申威26010众核处理器,全都是超算的运算主力,并不像飞腾那样打打辅助,由此可知申威26010众核处理器确实实力过硬,能与其他国家的超算一比高下。

5. 国内X86体系处理器的发展-势头良好,仍存阻碍

国内要想发展X86处理器,最大的难题是授权问题,在X86处理器发展过程中Intel和AMD的指令集经过复杂的融合,形成了如今两家交叉授权才是完整X86指令集的局面,换句话而言想堂堂正正地发展X86处理器,理论上要同时得到Intel和AMD的授权才行。

兆芯:

目前世界上除了Intel和AMD以外第三家拥有X86授权的公司,是威盛VIA,上海兆芯集成电路有限公司经过一番操作也是取得了威盛VIA X86处理器的授权。早期兆芯处理器也只是威盛处理器简单的仿制产品,不过经过这么多年的迭代研发,兆芯已经研发出KX-6000系列处理器,基于16nm制程,主频可达3GHz,有4核/8核可选,集成核显、支持双通道DDR4内存,性能与Intel酷睿七代i5处理器看齐

目前兆芯需要担心的依然是授权的问题,按照此前美国裁定威盛的X86授权早已在2018年4月份过期,之后新的X86指令集无权使用,也就是说以后研发新指令集只能靠兆芯自己了。

海光:

2016年AMD宣布与中国天津海光投资公司达成协议,将X86技术授权给海光公司,自此国内能设计X86处理器的公司又多了一家。但海光处理器是十分受制于AMD的,海光处理器被规定只能在中国销售,不能出口,而且也不知道AMD会不会翻脸,因此海光处理器算不上完全自主可控。

<2> GPU

???v.s. NVIDIA & AMD

个人观点,10年以后,见到nVidia的显卡服务器,会发现这是最有趣的事情之一,因为整个机柜的服务器插满GPU,没有一个端口会连接显示器,史上最走狗屎运的公司。:)

相比CPU的国内外差距, GPU领域国内与国际水平差距就太大了. 其中比较有名的行业龙头是景嘉微, 28nm工艺、1.3G主频, 目前已与国产CPU、麒麟系统适配.

<3>主存

长芯 v.s. Kingston

长江生产的NAND已经开始逐步量产,在成本摊销方面落后于三星。目前主要的问题依然受制于NAND的制造。和SSD一样、我国控制器领域发展繁荣,众多厂商已经开始推出相关产品。

长江存储、合肥长鑫与福建晋华,是中国较为突出的三家存储芯片企业,长江存储主攻 NAND 也就是闪存,长鑫与晋华则是 DRAM(动态随机存取存储器).

韩国半导体在各种超大规模的投资和收购中逐渐成长,我国的半导体行业也走在这样的路上。目前,全球 DRAM 市场基本上被美韩瓜分,三星、SK 海力士、美光的全球市场份额合计在 95% 左右,而中国庞大的需求,只能依赖进口解决。

专利方面

福建晋华就因为专利问题吃了大亏,不仅被禁售,DRAM 的研发计划也被叫停。而长鑫 2019 年,买下了已经破产的原欧洲存储芯片巨头奇梦达的大量专利。并且在这个基础上进行了创新,专利申请数量达到了 16000 个,还有1000多万份、约 2.8TB 有关 DRAM 的技术文件。

技术方面

我国半导体行业依然是处在追赶阶段。目前,长鑫存储把将奇梦达的 46nm 工艺改进到了 10nm 级别,但制程也有高低之分。长鑫的 10nm 存储芯片属于第一代的 1x nm,而美光与 SK 海力士已经开始量产第二代 1y nm制程。而三星电子则是正式宣布已开始量产用于旗舰级手机的 16GB LPDDR5 内存,还计划在今年下半年量产基于 10nm 级(1z)处理技术的16GB LPDDR5内存。

产能方面

长鑫第一期投资约为 72 亿美元,预计产能就有 12.5 万片晶圆/月。当然这是理想结果,长鑫预计 2019 年底能达到 4 万片晶圆/月,达到全球产能的 3%。作为对比,三星等巨头单月产量能达到 130 万片,还有较大差距

未来期待

2020年2 月 26 日,长鑫存储正式发布了其 DDR4、LPDDR4X 内存芯片,以及 DDR4 内存条、几款产品均符合国际通行标准规范。对于中国存储来说,长鑫的 DDR4 是一个节点,标志着中国的 DRAM 在应用市场追上了主流水平。不过,技术上的差距仍然肉眼可见。

未来, 服务器端、云存储、汽车等领域,都将逐渐采用 DDR5 规格. 长鑫存储的规划图显示,公司下一代将推出第二代 10nm(17nm)技术,DDR5 也在下一期规划当中。

随着 PC 市场也开始过渡到 DDR5。当这一规格成为主流后,中国厂商们无疑将会面对的更大的挑战。

<4>外存

???v.s. Seagate & Western Digital & Samsung & Intel

HDD的技术我国可以说无可争辩的0作为。最大的市场份额被西部数据和希捷牢牢霸占,东芝紧随其后。

SSD方面,随着长江的颗粒量产,众多控制器厂商耕耘很久,有很好的驱动国内外NAND的经验,和美国这方面差距不大。

评论