您的位置:主页 > 公司动态 > 公司新闻 > 公司新闻

微软不想被OpenAI架空

扎克伯格同学最近心境很不错。

与马斯克在线热情互喷废物话后,对标“元国际版推特”的Threads仅用了不到五天的时刻完成了1个亿用户的堆集,成为了全球用户总数破亿速度最快的新交际途径。Threads,成为小扎打在马斯克脸上的一击力拳。

但商场的拳台上没有裁判叫停,扎克伯格说Threads的用户规划方针是10亿。而只要到达10亿方针今后,Meta才会仔细考虑Threads挣钱的问题。这一数字相当于推特现在规划的两倍。

扎克是仔细的。无论是恶感马斯克版推特的愤恨用户,仍是Meta帝国多年沉积下的巨大商业机构关系网,都在极短的时刻内涌入了Threads途径。而在很多游牧迁徙的用户中,夹杂着一个硅谷最有权势的光头——微软首席执行官萨蒂亚·纳德拉(Satya Nadella)。

纳德拉曩昔是显贵的推特蓝V,具有307万的用户,每天像AI相同毫无爱情地转推各种微软的新闻公关稿。不过这次他专门注册了一个Threads账号,热情洋溢地宣告了微软将与Meta的“大模型婚姻”:

微软云Azure将帮Meta练习和推行Llama大模型,而Llama也将上线Azure库和适配Windows体系。

而如两边官宣文件所言,Azure从设备、硬件和软件(facility, hardware and software)层面进行了针对性的规划,然后支撑国际*的AI练习。而在本次协作后,Llama的开发者则能够运用Azure AI的东西进行练习、微调、推理和安全方面的功用开发。

巨子之间的云协作层出不穷。但全国际都知道,Azure但是OpenAI的御用云途径。

在2019年微软掏出10亿美元出资OpenAI后,Azure就一向是OpenAI的*云服务商。而Azure为了更好地为大模型供给算力和对外服务,从头进行了部分架构规划。乃至在一些观察者眼中,当年微软决定出资OpenAI的中心原因,其实便是Azure的开展——

究竟彼时Transformer还没有彻底验证,但微软现已多年下注AI并开端将云事务的未来愿景视作是“为AI服务的超级核算设备”。无论是算力支撑,仍是OpenAI敞开全球的chatbot测验,Azure都功不可没。

Altman自己乃至还从前专门发推对Azure团队的给力支撑表明感谢,高度评价微软是“国际上*的AI根底设备”。

现在Sam前脚刚烧了两炷香,纳德拉易手就把这个“国际上*的AI根底设备”租给了扎克伯格。

不知道俩人是不是提早商议好的。又或许对纳德拉来说,这大约都是方案的一部分。总归扎克伯格体现得很快乐。

在扎克伯格的Instagram账号里,他贴出了一张与纳德拉的密切合影以“感谢纳德拉”,扎克伯格表明:

“(Meta)将Llama2开源给了微软,而(这次开源)将成为下一代大模型建造作业的根底。”

微软与Meta的确是彼此需求的。

Meta正在走向大模型的“深水区”,在70B参数的Llama2现已到达了GPT3.0的水平,简直现已成为了现在口碑*的大模型底座。关于闭源大模型阵营来说,Llama2成功带来的压力一点不亚于Threads关于Twitter的震撼。

闭源公司花几千万搞不出来的东西,开源社区能够直接用,相当于将未来全球开源大模型社区的起跑线提高到了3.0的水平。

最近登顶HuggingFace开源大模型榜单的Stability的Freewilly大模型,被以为挨近3.5的水平,正是根据Llama2.0调教优化后的产品。

关于Meta来说,参数规划的提高带来核算量的攀升、模型的逐渐老练也让看到更好的商用潜质。但假如要打败这些困难、执行这些潜力,扎克伯格需求一个更高效的协作伙伴。而那些Azure现已有的、但Meta没有的东西,关于Llama来说就显得更重要了,比方Azure的算力经历、Azure的AI东西箱、以及Azure的云自身……

Meta是为数不多没有公有云服务的互联网巨子。

在曩昔,Meta与亚马逊都互为对方的超级大客户,包含Meta的一些AI研制算力,也都是收购的AWS。而微软这次撬墙角的方案,除了敞开Windows场景以外,还敞开了Azure的企业途径才能,将Llama2加入到自己的产品名录中。

Azure尽管在全体市场份额中仍然落后AWS,但是在SaaS出售范畴却明显*于同类竞赛对手。而跟着云与SaaS的交融,微软在途径层面有明显的差异化优势。经过Azure,Meta和它的生态追随者们能够直接经过云端来出售和运用Llama2的产品。

关于微软来说,大模型的应战则愈加多元的。

微软曩昔在大模型运用层面简直是all in OpenAI的产品。无论是最早接入的Bing,仍是根据Windows生态的Copilot面向开发者的东西生态AI Studio、乃至是新的AI云服务品牌OpenAI Azure,背面都是OpenAI的影子。

OpenAI是全球*的大模型公司,Windows仍然是全球最重要的生产力软件生态。但在大模型全球军备比赛中,这两者的结合并不意味着*的稳操胜券。

与Meta和微软结合简直一起“官宣”的,则是苹果的大模型方案。

据海外媒体报道,苹果现已完成了名为“Ajax”的大预言模型根底结构,将开发相似ChatGPT的对话式AI。而消费级产品的推出时刻则方案在下一年发布。

苹果的进场被以为是硅谷大模型比赛中的重要变量。

比较于公有云之类的互联网风口,AI是被苹果管理层高度认可的科技方向,近期管理层口风也有朝着AI加码的趋势。

除了长时刻重视AI科技外,苹果是全球最有钱、最有场景的公司。苹果每年净利润挨近1000亿美元、运营净现金流超越1200亿美元,相当于微软与Meta的总和。苹果生态现已超越微软成为全球*的关闭操作体系,活泼设备数量超越20亿,而微软只要15亿。

而比较于账面实力外,苹果更具想象力的是它的半导体才能。它或许是全球参加大模型比赛的科技企业中,为数不多将来能够不必外采GPU与CPU的厂商。不仅如此,苹果的芯片功率好像更有想象力。

在2023年WWDC上,苹果推出的M2 Ultra芯片。比较于一般厂商CPU、GPU别离的布置方法,M2 Ultra一致内存架构以及随之带来的超高内存带宽,乃至能够让开发者在一张卡上就能跑大模型。

尽管相似的消费级芯片还无法和英伟达的专业芯片相媲美,但相似小秀肌肉,也让外界对苹果未来的GPU算力延展才能产生了爱好。

以OpenAI为例,外界预估其大约一起动用了两万张显卡进行核算。但王小川近期对媒体表明,OpenAI正在测验1000万张显卡一起核算的模型,相当于英伟达现在10年的产能,“彻底是登月方案(等级)”。

除了苹果以外,微软、谷歌、Meta、亚马逊等巨子都有自研AI芯片的方案,但现已有*半导体开发才能的苹果仍然是最有资历“大力出奇观”的人。

谷歌凶狠、苹果凶相毕露,微柔和Meta挑选结盟。

关于纳德拉来说,与Meta队形站位能够让微软在大模型的生态战役中愈加安定。

首要,微软仍然需求开源,开源在未来的大模型竞赛中将继续扮演重要的人物。

开源天然具有人才参加很多、迭代速度快、垂类掩盖功率更高的生态才能。尽管OpenAI拿下头筹,但开源社区的前进速度仍然很可观。比方Llama只用了大半年的时刻、运用参数70B,现已赶上了175B、耗时2年的GPT3。

尤其是假如未来开源道路成为了职业解决方案的干流,Llama与Azure深度结合,或许真的能够协助微软云事务完成对AWS的弯道超车(2022年末Azure市占率23%、AWS为32%)。究竟比较于Windows和Office,Azure才是微软*钱、最有潜力的事务。

其次,开源大模型的不断开展,必定让乐意砸钱做关闭体系的厂家也自然会越来越少。

比方Bard在Llama2之后就受到了不小的压力。除了许多好事者在晚上评论bard未来长时刻开展的压力外,有媒体报道称谷歌内部人士也曾撰文称bard在对立开源社区时长处费劲,后者前进神速且本钱更少、场景更丰厚。

在大模型超级投入的产业结构没有改变的情况下,关闭式大模型仍然会有其存在的合理性,但或许将仅仅限于极少数*者,而其中大约率会有OpenAI。

假如OpenAI有护城河,那它的姓名或许叫Llama2。

当然,OpenAI其实也并不是微软的“亲儿子”。

在100亿美元出资后,微软尽管具有75%的分红权,但实际上也只占有OpenAI 49%的股权。换言之,微软尽管手握很多的OpenAI资源,但并不彻底具有OpenAI*的控制权。

但与llama协作像是一个标志,手握OpenAI的微软其实正在成为游戏规则的制定者:

它既有*潜力的AI根底设备Azure,也有最前沿的商业化变现接口Windows copilot。而当最中心的根底设备和途径才能在微软手上时,OpenAI也仅仅微软的“超级程序员”。

当Meta等途径老练后,微软能够再引进更多的“程序员”,乃至敞开更多的体系级场景给开源生态、然后让Windows体系的生产力进一步提高。

实际上,OpenAI本来就仅仅纳德拉重注AI和言语大模型的一个选项。

在ChatGPT之前,微软乃至和英伟达协作开发过5300亿参数的大言语模型威震天-图灵Megatron-Turing,是当年*的根据transformer的模型,参数比GPT3多了好几倍,考究的是*的大力出奇观。

可最终威震天仍是输给了奥特曼,所以威震天才挑选了买下奥特曼。

但微软内部其实一向没有抛弃大模型的相关技能道路开发。

例如6月时,微软就发布了13亿参数的“小型”大言语模型 phi-1。有OpenAI作为中心财物,微软不走“大力奇观”形式,而是改用声称“教科书等级”的高品质材料集练习模型,让实际效果胜于千亿参数的 GPT 3.5。7月时,微软还提出了新的大模型架构RetNet,称其能够在更大数据维度根底上,比transformer更优。

大模型的战事还远没到中场,威震天与奥特曼们的游戏或许才刚刚开端。