您的位置:主页 > 公司动态 > 公司新闻 > 公司新闻

一张估值20亿的「笑容」,正在拆掉OpenAI的围墙

由ChatGPT引发的人工智能风潮还在凶猛地刮着。但从各个角度来看,现在这都是一个巨头争霸的战场:更大的模子、更强的算力、更多的用户、更雄厚的资金……这些都似乎成为了想要加入这场角逐的门票。与此同时,焦点手艺的研究也逐渐开放走向封锁。

而在这高墙正在筑起的历程中,也有一些新锐的创业公司想要高举旌旗来一场革命。其中,尤其引人注目的是一家名为Hugging Face开源创业公司。

现在,Hugging Face已经是全球*的开源机械学习社区和平台,不仅创下了GitHub有史以来增进最快的AI项目纪录,估值也一起打破了20亿美元。近期,微软和浙江大学团结公布的一篇关于HuggingGPT的论文更是把Hugging Face推到了舞台中央,也让更多人关注到了当前这股与众差其余人工智能生长气力。

|HuggingGPT火了,Hugging是啥?

本月初,微软亚洲研究院和浙江大学团结公布了一项最新的名为HuggingGPT的研究,先容了一个全新的协作系统,闪开发者能够在ChatGPT的辅助下快速、准确地去选择合适的人工智能模子,从而完成包罗文字、视频、语音等多模态在内的庞大义务。

该项目现在已经在Github上开源,尚有一个超拉风的名字叫JARVIS(没错,就是跟钢铁侠的助手一个名字)。在这个研究中,主要涉及到了两个主体,一个是众所周知的ChatGPT,另一个则是AI社区Hugging Face。

图片来自HuggingGPT研究论文

那么Hugging Face是做什么的?

简朴来说,Hugging Face是一个针对人工智能的开源平台,用户可以在上边公布和共享预训练模子、数据集和演示文件等。现在Hugging Face上已经共享了跨越10万个预训练模子,1万多个数据集,包罗微软、谷歌、Bloomberg、英特尔等各个行业跨越1万家机构都在使用Hugging Face的产物。

在HuggingGPT中,ChatGPT通过饰演了“操作大脑”的角色,能够自动剖析用户提出的需求,接着在 Hugging Face 的“AI模子池”里举行自动模子选择、执行和讲述,为开发者们开发更庞大的人工智能程序提供了极大的便利。

虽然在模子上ChatGPT跟Hugging Face能够牵手,但从本质上来说,Hugging Face跟OpenAI现在是在做两个相反偏向的事。其中*的差异点在于,在开发者服务方面,OpenAI现在正在搭建人工智能开发的围墙,仅允许知足条件的机构和小我私人进入,但Hugging Face则希望每小我私人都可以接见天生式 AI 模子,包罗种种企业和所有通俗开发者。

今年2月,OpenAI上线了一个名为Foundry的新开发者平台,允户可以在这个平台上运行OpenAI最新的机械学习模子,但在产物的形貌中,OpenAI明确示意Foundry是为运行较大事情负载的尖端客户设计,而凭证一份价钱表显示,纵然是 GPT-3.5 的轻量级版本,三个月用度高达7.8万美元,一年用度为 26.4万美元。

就在Foundry公布后,Hugging face便马上宣布了其与 AWS 的最新相助同伴关系,并发出了“让人工智能走向开放”的呼吁。通过该相助,任何开发职员都将能够使用 AWS 的托管服务并处置 Hugging Face 上可用的任何模子。

图片来自Hugging face CTO推特

在现在巨头林立的人工智能战场上,Hugging Face就像是一支强有力的民间气力。当巨头们都在起劲保持自己天生式 AI 的霸主职位的时刻,Hugging Face 的目的则是寻找种种途径来保持 AI 研究空间的开放。

而这样特点也让Hugging Face现在颇有一些“中立”的色彩。无论微软、谷歌、亚马逊、Meta这些大公司打得再猛烈,但它们险些全都是Hugging Face的支持者。

那么,Hugging Face事实是若何生长起来的,它详细做着什么样的营业?

|一次歪打正着的创业,作育AI界的顶流“笑容”

在通俗人的眼中,人工智能一直都属于“冷感”很强的手艺领域,无论是充斥着大量数字、模子的算法,照样由种种机械零件组装成的机械人,都难免让人感应有些距离感。但作为专为人工智能开发者服务的Hugging Face却主打了一个反差萌,笑容Emoji再加上一双摊开的小手,logo甚至有点过份可爱。

之以是有这样一个可爱的logo,是由于一最先Hugging Face做的产物着实是一款针对青少年群体的谈天机械人。

那时Hugging Face的想法是基于自然语言处置 (NLP) 的人工智能手艺,来为年轻人们开发一个带有娱乐性、类似于电子宠物一样的个性化谈天机械人,让人人可以在无聊的时刻跟它聊八卦、问它问题、让它天生一些有趣的图片之类的事情。

这种新颖的人机社交模式获得了一些关注。2017年3月9号,Hugging Face App在iOS App Store正式推出,并拿到了包罗SV Angel、NBA球星杜兰特在内的120万美元的天使投资。今后一年多,Hugging Face都一直围绕着自己的谈天机械人营业在做着自然语言明晰的相关训练并公布相关的产物,岑岭时期天天处置的新闻数目到达了1百万条。在2018年5月,它又获得了400万美元的种子轮融资。

难逃网红宿命,「自嗨锅」们不香了

Hugging Face谈天软件界面

虽然生长的还算不错,但由于那时的人工智能的明晰能力和谈天水平远不及ChatGPT这样智能有趣,再加上并非刚需的营业场景,Hugging Face的规模一直都难以扩大。

但为了开发这个谈天机械人,Hugging Face的团队做了一个很主要的事,那就是构建了一个底层库来容纳种种机械学习模子和种种类型的数据集。包罗辅助训练谈天机械人检测文本新闻情绪、天生连贯的响应、明晰差异对话主题等,而且在GitHub上始终以开源项目的形式延续公布该底层库的一些内容。

就这样不温不火地生长了一段时间后,2018年底,Hugging Face迎来了一个主要的转折。

昔时11月,谷歌宣布推出基于双向 Transformer 的大规模预训练语言模子BERT,瞬间成为了自然语言明晰领域最受开发者关注的模子。但一最先,Google只公布了BERT的TensorFlow版本,Hugging Face就想为啥没有Pytorch版本呢?于是Hugging Face首创人之一的Thomas Wolf就用几天的时间完成并开源了PyTorch-BERT,但没想到,就是这么一个“无心插柳”的项目让Hugging Face一炮而红。

借着BERT的东风,Hugging Face的Pytorch-pretrained-BERT公布3个多月后,快速杀青了在Github上5000 星标的成就,到了7月份其Star数目已经跨越了1万,生长速率远超其他同类开源项目,在Github的AI项目领域里一飞冲天。

在这样的生长势头下,Hugging Face的产物战略最先发生了调整。他们将更多精神放到了开源模子的建设上,将 Pytorch-pretrained-BERT项目正式命名为Transformers,同时支持Pytorch和Tensorflow 2.0。

借助 Transformers库,开发者可以快速使用BERT、GPT、XLNet、T5 、DistilBERT等NLP大模子,并使用这些模子来完成文天职类、文本总结、文本天生、信息抽取、自动QA等义务,节约大量时间和盘算资源,今后Hugging Face在人工智能开源领域的名气也越来越大。

Hugging Face在Github上的Star曲线,图片来自于Lux Capital

到了2019年12月,Hugging Face拿到了由Lux Capital 领投的A轮融资,融资额也比上一轮上了一个量级到达了1500万美元。值得注重的是,从这一轮最先,Hugging Face的标签最先不再是谈天机械人,而是把AI开源营业放在了首位。这张可爱的笑容emoji也最先被宽大人工智能开发者们所熟知。

|朝着人工智能界的Github前进

在2019年底All in AI开源之后,Hugging Face最先着手构建一套完整的开源产物矩阵。用Hugging Face自己的话来讲,他们所做的事情,就是要架起人工智能科研和应用的桥梁(bridges the gap from research to production)。

已往这些年,人工智能领域的科研和商业应用是相对自力的两个板块,科研部门的义务就是对前沿手艺举行研究,搞模子、发论文,应用部门的人则是要将*用到产物中探索商业变现。若何将科研功效举行系统性的整合成为开源产物,闪开发者们能够很快上手去应用转化是耐久困扰业界的一个问题。

Hugging Face之前歪打正着地摸到了这个痛点,接着最先认真向下挖掘。简朴来说,Hugging Face就是肩负了人工智能科研走向应用这个历程中险些所有庞大、繁琐、细碎的事情,然后利便任何人工智能从业者都可以去便捷地使用这些研究模子和资源。

现在,除了头号产物Transformers之外,Hugging Face还确立了Tokenizers、Datasets、Accelerate等库,从模子到数据集、从托管平台到性能优化,以开源社区为载体,Hugging Face已确立起了完整的人工智能开发生态,涵盖了 NLP、盘算机视觉、语音、时间序列、生物学、强化学习等各个领域。

值得注重的是,Hugging Face并不是由于ChatGPT带火的。2022年5月,当市场的注重力都还停留在Web3、元宇宙之上时,Hugging Face拿到了有红杉、Lux Capital介入的1亿美元融资,让其估值一举突破了20亿美元。

Hugging Face的融资历史,图片来自于企查查

Hugging Face当前的目的是想成为人工智能领域的Github。其首创团队以为,只有将那些少数人掌握的手艺推广给更多人使用,才气真正*水平地推进整个行业的提高。而从商业的角度来说,Hugging Face以为赋能整个AI社区所可能发生的价值可能比一个专有的工具凌驾千倍,而只要将其中的1%变现就能够足以撑起一个高市值的公司,类似的例子包罗MongoDB、Elastic等等。

除了蓬勃生长的开源社区,从2020年最先,Hugging Face也最先做面向企业的定制自然语言模子,其客户涵盖彭博社、高通、英特尔等种种大中小型公司,并推出了包罗AutoTrain、Inference API & Infinity、Private Hub、Expert Support等针对差异开发者类型的产物。据报道显示,从2021年最先Hugging Face就一直处于正现金流的状态。

Hugging Face的的产物服务,图片来自于其官网

Hugging Face在当前的人工智能领域中能够以开源社区的模式异军突起,有一些有时也有一定。首先,已往这些年,人工智能手艺所取得的提高都是由全天下的科研和产业领域配合协作所推动的,它的手艺基因里着实就带着开放,因此确立起一个平台来链接研究者和开发者顺应了行业生长的历史和趋势。

此外,Hugging Face通过完成大量的基础性事情,来辅助填补在人工智能领域里耐久存在的科学与生产之间的鸿沟,这是已往许多开源平台没有关注和做到的。

在此前的一个采访中Hugging Face的CEO Clément Delangue示意,机械学习手艺仍然还处于早期生长阶段,开源社区的能力将是伟大的。他以为,在未来5到10年,我们一定还会看到更多开源机械学习公司的崛起。