您的位置:主页 > 公司动态 > 公司新闻 > 公司新闻

Midjourney:伟大的公司只需要十一人-香港期货开户

现在,随着AI手艺的快速迭代,种种基于AIGC(人工智能内容天生)手艺的产物不停涌向社会,而其中最普遍的,则莫过于大量的AI绘图模子,如Midjourney、Dreambooth、Novel AI和Stable Diffusion等。

虽然AI绘图领域,看似进入了百花齐放的时代,但现在业内的顶流,仍然是Midjourney和Stable Diffusion为代表两大龙头。

今年4月,Midjourney进一步宣布推出针对二次元、动漫气概的绘图模子Niji-journey V5。

这一模子与以往*的差异,就是它能“取代”高级原画师了。

依附着出众的造型张力和色彩使用、以及厚实的气概化显示力,Niji V5不光看傻一众吃瓜群众,甚至惊艳了业内画师,让人直呼其已经具有了大师插画的味道。

之以是能够云云质变,一大缘故原由在于相较此前版本,Niji V5 支持了气概化(stylize)参数设置。

简而言之,在该版本下,用户只需使用气概化下令,就能引用差异艺术家设计气概产出图片。

在Niji V5的助力下,人们容易地天生了许多“大师级”的作品。

Niji V5产出图片的品质相当优异,险些笼罩市面上的常见气概。在此基础上,使用者只需要微调设计,基本能够到达大部门优异高级原画的事情需求。

云云精彩的手艺,不禁让人对其背后的Midjourney公司发生了强烈的兴趣。

现实上,虽然Midjourney和Stable Diffusion同为当前AI绘画的两大领军者,但其当下的境遇却有着天壤之别。

Stable Diffusion背后的明星公司——Stability AI,现在正面临严重的财政逆境,由于没有明确的盈利途径,公司正面临倒闭的危急。

相较之下,Midjourney却运行得风生水起,依附着付费订阅的商业模式,Midjourney不仅获得了每年1 亿美元的营收,而且在Discord上已经积累了1000多万用户。

同为开发绘画AI的团队,Midjourney是怎么取得今天的成就的呢?

延伸人类想象力

虽然Midjourney在不融资的情形下就实现了盈利,但从确立的靠山来看,首创人大卫·霍尔茨(David Holz),并不像那种钻进钱眼里的人。

他为Midjourney设立了一个异常不“铜臭”的宗旨:AI 不是现实天下的复刻,而是人类想象力的延伸。

而这样充满科幻色彩的宗旨,和大卫的靠山、履历有着很大的关系。

作为一个数学专业的博士生,大卫曾在大学时代研究激光雷达、大气科学和火星义务,可谓是一个涉猎甚广,且充满好奇心的“怪才”。

经由了普遍的探索后,大卫似乎找到了自己真正的兴趣所在,于是,在2010年便建立了一家研发手部跟踪手艺为主的公司——Leap Motion。

然而,由于与之相关的VR/AR手艺一直不成熟,Leap Motion也始终没能做出有详细应用场景的产物。

大卫之前研发的手部追踪产物

最终,2019年,大卫把 Leap Motion 公司卖给了竞争对手 Ultrahaptics。随后,他确立了一个事情室来探索新的时机,

恰巧在这时,AI在天生艺术方面取得了突破。

Transformer架构的泛起,彻底改写了图像合成的历史。今后,多模态深度学习整合了NLP和盘算机视觉的手艺,成为图像合成的艺术方式。

于是,借着天生式AI的东风,大卫确立了Midjourney。

公司团队成员仅11人,其中1位首创人、8位研发职员、1位法务、1位财政。

在公司的组成中,完全没有产物司理、市场销售职员,除了首创人、两个支持性岗位(法务、财政),80%的职员都是研发职员。

而作为中坚气力的研发成员,一半(4位)都是尚未结业的本科生。

虽然这四位本科生都有一些实操甚至是创业履历,然则确实履历有限,而且也非结业*名校。

剩下来的几位研发职员,都有着对照厚实的职业履历。

在聚拢人才后,大卫也进一步明确了自己对于Midjourney的理念。

大卫将公司Logos 设计成了一艘在海浪中航行的风帆,意为水既危险,又是文明的驱动力。

明白若何与水一起生涯和事情的人类,将有能力在水中游泳、做船、筑坝发电,从而更好的生涯,因此,大卫以为AI是人类想象力的引擎。

然而,在那时天生式AI的竞争名目上,有这类“雄心壮志”的团队,可不只Midjourney一家。

例如Stable Diffusion的母公司 Stability.AI,在建立时也声称要将自己的使命定格为成为天下*的开源AI公司,并发扬将AI共享于全天下的理念。

然而,口号喊得震天响,理念终归是不能当饭吃的啊。

情怀满满的大卫,之后是怎么解决一系列公司融资、盈利的问题的呢?

开源VS闭源

颜宁院士等发起,光明致远科技基金会成立

从今天来看,Midjourney的盈利模式看上去十分简朴,即通过付费订阅的商业模式,按月向用户收取用度,其尺度有3种套餐,划分是10/30/60美元/月。

不外,这样的模式要想行得通,得解决两概略害问题:

1.凭什么让用户发生付费的意愿?

2.大模子训练所需要的高昂成本怎么解决?

先来说说*点,现实上,当AI图像天生手艺最先如日中天之时,许多使用者并不以为这种手艺是需要“付费”的。

缘故原由就在于,那时像Stable Diffusion这样的行业龙头,为了吸引大量的开发者,*水平的把模子用起来,因此接纳了开源的模式。

和Dall·E、Midjourney差异,Stable Diffusion是完全免费、不限次数、任何人都可用的。

虽然对硬件有着一定要求,但也能在几秒钟内天生高清图像。

这样的利益在于,开源社区会同心协力地完善模子文档,配合解决手艺难题。这使得代码的迭代速率异常快,优化效率远远高于闭源系统。

但瑕玷也很显而易见,那就是商业化不够直接,可能为别人“做了嫁衣”。

而相较之下,Midjourney却接纳了不那么开放的“闭源系统”。

若是说闭源系统真的有什么利益,那就是针对性更强了。

由于模子闭源,并通过重大的用户量积累了独占的数据集,可以凭证用户需求不停地针对性训练模子,耐久来看更有利于确立竞争壁垒。

在探索用户需求这点上,大卫接纳了产物上线后边测试边改善的设施。

例如Midjourney模子最最先很慢,需要20分钟才气出一张高质量的图片。厥后团队推出了一个做15秒生产图片,然则质量没那么高的版本,

经由多轮测试,团队领会到,速率和质量着实都只是表象,由于差异用户的选择,现实上是多维度的。

在针对用户需求举行调整后,无论是创意行业设计者,照样通俗兴趣者,都能通过Midjourney知足自身的绘画需求。

除了领会用户需求外,在使用流程方面,Midjourney也并不像Stable Diffusion需要内陆部署,操作十分便捷,对显卡和硬件性能也险些没有要求。

虽为闭源,但Midjourney在使用难易度上,却更像一个“亲民”的民众产物。

于是,Midjourney 获得大量用户后,养成了用户使用习惯,且在开启付费订阅后就进一步增强了用户粘性。

算力难题

适才提到,Midjourney在硬件方面,对用户险些没什么要求。而这样的缘故原由,则是由于Midjourney所有的图片都是在云上完成并训练的。

但云云重大的云盘算量,一定需要高昂的成本,这就回到了适才的第二个问题:

在没有融资的情形下,在云上举行大模子训练所需要的高昂,该成本怎么解决?

现实上,大卫解决这个问题的方式很简朴,也很不能思议。

当大卫需要找到一个云供应商提供10,000个GPU时,他直接给云供应商的卖力人发了封电子邮件,效果对方就直接给到了这些资源,完全不需要风险投资。

看到这儿,也许有人惊得下巴都掉了,这种事在现实中真的可能吗?

固然,供应商并不是抽风了,而是看中了大卫之前的成就和声誉。

大卫之前的创业已经获得了声誉,大卫打从开办Leap Motion的时刻起就有一个看法,他以为手艺的*限制不是规模、成本或速率,而是人们若何与之互动。

Leap Motion的手势互动是一个实验,到了Midjourney这里,他最先使用更短的绘画要害词(prompt)来催动AI产出。

这样的理念,吸引了每一个领会大卫的人,也让他获得了云供应商的支持。

然而,在获得了供应商的鼎力支持后,大卫也仍然要面临算力左支右绌的问题。

从成原本说,Midjourney约莫10%的云成本用于训练,90%是用户制作图像的推理。以是险些所有的成本都在制作图像上。

为解决这一点,Midjourney在天下上八个差其余区域,设立了自己的服务器,好比韩国、日本或荷兰等,在每个时区的夜间,当地人都在睡觉,没有人使用GPU。Midjourney就可以充实行使这些算力,实现GPU负载平衡。

现实上,这种依赖云端服务器来降低成本、加速模子训练的做法,与现在腾讯训练大模子的计谋十分相似。

在算力已经愈发成为大模子训练瓶颈的今天,若是在训练开发环节,直接挪用云端的大模子和AI算力资源,完成后一键分发到用户终端上,就可以大大降低成本,削减事情量。

因此,Midjourney “云上盘算”的这一步棋,着实是摸准了时代的偏向。

互联网的演进之路,已经说明,无论To B照样To C行业,都在追求越来越集约精简的终端硬件、越来越低门槛的交互入口、越来越轻盈的软件应用。

以是说,大模子从云入端,是模子服务商实现商业化的必争之地。

总结

从Midjourney看似不能思议的创业履历,我们可以发现,在这次AIGC时代的浪潮中,能够脱颖而出的企业、团队,未必是财大气粗的头部大厂。

由于在天生式AI、云盘算等手艺逐渐抹平大企业与中小企业之间的手艺、成本差距后,各企业真正比拼的,只剩下人才、创意与执行力。

而这也是为什么, Midjourney这类仅有寥寥十几人的小团队能脱颖而出的缘故原由。由于这样依赖少数尖端人才组建的团队,具有大企业所没有的天真性、创见和气概气派。

而这类小团队的创意、灵感,若要真正在市场、社会中扎下根,就离不开对用户多样化、个性化需求的追踪。

这是由于,AIGC手艺的“泛用性”,决议了其绝不是针对某一行业、人群,或是某一类企业的手艺。

只有在这多样化的需求中,尽可能地知足差异层级用户的特定需求,一款产物才气真正地具有久远的生命。

既服务所有人,又不忽视每一个特殊的人,这或许就是Midjourney乐成的*缘故原由。