
Sam Altman的早期经历Altman的成长关键词——敏感和野心。Sam Altman出生于1985年芝加哥,犹太家庭,其目前Connie是医生(其外公也是医生),其父亲Jerry从事房地产管理,其父亲给Altman最大的教导据说是:永远要帮助他人,即使没时间也要想办法。Altman的家庭有三男一女,Al……
本文来自微信公众号: XYY的读书笔记 ,作者:肖俨衍,原文标题:《【读书】OpenAI崛起史:奥特曼的无界野心》
Sam Altman的早期经历
Altman的成长关键词——敏感和野心。Sam Altman出生于1985年芝加哥,犹太家庭,其目前Connie是医生(其外公也是医生),其父亲Jerry从事房地产管理,其父亲给Altman最大的教导据说是:永远要帮助他人,即使没时间也要想办法。Altman的家庭有三男一女,Altman是大儿子,后面还有Max和Jack,最小的女儿Annie比Altman小九岁(其妹妹后来和Altman打官司,诉讼性虐待等)。Sam Altman(以下简称Altman)据说小时候充满好奇心,且有很强好胜心,当父母给他买了台Mac电脑做礼物,Altman很快学会了编程。中学时,Altman转入顶尖私立中学John burroughs(说明家境不差),他不仅学业可以,还积极参加课外活动,成为水球队长,学校联合国队长等,看起来像个天生领导者。其英语老师回忆Altman善于言辞,作文写的很好。在光纤外表背后,Altman也是个敏感的人,他经常焦虑,经常打电话给目前说自己头疼。也是在中学时期,Altman发现自己是Gay,其目前表示惊讶,但是表示理解。敏感和野心是Altman两个成长关键词。
创业者Altman。2003年中学毕业的Altman进入了斯坦佛大学,专业是计算机,他想过当作家,也想过当投行家,后来觉得这些都不够赚钱。他发现当时手机即将具备GPS功能,于是开始准备基于位置功能来创业。也正是在此时,Altman遇到了Paul Graham,当时其刚刚开始成立YC孵化器。2005年Altman成为第一批加入YC孵化器的创业者,他的项目Loopt是一个基于位置功能的社交应用。2005年Loopt拿到了红杉等500万美元投资,Altman也从斯坦福辍学了。Loopt不能算很成功的创业,2012年其出售价格为4340万美元,和投资者投入的钱差不多,但如果你去看Altman当时采访,你会觉得他是年轻创业领袖——Altman已经锻炼出极佳的媒体PR能力和讲故事的融资能力。比如当时有人质疑基于位置有泄露隐私嫌疑,而Altman则说我们已经超越了隐私年代,未来用户分享位置将变得司空见惯(这个想法和当年Zuckerberg异曲同工)。有人将Altman称为融资赛道的“博尔特”,据说他本人有类似乔布斯的“扭曲引力场”,仍然不知不觉掉入设计好的故事,Altman还精通于看人下菜碟。Loopt期间,据说有两次高级员工要求董事会开除Altman,其中一次原因是其将个人利益放于公司之上(甚至牺牲公司利益),另一次则是说谎。这两次事件董事会最终都支持Altman。
Paul Graham和Peter Thiel,硅谷的社交皇帝。26岁的Altman卖了Loopt后身价500万美元,他认为这是失败(乔布斯25岁已经2.5亿美元了)。不过,随着Altman在硅谷创业圈不断积累核心资源,他的身价也将持续上涨。2012年,卖掉Loopt后,其成立一家私人投资公司Hydrazine Capital,其弟弟Jack和Max后来都会加入这家基金(之前都在YC投资公司任职)。Altman最重要两位导师是Paul Graham和Peter Thiel。Paul Graham1998年将自己创立的Viaweb以4900万美元卖给了Yahoo(受益于互联网泡沫),后来成为著名的创业主题博客创作者,YC成立后,他便成为了创业导师。当Altman卖掉Loopt时候,YC已经成功投出Dropbox,Airbnb等明星项目,YC也成为硅谷著名的创业资源圈。早在2006年,Paul Graham据说Loopt是最有潜力的项目,并且说Altman像19岁的比尔盖茨。Altman23岁时,Graham将他比作乔布斯。Graham实在太喜欢Altman了,以至于2014年让28岁的Altman成为YC的总裁。据说Altman听到消息后第一次无控制地大笑起来。Peter Thiel则是著名的Paypal黑帮一员,并且是Facebook早期投资者(指导Zuckerberg),也是Palantir的投资人。Thiel经常有一些异于常人的正确言论。Altman的Hydrazine Capital和Thiel的基金有合作往来,俩人成为紧密合作伙伴。2014年Altman回斯坦福教创业课程,还邀请Thiel当嘉宾。Altman很快成为硅谷的Social King,并且诸多创业者例如Airbnb的Brian Chesky,Stripe的Greg Brockman等形成了投资和朋友关系,有些投资创业者也是他本人的男友。当朋友遇难,Altman经常慷慨解囊。然而,当Thiel开始支持共和党时候,Altman选择支持民主党,Altman甚至认真的尝试竞选加州州长,但没有成功。
OpenAI的发端
契机,一次关于AI威胁论的对话。OpenAI故事的开端还是Elon Musk,2013年Musk和长期好友Google创始人Larry Page聊到AI超越人类的事情,Musk显然认为这是人类的危机,但Page不以为然,他认为这将是下一代进化论。俩人争论后,Page还说Musk是歧视非人类物种。同年,当Musk听到Google收购了DeepMind后,他后背发凉,他从此认为DeepMind是恶魔,应该被阻止,而这是OpenAI成立的理由。2015年,比Musk小14岁的,以Musk为偶像的Sam Altman(在当时是),以YC总裁的名义给Musk写邮件,提议由发起一个“AI的曼哈顿项目,以AGI为终极目标”,Altman建议由他和Musk俩人加入董事会,同时邀请三位核心成员加入。以Musk的名气为杠杆,Altman邀请了Greg Brockman(Stripe创始团队,是YC孵化公司),Ilya Sutskever(当时在Google,Alexnet作者),Dario Amodei(在百度、谷歌工作)等洽谈组建公司。
OpenAI成立。Grog Brockman是第一个决定加入OpenAI的,他是个天生创业者和10倍编程高手,后来其加入Stripe成为CTO,并且很快实现了财富自由。Ilya Sutskever出生在苏联,生长在以色列,其导师是后来因为AI奠基获得诺贝尔奖的Hinton,2012年著名AlexNet开启了深度学习时代,而Ilya Sutskever和导师创立的公司DNNresearch也以4400万美元被Google收购,后者加入了Google。Ilya最开始有点犹豫。Musk,Altman,Brockman三个OpenAI创始成员,他们同意Altman建议采用非营利组织的架构,用Open来反击Close的Google。Musk认为第一笔融资金额应该10亿美元,太少了显得等级不够,钱的问题他来解决(这个数字就是PR,Musk据说到退出先后也就投了4000多万美元)。2016年1月,Ilya Sutskever(Google给他开了200万美元年薪,OpenAI是17.5万美元+YC或者SpaceX的股票,他还是选择加入OpenAI)对Open又做了阐述:Open的定义是普通人将因为AI而受益,而不是分享所有科学发现。几个月后,OpenAI的员工就翻倍了(高薪聘请了不少优秀人才),包括Dario Amodei(后来Anthropic创始人)加入OpenAI负责AI安全方面研究。2016年OpenAI总开支是1100万美元,其中工资700万美元。
Scaling Law的前瞻认知。早期的OpenAI,Musk和Altman都不算全职,早期OpenAI也没什么亮点或者创新的项目。2016年3月DeepMind的AlphaGo击败了围棋冠军李世石,成为现象级事件,看到竞对突破的Musk有点坐不住了,他开始要求更多进展,包括时间路线图。2017开始Brockman和Sutskever开始规划研究路线图,Sutskever靠经验和直觉认为核心是算力大小,他已经形成了后来Scaling Law的信仰,他认为更大算力、更多数据,更复杂算法都会带来更好的模型,而其中算力是核心。基于摩尔定律,Brockman和Sutskever计算出来认为算力更迭太慢了。但Amodei的团队发现AI芯片算力从2012年以来实际上是每3.4个月翻倍,这就够用了。于是OpenAI接下来核心目标有了——增加更多芯片和算力(前瞻性认知)。2017年英伟达有8个GPU的算力单元售价是15万美元,OpenAI认为仅训练一个模型,自己需要几千张,甚至几万张。但算力等于投资,Altman和Musk此时更加认真考虑将OpenAI转变为一家传统营利性的公司,俩人此时还开始争抢成为OpenAI的CEO。当时AI顶尖人才争夺已经开始,而OpenAI由于无法发股票从而有核心劣势。Musk甚至提议OpenAI应该和特斯拉合并,这样后者可以提供前者研究需要的现金流。不过此时Altman已经放弃从政理想,准备全职掌管OpenAI,而Musk则已经开始萌生退意。在OpenAI早期10亿美元承诺中,其实际拿到的钱是1.3亿美元,而其中4500万来自Musk。在Musk给Altman邮件中提到他认为OpenAI和Google竞争获胜的概率是0,而不是1%。
GPT2萌芽,微软投资10亿美元。OpenAI此时的项目重心转移到训练打游戏的Agent(Dota2),当时DeepMind也训练类似的游戏Agent,它们都战胜了当时全球最顶尖的游戏专业选手。2019年,Altman也正式放弃了其在YC的总裁角色(被投诉不务正业),真正全职加入OpenAI。与此同时,Altman也设计一套兼容非营利性和融资方案——设置已经投资者回报的上限,同时限制投资者的投票权。OpenAI的员工开始从非营利公司辞职加入营利性子公司。最开始6000万美元融资其中1000万来自YC,而5000万来自Hoffman(Linkedin创始人)等基金会。此外,Altman开始以微软的CEO Satya Nadella为目标展开融资计划。2019年微软的高管开始陆续秘密拜访OpenAI,其中包括比尔盖茨。对于盖茨,打游戏的AI不吸引人,除非AI可以读书,了解科学概念等,而OpenAI当时跟这个相关的是GPT2(语言模型),其有15亿参数,可以做基础的文档总结、回答问题等。看了Demo后,盖茨最终没有反对这笔投资。2019年微软宣布投资OpenAI10亿美元,Altman在全员会上高调宣布微软投资重大意义。而对于微软内部来说,这笔投资至少能够保证在AI领域领先性——微软显然也因为落后于Google而焦虑。而微软也获得了OpenAI技术独家在Azure发现的权利。
GPT-3系列获得成功
从GPT-1到GPT-2。Ilya Sutskever是OpenAI追求的Scaling Law的始作俑者,他本人有深度的信仰。Ilya自己一般不编程,他更像个布道者(或者先知),每次开会只说一句话:Scale,Scale,Scale。Transformer成为那个Scale的核心算法,其最初由Google提出,后者将Transformer视为可以改善搜索、翻译等核心功能的技术,而Ilya则看法不同,他认为Transformer是简单且可规模化的神经网络,这正是他想要的。当时这种想法并不主流,很多AI学者觉得Transformer将不堪重任。Alec Radford是当时OpenAI一名工程师,他在Google就拿7000本英文书训练过翻译模型。这次他直接训练模型让其预测下一个单词,而不是做翻译。Ilya也认为智能就是压缩,而训练一个生成模型,本质上是强迫模型压缩世界信息。2018年,GPT-1出炉,当团队给Musk演示时候(Musk当时还没离开),模型只能输出一些低质量的文本,Musk完全没感觉。GPT-1完全没有吸引人和关注。与此同时,Amodei的团队正在实验另一项技术——将AI和人类进行对齐,即后来的基于人类反馈的加强学习(RLHF)。Amodei(负责AI安全)和Radford联合开始训练GPT-2,其有15亿参数,当时已经是行业最大。GPT-2效果不能算惊艳,但是已经能够规模化产生可读文字,其性能提升进一步确认了Tranformer的潜力,以及Scaling Law是成立的。Amodei的团队甚至发现模型预测准确性和模型大小、算力规模、数据多少成正比。GPT-2甚至在OpenAI内部掀起了辩论——是否应该发布这么强的模型?(安全性),最后他们决定留一手:OpenAI将分阶段发布GPT-2,从参数小的到参数最大的,且从小范围测试开始。
GPT-3,获取大量互联网数据。GPT-2系列获得进展后,OpenAI将Dota2游戏Agent团队解散了(Brockman的项目,其因此和Amodei结仇,这为后者后来离开OpenAI埋下伏笔),公司AGI使命将全部押注在语言模型上。此前还有很多人怀疑纯语言路线,不过GPT-2出现还是堵住了很多人的嘴。OpenAI当下要做就是越快Scale越好——GPT3规模越大越好。当时已经接近微软10亿美元投资,OpenAI将得到1万张英伟达V100(当时最先进),当时MIT大学研究能有10张GPU训练已经是奢侈了,而OpenAI将全部用上这一万张卡来训练GPT-3,这看起来很疯狂,而主导者Amodei也被提升了负责研究的VP。Altman也认为GPT-3会是OpenAI给微软交的满意答卷,因此同意加速推进。GPT-3的结构和GPT-2基本相同,只是算力、数据规模大了100倍(1750亿参数)。当用1万张卡集群训练时会有很多工程问题,比如任何一张卡宕机可能使得整个模型训练要推倒重来,因此需要设计新技术可以随时恢复模型训练(而不是从零开始),这是分片技术。对于数据,GPT-2在基于互联网数据选择了40G的训练数据,叫WebText。而对于GPT-3,包括Reddit,Wikipedia,一个神秘图书合集Books2(出版图书,后来有作家还起诉OpenAI)。这些还不够,OpenAI后来用爬虫几乎爬到了公开互联网上大部分文字数据,再以Wikipedia为模板清洗数据,得到了训练集。实际上,到GPT-4时候,OpenAI直接将原始大量数据喂给了模型,此时还获得了来自微软的Github,以及爬虫Twitter,Youtube等数据,其对于数据体量要求胜过了数据质量。OpenAI初期训练几乎很少考虑训练数据版权(海盗模式),相对来讲,Google对于训练集数据的版权等因素就考虑相对保守。针对模型的输出,OpenAI在肯尼亚找外包团队,利用基于人类反馈的加强学习(RLHF)来训练模型的输出方式。
GPT-3发布,在圈内形成影响力。Altman和微软达成融资合作后,决定每年要发布一个惊艳模型,这样激进态度引起了Amodei对于AI安全的担忧,分歧开始加剧。不过Altman本人也更注意另一方向的AI安全——OpenAI不再发布模型参数,保护自己独有科技。Altman将OpenAI分成三股力量,其中Ilya主导研究,Amodei主导安全(也负责训练GPT-3),而Brockman则主导创业,也就是主要是应用。Altman和Brockman主导开发了OpenAI的GPT系列模型的API(后来还增加编程AI方向),Mira Murai(后来CTO)则被提拔为应用部门负责人。应用部门成为OpenAI内部最激进推动模型发布的力量(要求提前发布),而其他部门对于AI安全重视的则成为保守派(经常要求延迟发布模型),两派之间斗争越发激烈。GPT-3的发布延期了几个月,最后是传言Google即将发布类似语言模型,OpenAI最终在2020年6月推出了API,并且接受测试用户。不过Google的LaMDA大模型(比GPT-3小一点)最终没有发布(估计是害怕一些负面问题出现)。GPT-3在技术圈子里已经有不小的影响了,虽然还未像ChatGPT那样破圈。
Amodei带队离开成立Anthropic。GPT-3成功后,Altman继续和微软谈20亿美元投资,并且将投资回报上限设定在6倍。微软将在Azure上独家提供OpenAI模型的API。此外,公司重心全面聚焦GPT系列模型,此前机器人团队也解散了。以上这些都是Altman拍板决定,Amodei和他的安全团队感觉到被冷落,2020年末,Amodei带着几个同事出来创立了Anthropic,名义上的原因是担忧OpenAI处理AI安全的态度,实际原因估计一大半是权力斗争。Anthropic采用和OpenAI类似的技术路线,并且模型和技术也是封闭的。GPT-3系列模型自然吸引了Google注意力,元老Jeff Dean(Google Brain负责人)提议集中资源训练一个大模型,但是公司内部没人理他。Google的傲慢要到ChatGPT之后才能被打醒。在Meta内部,高管表示没兴趣,尤其是杨乐昆,其一直鄙视OpenAI这种纯粹大力出奇迹的模式。在中国,例如阿里,华为,百度等,仅将GPT-3视为技术创新之一,也没有足够重视。
OpenAI的技术和产品探索。OpenAI对于Scaling Law深信不疑,接下来主要工作依然是训练更大的模型——GPT4,其基于微软提供的1.8万张A100,包括提高计算效率25倍等。新的研究路线包括:训练新的其他模态生成模型;利用现有产品进一步收集用户数据,构建数据飞轮;模型蒸馏,即用大模型训练小一些的模型;数据清洗,稀疏模型(MoE)等。其中,OpenAI最看好的路线则是推理和持续学习(Reasoning and active learning)(后来的o1的技术)。OpenAI的应用团队开始招募市场营销、安全团队(这个不是AI安全,而是产品安全,比如测试bug,输出正确内容等)。当时已经出现一些api的用户用GPT-3生成色情内容,OpenAI采用的原则是情绪价值内容可以,色情内容禁掉(后来Altman又自己说要推出成人版)。编程模型成为OpenAI第二重要产品线(2021年发布Codex),并且和微软讨论合作(后者2018年收购了Github)。为了增强编程能力,OpenAI又爬取了Stack Overflow等数据。微软基于此发布了Github Copilot,并且年化收入达到1亿美元。这在OpenAI内部引起了不满,他们更坚定要自己直接推出产品(钱被微软赚到了)。
Altman个人投资和财富。2021年,Altman完成自己最大两笔个人投资,1.8亿美元投资生命科学公司Retro Bioscience,其主要研究通过换年轻人血延长寿命。此外3.75亿美元投资Helion Energy,主要研究核聚变发电。微软后来还和Helion签订了能源合约,2028年交付。Altman经常公开表示自己没有OpenAI的股权(为了不和AGI冲突),自己年薪6.5万美元。实际上YC是OpenAI重要初创股东,而Altman在YC里面有不少份额,可以说其通过YC间接持股OpenAI。YC最初投资OpenAI 1000万美元,其回报最高可达到10亿美元。WSJ估算,2024年6月Altman个人财富应该达到28亿美元。
ChatGPT横空出世
从控制输入到控制输出,RLHF。GPT-3系列以后,数据越来越不够用,此前优选输入数据这套开始行不通了,大量原始数据直接训练模型。模型控制也从控制输入,变成了控制输出。这就需要依赖此前一项技术即基于人类反馈的加强学习(RLHF)。这个环节涉及了大量的外包工作,包括Scale AI等都是从事这行,这些工人主要在肯尼亚,委内瑞拉等。其中Scale AI的Alex Wang据说还曾是Altman的室友,OpenAI还曾经尝试收购Scale AI(也可以理解下为何Zuckerberg看上这个Alex。Peter Thiel,Zuckerberg,Altman,Alex)。这些外包人员对所选答案要求是helpful(有帮助),truthful(真实),harmless(无害),其中无害和真实重要性大于有帮助(情商大于智商)。由此,RLHF还可以帮助减少模型幻觉(真实性)。InstructGPT是基于RLHF训练出来的基于人类表达习惯输出的模型,其基本能够遵循人类指令。InstructGPT在外界没有什么水花,但是在OpenAI内部获得了AI安全研究人员的认可。结合InstructGPT和OpenAI最新训练的大模型GPT3.5,真正爆款的产品ChatGPT即将诞生。
DALL-E2。2022年初,OpenAI准备发布图像生成模型DALL-E2,不同于此前的产品发布,这次其准备直接ToC发布产品(此前都是通过微软渠道,或者api)。DALL-E1的研发者是GPT系列开创者之一Alec Radford,其最初的算法是Vision Transformer和Transformer的结合(叫CLIP)。然而,随着Diffusion算法出现,DALL-E2转变为Diffusion和CLIP结合路线。DALL-E2,3路线最终也不是很成功,主要原因是计算成本太高了,反观Stable Diffusion模型训练只用了256张A100,其说明Scale也不是AI的全部。DALL-E2发布又一次加剧了OpenAI内部应用产品部门和AI安全部门的矛盾,不过OpenAI的整体风格已经开始贴近应用,甚至像早年的Facebook:Move fast and breaking things(竞争来了没办法)。在愈发激化的内部矛盾中,Mira Murati扮演了调和者的角色,她甚至扮演了Altman和公司其他员工沟通的核心角色。
GPT4,微软决定投资100亿美元。GPT4算力基础是微软提供的1.8万张A100,而核心瓶颈在于数据不够。Brockman这位不寻常的总裁(他还是极客风格)开始爬Youtube的视频(冒着合规风险,据说Google自己都不能直接用),然后转成文本给GPT-4训练。GPT4最开始训练用了3个月,初期效果似乎不太好,但随着RLHF的加入,效果一天一天变好(所谓的效果好,可能是AI适应了人类输出标准而已)。比尔盖茨表示如果GPT模型在AP Biology测试中达到5分,自己会感到惊艳。Brockman从Khan在线教育平台找到相关测试的训练数据,给盖茨定制了一个模型(大佬定制),结果是GPT4真的拿到了5分。盖茨震惊了,他表示这是自己有史以来最惊艳的2次demo之一(不知道另外一次是啥)。微软的CEO Nadella等高管也很激动,GPT4看起来是更大的蛋糕,比如Copilot。他们决定2023年1月那笔100亿美元投资。GPT-4本来准备22年秋天发布的,而此时OpenAI和微软各派3名员工组成了DSB(Deployment Safety Board),其成为审核OpenAI最新模型是否适合发布的理论最终裁决机构。DSB认为GPT-4需要充分测试才能发布,因此发布时间改为23年年初。Altman也有点担忧GPT4会是最终打醒对手(主要是Google)的产品,所以要格外小心。
ChatGPT发布,一炮而红。22年10月,OpenAI当时有300名员工在开全员会,他们听说对手Anthropic即将发布一款Chatbot产品(实际上Anthropic没有发布机会,而且当时其遇到一个麻烦,其一笔5.8亿美元融资,其中5亿来自FTX的SBF,而后者暴雷了)。出于紧迫性,OpenAI准备抢先发布一款基于GPT3.5的Chatbot,即ChatGPT。当时OpenAI最核心的优先级显然是即将发布的GPT-4,ChatGPT看起来只是个无关紧要的发布,有些人觉得会有几千个用户,而有些人猜几万。然而产品上线后就成为爆款,5天后用户就突破了100万,2个月用户就突破了1亿,公司服务器屡次过载下线。ChatGPT走红也让OpenAI瞬间变成了家喻户晓的品牌。产品走红后,OpenAI各方面人手短缺,但Altman表示公司应该保持小而精的团队,最初准备只招100人,结果最终招了250-300人。大量新鲜员工进入公司,不同文化也开始混合,混乱成为常态,往往伴随着公司业务高增长。处于ChatGPT井喷式需求,微软甚至将公司主要GPU资源从自有AI团队转移到OpenAI,微软内部变天了(据说Altman每天都给Nadella打电话要更多算力)。微软对OpenAI投资瞬间显得十分明智,Azure OpenAI的用户推理需求从23年1月到9月翻了10倍。23年2月,ChatGPT推出付费订阅模式。不过由于微软也在基于OpenAI发布大量类似co-pilot产品需要OpenAI配合,OpenAI内部也发现愈发难以兼顾自有产品和微软产品的同时需求,两边矛盾开始积累。
五个阶段的算力基础设施。面对已经被充分验证的Scaling law,Altman对OpenAI的算力基础设施进行五个阶段的规划:第一阶段是GPT3的1万张V100;第二个阶段是1.8万张A100训练GPT-4。第三阶段则需要多个数据中心承载几十万张H100,训练GPT-4.5和GPT-5。第四阶段则是需要100亿美元投资B100的卡。而第五阶段的算力投资将达到1000亿美元,设施用电功率将达到5Gw,和整个纽约用电差不多。进入24年,随着Meta开始建设35万张H100的超算中心,Altman愈发觉得微软动作太慢了,于是有了后来他自己规划的事。由于超算中心需要巨大的能源、水资源等支撑,对当地居民生活影响明显,甚至破坏环境,Hyperscaler们纷纷在拉美寻址建设,这些动作也引起了当地的反对。
OpenAI的“五日政变”
超级对齐和OpenAI董事会减员。正如前文所言,随着ChatGPT和GPT-4走红,OpenAI推出产品节奏越来越像互联网公司,强调快速迭代。进入2023年OpenAI开始探索Agent方向,并且尝试打造AI科学家等自主科研项目。而这引发了原有AI安全担忧员工进一步反弹,而这里面就有Sutskever。他是坚定AGI信仰者,而因此对AI能力进步更加担忧,2023年开始Sutskever进一步将自己时间用在AI对齐上,超级对齐项目得到了OpenAI 20%的算力承诺。此外,虽然OpenAI不断破圈,其董事会人员却越来越少。Reid Hoffman在23年2月宣布退出,主要是其成立自己AI创业Inflection AI。Shivon Zilis是Musk的亲密战友(后来还和其生了双胞胎),随着Musk创立xAI,其也在23年3月宣布退出OpenAI董事会。第三个退出的是Will Hurd,前CIA官员。仅剩下三位董事会成员分别是Quora创始人D Angelo,机器人专家Tasha McCauley,和CSET研究员Helen Toner。这三位成员和Altman都有关联,第一位创立公司是YC投资项目,第二位是Altman推荐的。
Altman危机开始酝酿。Altman的不透明和沟通不畅,言论不一带来问题愈发凸显,经常有员工发现同一件事Altman对不同员工说法很不一样。此外,GPT-4微软被允许在印度提前测试,而这绕过了DSB(终极审核组织)。微软违规了,但Altman却默许这些违规。23年3月,Altman还写邮件给董事会成员D Angelo表示对方应该辞职,因为Quora推出了类似的Chatbot竞品。最终其他董事会成员认为这个利益冲突有限,D Angelo留任了。后者此后在一次聚会上了解到OpenAI的创业基金(1亿美元投资GPT生态项目)架构很奇怪,这些被投企业允许提前使用OpenAI产品,而这些股权最终所有人竟然是Altman私人,而不是OpenAI公司。Altman似乎故意组织董事会对其监督。25年初Altman的妹妹Annie也提起了对Altman的诉讼,指控其性虐待等(Altman表示否认,直指其妹妹有精神病)。对于不同的意见,Altman开始采用“不听就走”的策略。此时OpenAI在训练GPT-5,而有个人坐不住了,也就是Sutskever。更让他抓狂的是Altman竟然绕过他直接提拔了Sutskever的下属Pachocki,相当于离间了这俩人的关系。连一直以来充当Altman和员工沟通桥梁的CTO Murati也开始受不了Altman了,因为她觉得老是给Altman背锅。她在23年9月找了董事会成员之一Toner喝咖啡(这个估计是相对独立的),她说Altman将公司逼得太紧,可能会出问题。Toner后来还和Sutskever聊,后者也表达了OpenAI斗争和是否能够实现AGI的担忧。俩人保持沟通,Sutskever后来表示认为应该对OpenAI管理层进行调整。
大反转,Altman5天回归。23年10月,Altman变得异常焦虑(不知道是不是知道了那些沟通?),他开始担忧微软对于OpenAI不满,而Murati(是OpenAI和微软具体沟通核心负责人)也发现出现大量Altman对微软说yes,而自己说no的矛盾情况(窘境)。Murati,Sutskever,Toner三人基本达成一致,Altman不再是OpenAI理想的CEO(Murati可以当代理CEO),他们开始尝试联系另外两位董事成员,Sutskever提供了不少截图证明(对Altman不透明、不诚实等)。董事会成员还考虑是否和其他人比如Brockman,微软等讨论事件影响,后来他们认为不能联系,因为避免泄露。大家达成一致后,剩下事情只有告诉Altman了。23年11月17日,Altman被开除成为公开消息。很快Altman和Brockman就开始散播消息——Altman开除主要指使人是Sutskever,这是一场权力斗争。再加上在此后OpenAI全员会上,很多员工提问,Sutskever都没有提供足够说服力的回答(比如对开除Altman理由,S只说可以看公开信,但是没有提供更细节的证据,这很难让人信服),很多OpenAI员工拒绝变化。看到这种超预期的局面,Murati也开始摇摆了,她觉得自己镇不住场子。董事会决定从外部寻找CEO接班人,找了一圈只有前Twitch CEO有意愿接,但后者很快被Altman的好友Airbnb的CEOChesky劝退。微软也很快表明态度,支持Altman来微软组建新的AI团队。显然,这次“政变”失败了,5天后Altman宣布回归。
新董事会成立。23年12月的OpenAI全员会上,Sutskever缺席(再也没回OpenAI)。此时OpenAI内部在酝酿新模型Q,其就是后续发布的o1推理模型。OpenAI组建了新的董事会,Toner和McCauley退出,Larry Summers(经济学家)和Bret Taylor(Facebook前CTO,Twitter董事长,后创立Sierra)递补。并且对Altman此前一些指控展开了调查,24年3月,新董事会调查结束,据说发现了不少Altman言行不一的证据,但是董事会认为程度不至于开除他的地步,而调查报告全文没有公开。
Altman独掌OpenAI和诸多元老离职。Sutskever离开了(24年5月官方宣布),Altman似乎扫清了最终障碍,OpenAI已经完全变成了他的野心帝国,OpenAI风格也完全变成了产品尽快发布,纯市场竞争风格(后来会设置营利性公司)。GPT4o是自带语音功能多模态模型,Altman决定在24年5月9日发布,抢先于Google的14日的I/O大会。GPT4o展现了特别的情商,其跟人对话感觉仿佛是:我有全世界的知识,但这个问题还是请daddy你教我吧!在GPT4o发布会上,Murati和Mark Chen(此前是量化交易员,被提拔了OpenAI多模态负责人),Barret Zoph(负责后训练)。外部环境愈发严峻,Altman和Musk也愈发走到了对立面,后者甚至发起了对Altman诉讼说其当时骗他成立非营利组织发展AI,Musk自己也成立了xAI。微软也开始布局自己AI,其6.5亿美元挖走了Hoffman创立的Inflection AI项目组的Mustafa Suleyman,其是DeepMind创始人之一,但是已经被公司评价为有毒的人,并且2019年开除了他。在24年财报中,微软将OpenAI列为竞争对手。除了Sutskever,24年开始诸多OpenAI的元老也逐步离开,包括Jan Leike,超级对齐的联合负责人。John Schulman,后训练的负责任(去了Anthropic)。24年5月,OpenAI一位离职员工在网上爆料OpenAI威胁离职员工封口,否则期权将作废,这在公司内部也掀起了轩然大波。Altman在全员会上支支吾吾说自己只知道一部分。一系列PR灾难让公司士气低落。
不是AI泡沫而是OpenAI泡沫
24年,Altman重点工作之一就是将OpenAI组织转变为更像传统营利性的公司(非营利组织将成为控股公司),而作为CEO其显然也应该获得更多股票。24年10月,OpenAI宣布完成了66亿美元融资,VC历史上最大一笔融资,公司估值提到1570亿美元。
接下来部分由DeepSeek续写:
估值三级跳:25年一季度,软银领投400亿美元,估值拉升至3000亿。10月,员工股票交易将估值推至5000亿——支撑它的是年化收入突破120亿美元。12月,新一轮融资洽谈启动,目标估值7500亿美元。一年身价翻近5倍,奥特曼与亚马逊百亿级投资的洽谈也已展开。“非营利为全人类”的研究实验室,彻底蜕变为比肩主权基金的资本巨兽。
从模型竞赛到“AI操作系统”。10月DevDay,奥特曼公布:ChatGPT周活破8亿,开发者超400万。战略重心从技术迭代转向生态构建。ChatGPT内嵌应用与Apps SDK,试图将聊天机器人升级为“AI版iOS”;AgentKit宣称8分钟完成复杂AI工作流;Codex三周处理超40万亿tokens。但开发者评价两极:有人称其为“AI操作系统雏形”,更多人质疑商业化步伐过快。竞争现实是:Anthropic以32%的企业LLM使用率压制OpenAI的25%,编程市场份额42%对21%形成碾压。
权力重组与超级智能时间表。10月,OpenAI完成资本重组。非营利组织控股公益公司,为IPO扫清障碍。与微软签订新“最终协议”:即使2030年前实现AGI,微软仍可访问知识产权;微软被允许独立研发AGI。作为交换,微软持股降至27%,账面回报约10倍。条款松动暗示奥特曼对AGI周期的内部预判比外界想象的更近。同月,奥特曼首次公开超级智能时间表:2026年实现“AI研究实习生”,2028年实现“全自动AI研究员”。为支撑此野心,承诺投资约1.4万亿美元建设超30吉瓦数据中心,目标“每周新增1吉瓦算力”。
不是AI泡沫而是OpenAI泡沫。2025年末,OpenAI站在前所未有的高度:7500亿估值、8亿用户、1.4万亿基建计划。但裂缝正在蔓延:欧洲监管的铁腕制裁——11月德国法院裁定OpenAI侵权,成AI版权监管关键转折;与微软的新协议将竞争摆上台面;马斯克诉讼预计2026年春开庭。