AI周:2023年下半年仍将属于大模型

在进步、炒作与争议中,生成式人工智能的2023年已经过半。资金从去年的沉寂中苏醒,涌入大模型与生成式人工智能,大额早期融资与并购交易密集出现。

已经有人开始畅想通用人工智能。生成式人工智能已经擦出了通用人工智能的小火花。很难说,此时此刻,到底是通用人工智能的企业更需要资本,还是资本更需要企业走向通用人工智能。安永观察到今年至今风险投资实际下降了34%,但在生成式人工智能领域增加了7倍。

本周,资金继续疯狂涌入。Inflection融资13亿美元,总融资额超越15亿美元,仅次于OpenAI。微软、英伟达,以及LinkedIn联合创始人雷德·霍夫曼(Reid Hoffman)、微软公司创始人比尔·盖茨和谷歌前CEO埃里克·施密特等三位亿万富翁,牵头了本轮融资。

微软正在两头下注。Inflection被视为OpenAI的劲敌之一,拥有一款名为Pi的高情商的AI助理。微软或许很想要一款对话聊天应用,这对它自身的业务大有好处。ChatGPT更像是基础大模型各种能力的展示品,Pi则是更成熟的垂直应用。

AI周:2023年下半年仍将属于大模型插图

Pi在向你展示智商和情商

英伟达也在培育生态。它与CoreWeave正帮Inflection部署H100 GPU,一旦全面投入使用,Inflection将拥有运行中的2.2万片H100。一个月内,它还投资了Cohere、Runway两家独角兽企业。Inflection没有透露本轮融资多少来自现金,多少来自其他形式的资产。英伟达的现货H100,比现金更值钱。

本周,MosaicML同样拿到了13亿美元,它被大数据云巨头Databricks所收购。如果说,美团收购光年之外,也许是一场合情合理的意外,那么,近期Snowflake收购Neeva,Databricks收购Okera与MosaicML就蓄意已久。

从生成式人工智能溅出的火花里,大数据看到了更高的估值空间。

大数据云巨头Databricks正在策划IPO,它与两年前上市的Snowflake是竞争对手。Okera是专注于 AI 的数据治理平台;MosaicML能让企业客户在任何云提供商上训练大规模的AI模型,同时数据仍然安全地存储在企业自己的私有网络中。

Snowflake收购的Neeva,原先的产品是AI驱动的搜索引擎。Snowflake能够利用它的技术,在其数据云中实现搜索和对话。

如果生成式人工智能真的通往通用人工智能,那么现在只是一个开始。

2023年下半年,会有更多玩家进入赛场。新的大模型或生成式人工智能应用企业创立、融资,或被并购;更多赋能数字经济的老玩家最终会发现,自己也能被大模型赋能。孵化器YC最新一期入选项目中,35%专注于AI。

“你可以问自己一个问题,在一场10公里的比赛中,不同的选手先走了三步,这真的重要吗?”被问到与微软与谷歌的差距,亚马逊AWS首席执行官 Adam Selipsky说,“关键是,你已经走了三步,而这是一场 10 公里的比赛。”

本周,还有这些发生在AI领域的事件值得关注:

一、风险、监管与伦理

欧盟针对大科技公司达成数据规范协议。新协议涉及大型科技公司和其他公司使用欧洲消费者和企业数据的规则,防止非欧盟政府非法获取数据,引入了针对云服务提供商非法数据传输的保护措施,并规定了部门之间重复使用数据的互操作性标准的制定。

欧洲商界领袖公开要求修订人工智能监管草案。反对者包括德国西门子和法国空客在内的数十家欧洲最大的公司。它们告诫欧盟当局,人工智能提供了欧盟“重返技术创新一线的机会”,但过于严厉的监管可能会扼杀这一机会。这些公司呼吁欧盟建立一个由行业专家组成的监管机构,先建立一些监管的基本原则和风险管理的框架,“能够持续适应技术的快速步伐和正在出现的具体风险”。

OpenAI被控非法使用训练数据。加州一家律师事务所,用一份长达 157 页的诉讼,将OpenAI告到法庭,称其使用从网络上爬取的数据,侵犯了数百万互联网用户的权利。此外,还有两名作者在美国旧金山联邦法院起诉OpenAI,他们认为OpenAI滥用其作品,用作品训练ChatGPT。因为ChatGPT可以生成关于他们的书的非常准确的摘要,表现其出现在训练集中。

二、中美科技巨头

微软将AI购物工具引入Bing和Edge。新的功能包括价格监测器、购物指南、生成评论摘要。当用户输入特定商品进行查询时,AI将自动生成购买指南,自动汇总每个类别的产品,列出它们的规格,以及在哪里可以买到这些产品,人们对这类产品的看法。

移动版ChatGPT升级后可联网搜索。“ChatGPT Plus”的付费订阅用户需要将模型切换至GPT-4,可以在必应(Bing)中进行联网搜索,以获取答案。但移动端的“浏览”功能,仅限于使用必应浏览器,此举引发了广泛的担忧与质疑。移动端的流量已是桌面端的两倍。

火山引擎推出大模型服务平台。字节跳动旗下火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务。目前,“火山方舟”集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技公司及科研院所的大模型。

三、大模型和行业应用

中国联通发布图文大模型。中国联通发布图文大模型“鸿湖图文大模型1.0”,称其为首个面向运营商增值业务的大模型。该大模型目前拥有8亿训练参数和20亿训练参数两个版本,可以实现以文生图、视频剪辑、以图生图等功能。

此外,京东将推出“言犀”AI大模型。该模型参数达到千亿级,将面向多模态,深入零售、物流、工业等产业场景。恒生电子推出金融大模型LightGPT。同花顺的大模型产品正在申请备案。

穆迪联合OpenAI开发AI风险评估助手。信用评级和研究公司穆迪的这款AI“穆迪研究助手”,面向分析师、银行家、顾问、研究人员和投资者在内的客户推出,能帮其分析评估风险所需的大量信息。该公司还其1.4万名员工推出了微软的AI助手技术,他们借助这一工具来搜索大量内部信息,包括穆迪的Orbis公司数据库。

Booking推出基于ChatGPT的AI旅行规划工具。这家全球最大的酒店预定网站Booking宣布,用户用它可查询、创建出游行程,它还将基于现有的机器学习模型来提供目的地和住宿选择。此前,其竞争对手Expedia也推出了由ChatGPT支持的旅行规划工具测试版。

四、资金流向

Databricks以13亿美元收购MosaicML。MosaicML帮助企业训练并部署自己的大模型,累计融资6400万美元,投后估值2.2亿美元。此前,Databricks发布了名为Dolly的开源大语言模型(LLM),在收购MosaicML后,Databricks预计将把MosiacML的模型、训练和推理能力加入其Lakehouse平台,供企业开发生成式AI应用。

Reka新一轮融资5000万美元。Reka于去年推出了专注于为企业客户构建大型且专业的AI模型。云数据巨头Snowflake参投,估值约3亿美元。该公司由DeepMind、Google和Meta的前研究人员创立。

Inflection融资13亿美元,估值40亿美元。该公司开发了一款名为Pi的“友善且具有支持性”聊天的机器人。至此,该公司筹集的资金总额达到15.3亿美元。它正在与CoreWeave和英伟达合作,建立世界上最大的人工智能计算集群,使用了2.2万个英伟达的H100芯片。

Runway再融资1.41亿美元。3月 ,该公司发布了多模态的Gen-2 模型,可以支持文本生成视频、图像生成视频、文本+图像生成视频各种应用场景。最新参与加入的投资方包括谷歌、英伟达和Salesforce。该轮融资对Runway的估值达到15亿美元。

Typeface融资1亿美元。Typeface的工具能帮助企业训练生成式人工智能模型,用于内容创作,协助完成制作营销材料等功能。谷歌投资了它。该企业的估值或已达10亿美元。

美团收购光年之外。总交易价包括2.34亿美元现金、承担3.67亿元人民币的债务以及现金1元,合计约2.85亿美元。于转让协议交割完成后,美团将持有光年之外集团的100%权益。上个月,美团曾透露公司内部也在研发AI大模型。

云知声向港交所提交上市申请。云知声刚刚推出了拥有600亿个参数的山海大模型。大模型的迭代和升级需要高额投入,对营收规模较低、现金流紧张的云知声来说,上市募资是重要节点之一。

五、基础设施

美国考虑升级对华AI芯片限制。美国商务部预计最快将会在7月要求停止向中国客户运送英伟达和其他美国芯片公司生产的AI芯片,其中可能包括A800/H800。此外,美国政府还在考虑限制向中国人工智能公司提供云服务,例如微软的Azure或是亚马逊的AWS。英伟达高管警告称这或让美国产业永远失去在世界最大市场竞争的机会。

英伟达与Snowflake合作。英伟达将把自身用于大型语言模型训练的NeMo平台引入Snowflake数据云,让使用Snowflake管理数据的企业能够使用自己的数据开发大语言模型,而无需担心数据安全问题。

阿里云等联合推出大模型智算平台。阿里云、中国电信与复旦发布云上科研智算平台CFFF(Computing for the Future at Fudan)。该平台总体算力规模达到28 TFLOPS。它分为两部分,其一为部署在复旦校内的专用高性能计算集群“近思”一号,主要用于高精尖研究;其一为托管在阿里云乌兰察布数据中心的“切问”一号,支持千亿参数的大模型训练。

思谋科技发布工业大模型开发底座。SMore LrMo面向工业场景的大模型开发与应用平台,该公司称其为行业首个,支持千亿级参数规模大模型训练,能够帮助客户将训练成本降低40%。

腾讯云披露自研星脉高性能计算网络。它基于腾讯云新一代算力集群HCC,可支持10万张卡的超大计算规模,能提升40%的GPU利用率,节省30%~60%的模型训练成本,为AI大模型带来10倍通信性能提升。

六、开源生态

清华第二代60亿参数ChatGLM2开源。新版本在推理能力上提升了42%,最高支持32k上下文,且对学术研究完全开放,允许申请商用授权。在中文C-Eval榜单中,ChatGLM2以71.1分位居榜首,高于GPT-4。

医疗多模态基础模型群“OpenMEDLab浦医”将开源。上海AI实验室联合国内外科研机构、高校及医院,共同发布了“OpenMEDLab浦医”,称其为全球首个医疗多模态基础模型。它将于近期逐步开源,覆盖医学图像、医学文本、生物信息、蛋白质工程等10余种医疗数据模态。

七、论文

DragDiffusion交互式图像编辑技术。新加坡国立大学、字节跳动的研究者,利用扩散模型和大规模预训练模型,开发了该基于点的图像编辑技术。它与此前的图像编辑框架DragGAN类似,如通过拖拽红色关键点来改变图像的内容,比如改变动物的姿态或增加物体的大小。(DragDiffusion: Harnessing Diffusion Models for InteractivePoint-based Image Editing)

八、其他

一半美国人听过ChatGPT。美国媒体与机构最新调研了2000多名美国人,发现尽管新闻报道很多,但使用这些工具的人仍然相当有限,且多是年轻人。57%的人用过或听过ChatGPT,但必应就要差一点,仅46%。谷歌的Bard还不如Snap的My AI。知道两款文生图工具仅1/4。

AI周:2023年下半年仍将属于大模型插图1

用过或知道的人的占比(左侧)

35%的 YC新项目专注AI。Y Combinator最新收到2.4万份申请,接受率略低于1%。在入选该计划的公司中,约有35%专注于AI,多达一半的公司将AI作为其业务的组成部分。

Stability AI多位高管离职。在负面报道过后, Stability AI的多位高管离职,包括其研究主管David Ha和首席运营官Ren Ito。