界面新闻记者 |
界面新闻编辑 | 文姝琪
在2024 re:Invent全球大会上,亚马逊一口气发布了6款大模型 。
这些大模型都依托于其发布的推出新一代基础模型Amazon Nova ,并集成在Amazon Bedrock中提供服务。
其中,Amazon Nova系列基础模型包括Micro、Lite 、Pro、Premier四款:Amazon Nova Micro为纯文本生成模型,每秒可输出210个token;Amazon Nova Lite和Amazon Nova Pro为多模态模型 ,分别对标OpenAI的GPT-4o mini和GPT-4o,且多项能力在基准测试中表现更优;Amazon Nova Premier同样是多模态大模型,专为复杂推理任务而生。
目前 ,Amazon Nova系列Micro、Lite 、Pro模型已全部正式可用,Amazon Nova Premier预计将在2025年第一季度可用 。
同时,亚马逊还推出了两个全新模型。Amazon Nova Canvas是图像生成模型,性能上优于OpenAI的DALL-E 3和Stable Diffusion ,还内置的安全控制措施确保能够追溯每张图像的来源;Amazon Nova Reel是视频生成模型,支持生成六秒的视频,未来几个月将支持最长为两分钟的视频生成。
亚马逊云科技新任CEO马特・加曼(Matt Garman)在演讲中表示 ,大模型是一个创新速度极快的领域,几乎每周都会有新版本、新功能、新模型 、新更新以及新的成本变化 。尽管有这么多创新和众多模型,可实际上要找到一个完全契合自身用例的完美模型依旧十分困难。
正是基于这样的市场洞察 ,亚马逊云科技试图打造一个专业知识与延迟、成本等因素进行合理组合的大模型服务。其最近两年在大模型上的动作也均以此为出发点。
Amazon Bedrock去年的使用量已增长5倍
面对市场对大模型的需求痛点,亚马逊在2023年4月推出一项完全托管的服务Amazon Bedrock,来满足市场需要考量模型专业能力、成本等因素的需求 。
通过API集合 ,Amazon Bedrock提供来自AI21 Labs、Anthropic 、Cohere、Meta、Mistral AI 、Stability AI 以及亚马逊自身等多家公司的基础模型。这些基础模型涵盖了文本生成、图像生成等多种类型,为开发者提供了丰富的选择,以满足不同的应用场景和需求。
马特・加曼(Matt Garman)透露 ,每天都有数以万计的客户在生产应用中使用Amazon Bedrock,其使用量在去年就增长了近5倍 。
快速增长的使用量证明了市场对于Amazon Bedrock这种服务模式的认可。背后的原因也不难理解,大模型在快速迭代升级,很多企业并非是想使用一款基础模型 ,而是针对不用需求选择更合适的模型。Amazon Bedrock集成了越来越多模型,其带来的便捷性不仅吸引了很多企业客户使用,还吸引了Salesforce、SAP和Workday等独立软件供应商(ISV)集成到他们自己的系统上 ,为下游客户提供生成式AI服务 。
Amazon Nova系列模型也是在平衡专业能力 、成本和延迟等多方面基础之上推出的。同时,亚马逊还在Amazon Bedrock中推出模型蒸馏功能,帮助企业进一步降低大模型的使用成本。根据马特・加曼(Matt Garman)在演讲中透露的信息 ,经过蒸馏的模型相比被蒸馏的模型,运行速度能够快500%,成本还能降低75% ,而且Amazon Bedrock可一站式完成所有相关工作 。
亚马逊自研的Nova系列模型还能够与蒸馏功能整合在一起,把大模型的智能“转移”到更小的模型中,这些小模型成本效益更高 ,延迟更低。
亚马逊在2024 re:Invent全球大会上发布的6款模型并不是全部。根据马特・加曼(Matt Garman)的介绍,亚马逊还将在2025年推出语音到语音模型以及多模态到多模态模型 。
其中,语音到语音模型计划在2025年第一季度推出,该模型旨在通过理解自然语言的流式语音输入 ,解释语言和非语言信号(如语调和节奏),提供流畅的类人交互,彻底改变对话式AI应用 ,确保低延迟的双向交流。
多模态到多模态模型是亚马逊在大模型上的一个全新尝试,能够接受文本、图像、音频和视频作为输入,并以任意模态生成输出。该模型预计在2025年中旬推出 ,将简化应用开发,使同一模型能够执行多种任务,如内容模态转换 、内容编辑 ,以及驱动能够理解和生成所有模态的AI代理。
数十万枚自研芯片落地Anthropic,亚马逊要向微软+OpenAI发起新挑战
在2024 re:Invent全球大会上,AI初创公司Anthropic的联合创始人兼首席计算官Tom Brown宣布了“雷尼尔计划 ”(Project Rainier) ,该计划也是一个有战略意义的布局 。
“雷尼尔计划”的核心内容是,Anthropic未来将使用一个拥有数十万枚亚马逊自研芯片的算力集群。其芯片数量将是Anthropic现有算力集群的五倍以上。
Anthropic是亚马逊投资的AI初创公司 。2023年9月,亚马逊向Anthropic投资40亿美元。今年11月,亚马逊再次向Anthropic追加40亿美元投资。这是亚马逊近30年最大的一笔对外投资 。投资之后 ,Anthropic必须使用亚马逊AWS的云计算服务,其推出的Claude系列模型也已集成在Amazon Bedrock上。
从模型能力上看,Claude系列模型是目前市面上几乎少数可以和OpenAI旗下GPT-4对标的模型。如果“雷尼尔计划”能够顺利落地 ,Anthropic将用上全球规模最大的AI算力集群之一,这对后续模型能力的进一步提升也有积极的帮助 。
此举背后,我们可以看到亚马逊云在大模型上更大的野心。一方面 ,亚马逊云科技联合Anthropic对标微软+OpenAI的模式,和其争夺更多有大模型和云计算使用需求的客户。
此前,微软CEO萨提亚·纳德拉在电话财报会中曾表示 ,超过1.8万家公司正在使用微软的Azure OpenAI服务,这里面有很多是Azure的新客户 。并且,其云计算产品Azure的收入增长 ,也有不少是来自微软提供的GPT-4入口。
这意味着OpenAI走红后,其为微软的云服务Azure带来了更多新增客户,亚马逊也可以复制这种已经被验证过的打法。
另一方面,亚马逊通过投资的方式将自研芯片和Anthropic深度绑定 ,既能够降低自己的算力成本,也能减少其对英伟达、英特尔等芯片供应商的依赖。节省下来的算力成本可以让亚马逊的云计算服务以及生成式AI服务在价格上更有竞争力 。
据Synergy Research Group最新公布的数据估算,2024 年第三季度 ,亚马逊在全球云基础设施市场的市场份额达到31%,领先于微软 Azure平台的 20%和谷歌云的11%。
显然,亚马逊云科技并未满足于此 ,还在试图通过AI大模型带来的增量寻求更多的市场份额。
TCL科技COO王成:星智大模型已达到一个毕业5年工程师的水平|界面新闻 · 快讯
沈向洋:大模型对算力需求每年增长四倍以上,合成数据催生百亿创业风口|界面新闻 · 科技
腾讯再开源两款最新大模型,开闭源之争又起波澜|界面新闻 · 科技
关于AI基建及产业大模型,吴泳铭、周鸿祎等在乌镇给出了这些看法|界面新闻 · 科技
这家低调运营11年的家装设计平台开始显露更多“野心”|界面新闻 · 科技
商业头条No.49 | 大模型抵达“分水岭”|界面新闻 · 科技
京东三季度营收超预期,维持增长仍需更大投入|界面新闻 · 科技
对话月之暗面杨植麟:对Scaling Law乐观,预训练还有提升空间|界面新闻 · 科技