主页 › 阅读 › 热点 › AWS搭载“最强大模型”！打通商业化落地“最后三公里”

AWS搭载“最强大模型”！打通商业化落地“最后三公里”

智东西发布于 2024-04-03 11:07:16

44 0

作者 | 香草编辑 | 李水青

智东西4月2日报道，今天，亚马逊云科技（AWS）与智东西等少数媒体分享了与AI创企Anthropic合作的最新进展，并现场演示了Claude 3大模型的多模态、长文本、语境理解等能力。

AWS近日宣布向Anthropic追加投资27.5亿美元，截至目前已经向这家OpenAI强力竞对累计注资40亿美元。此外，双方的合作关系也再次加深，Amazon Bedrock引入了Anthropic最新发布的Claude 3模型。

会后，AWS大中华区产品部总经理陈晓建向我们分享了大模型落地实践的解读。在他看来，大模型想要打通落地最后N公里，需要选择一个具体的、简单的切入点，从点到面逐步扩展应用场景，由简单到复杂逐步切入。

当谈到AWS下一步的发展战略时，他称从客户需求来看，目前芯片等硬件设施仍然落后于大模型的发展，其迭代速度跟不上模型参数规模的指数级提升，如何将底层能力与大模型复杂度相匹配，是现在面临的主要挑战。

一、从基础设施、工具链到AI应用，构建生成式AI完整技术栈

陈晓建首先解读了AWS的生成式AI技术栈。目前，AWS在基础设施层面提供GPUs、自研Trainium芯片、Nitro系统等底层设施，在大模型构建工具层面提供大模型托管平台Amazon Bedrock，在应用层面则推出了智能助手Amazon Q、代码助手Amazon CodeWhisperer等。

▲AWS生成式AI技术栈

在模型层面，除了此前提供的AI21Labs、Cohere、Meta、Stability AI以及亚马逊自研的模型之外，近期新增了Anthropic和法国创企Mistral AI的新模型。其中，Anthropic的Claude 3以其多模态推理、翻译、总结等方面的优异能力突出。

▲Amazon Bedrock提供的基础模型

Claude 3于3月初推出，分为Opus、Sonnet、Haiku三个规模，其中性能最强的Opus模型引各方面测评结果超越GPT-4一举成为“最强大模型”。

▲Claude 3各模型性能对比

与Claude 2相比，Claude 3最明显的迭代体现在多模态能力、幻觉的降低、长文本能力等方面。例如借助视觉能力，Claude 3可以理解图表、图形、报告等文件，并从中提取数据。

▲Claude 3的多模态能力

在准确率方面，Claude 3大幅改善了幻觉问题，对没有把握的答案会进行标明，而不是直接给出错误答案。

▲Claude 3幻觉降低

在应用场景上，Claude 3可以适用于代码辅助、内容续写、长文本知识召回总结等，也可以用在亚马逊的“老本行”电商领域，用来撰写电商商品描述。

基于Amazon Bedrock的能力，AWS面向企业提供了知识库工具Knowledge Bases，为基础模型和Agents提供来自企业内部数据源的上下文信息，用于RAG（检索增强生成），从而提供更相关、更准确和更个性化的响应。

Amazon Bedrock的Agents功能则利用基础模型，提供使用自然语言进行交互和响应来执行多步骤业务任务的能力。

二、现场演示为老黄续写PPT，扮演不同MBTI人格答题

AWS技术人员为我们现场演示了Claude 3“中杯”模型Sonnet的多模态、长文本、代码、翻译等能力。

在第一个演示中，演示人员输入了一张英伟达CEO黄仁勋演讲的PPT，让Claude总结PPT的内容。

▲输入的PPT图像

明显能看出，Amazon Bedrock上搭载的Claude 3生成速度非常快，迅速总结出了PPT上主要内容。

▲Claude 3总结PPT内容

随后，演示人员追问Claude 3下一页PPT可以考虑放哪些内容，又让其按年份总结图中内容，并归纳为表格形式。

▲Claude 3将PPT内容总结为表格形式

第二个演示展现了Claude 3的长文本能力。演示人员输入小说《流浪地球》中的一个片段，在其中插入了一句《三体》中的内容，让Claude 3从中找出不合理的部分。

这是大模型长文本能力评测中十分重要的一种测试。AWS大中华区产品技术总监王晓野谈道，之所以长文本能力这么重要，是因为在情感陪伴、资料读取等应用场景中，对大模型的“记忆”能力要求很高。尤其是AI陪伴类产品，如果大模型能记住几个月甚至几年前用户聊过的内容，体验感会大幅提升。

▲Claude 3大海捞针能力

随后演示人员又展示了Claude 3的诗歌翻译能力，并与GPT-4做对比。虽然二者都未达到“信达雅”的水准，但Claude 3的翻译用语更贴合中文用词习惯一些。

▲Claude 3翻译能力

第四个演示针对代码能力，演示人员要求Claude 3生成一个贪吃蛇游戏的Python代码设计，并给出了基本玩法和失败条件。

▲贪吃蛇游戏Prompt

Claude 3按照需求生成了一个完整的代码文档，演示人员将代码复制到编译器中运行，贪吃蛇游戏成功运行起来，并且符合失败条件，在蛇撞到地图边缘时游戏结束。

▲贪吃蛇游戏演示

最后，演示人员展示了Claude 3的开放性问题理解能力。通过一个网上很火的性格测试MBTI的问题，让大模型判断不同MBTI人格对同一个问题的反应：如果看到一匹马进入酒吧，你认为马会说什么？

在扮演ESTJ、ENFP两种不同人格时，Claude 3分别站在理性务实、富有想象力和创造力的角度回答了这个问题。

▲Claude 3扮演ESTJ人格

▲Claude 3扮演ENFP人格

结语：AWS为企业客户打通大模型落地“最后三公里”

通过投资Anthropic和提供Claude 3模型，AWS再次提升了作为云平台的竞争力。相比直接使用Claude 3的API（应用程序接口），Amazon Bedrock能够提供更为稳定的大模型能力，并通过知识库、Agents等工具提供差异化价值，帮助企业平衡成本与模型能力。

通过构建完整的生成式AI技术栈，从基础设施到工具链，再到具体的AI应用，AWS全方位支持企业客户数字化转型。Amazon Bedrock平台为企业提供了强大的知识库工具和Agents功能，使得大模型的应用更加贴合实际业务需求，同时，AWS还通过试验迭代、专业培训、原型开发等服务，为企业用户提供打通大模型落地的“最后三公里”。

友情提示

本站部分转载文章，皆来自互联网，仅供参考及分享，并不用于任何商业用途；版权归原作者所有，如涉及作品内容、版权和其他问题，请与本网联系，我们将在第一时间删除内容！

联系邮箱：1042463605@qq.com

AWS搭载“最强大模型”！打通商业化落地“最后三公里”

一、从基础设施、工具链到AI应用，构建生成式AI完整技术栈

二、现场演示为老黄续写PPT，扮演不同MBTI人格答题

结语：AWS为企业客户打通大模型落地“最后三公里”

友情提示

亚马逊云科技启动“智能家居与智能产品创新加速计划”

被嘲“最丑星二代”，小沈阳女儿韩国出道遇冷后逆袭第一！我忍不住为她做了一份PPT……

被骂内娱“丑男”，刘宇宁新剧离谱一幕上热搜，看完我的PPT发疯了！

黄子韬卖1分钱卫生巾被骂上热搜，掉粉46万！他的回应亮了

自从有了AI之后，我学会了向下管理

开播就被骂？陈都灵新剧上热搜，这张图把我看傻了！

8月1日凌晨3点,和遇难者是一批去的,北海红树林赶海事件！

「去班味吧」南昆山站——逃离工位挑战！把压力甩进疾驰的风里

龙池山的猴子被女子扇懵了…

小说：叶家少主为报恩，隐藏身份保护妻子，却被岳母以为想吃软饭

北京胡同停车有多极限…#停车#车技

北京上空持续了两小时的无声闪电

快讯！快讯！韩国突然宣布了！8月13日，韩国拟对华热轧不锈钢板征收反倾销税（中国贸易救济信息网）。这事儿简单说，就是韩国财政部昨天发了个公告，要对中国生产的热轧

最新消息！韩国突然宣布了！8月13日韩国突然对中国热轧不锈钢板下狠手！昨天韩国财政部发布公告，要对咱们出口的这类产品征收整整五年的反倾销税，税率高达21.62%

真开火了！日媒爆料：日本驱逐舰入侵中国领海，中国军舰连开两炮警告！

特朗普对中国的态度已变，普京迅速反应过来：3年多的仗不能白打

最后一刻，特朗普终于签字了！中美联合声明出炉，2个动作透露不寻常信号，中方的努力没有白费

夫妻搞笑对话全程爆笑，为什么我没早点刷到，笑死人了