草榴社區
» 您尚未
登錄
註冊
|
搜索
|
社區服務
|
银行
|
邀请注册
|
幫助
社區服務
.:.
草榴社區
»
技術討論區
»
秒杀GPT-4,狙杀GPT-5,横空出世的Claude 3是什么来头?
<
上一頁
1
2
3
下一頁
>
回帖
發布主題
本頁主題:
秒杀GPT-4,狙杀GPT-5,横空出世的Claude 3是什么来头?
字體大小
寬屏顯示
只看樓主
最新點評
熱門評論
時間順序
雷电
級別:
聖騎士 ( 11 )
發帖:
1051
威望:
724 點
金錢:
20111 USD
貢獻:
0 點
註冊:
2023-10-24
資料
短信
推薦
編輯
秒杀GPT-4,狙杀GPT-5,横空出世的Claude 3是什么来头?
2024年第一季度才刚过半,AI领域就大动作不断,大家卯着劲的出新品,可谓卷出天际。
3月4日,Anthropic发布了最新的Claude 3系列模型,用Anthropic的话说,Claude 3的出现意味着打开了一个全新的世界,其系列模型在推理,数学,编码,多语言理解和视觉方面,都树立了全新的行业新基准。
也正是因为Claude 3的出现,全球最强AI模型一夜易主,曾经被认为不可一世的GPT-4被拉下神坛,Claude 3很可能对GPT-4实现全方位的碾压。
Anthropic发布3个模型,全方位实现Claude 3的超强性能。
据悉,本次Anthropic共发布了三个模型,按照性能从低到高,分别是Claude 3 Haiku,Claude 3 Sonnet,以及Claude 3 Opus,并发布了一份长达42页的技术报告。
值得一提的是,此次3个模型的命名是很有讲究的。依照功能的从低到高,它名字的翻译分别是绯句(Haiku),代表性价比之王;十四行诗(Sonnet),代表响应较快,是性能加强版;以及巨作(Opus),堪称性能顶配。
由此可见,Claude 3 Opus在本系列中性能最强大。该模型已在多项AI系统常用评估标准中领先业界LLM,如本科级别专业知识(MMLU),研究生级别专家推理(GPQA),基础数学(GSM8K)等。特别需要说明的是,Claude 3 Opus在处理复杂任务时,其理解和表达能力几乎接近于人类,这意味着人类在AI领域又迈进了一大步。
通过将Claude 3系列模型与同类产品进行对比,我们可以看到,Claude 3 Opus模型性能完全能够碾压GPT-4,以及Gemini 1.0 Ultra;Claude 3 Sonnet在部分基准上,诸如GSM8K,MATH等方面超越了GPT-4;Claude 3 Haiku也可以与Gemini 1.0 Pro相抗衡。
拥有三大核心优势傍身,Claude 3前途无量。
总结Claude 3所具有的优势,主要有以下三点:
性能无短板,擅长长文本优化,显著降低拒绝率。
先来说说性能方面。Claude 3的大语言模型全面赶超了GPT-4,多模态视觉任务处理性能力优秀,在回答复杂开放性问题时的准确率也翻倍提升。特别是当用户直接上传数学,物理这一类考验逻辑和准确度的理科题照片,或者细节丰富的图表时,Claude 3所回复的解题水平和准确率相较于先前版本提高了很多,甚至在一些细节描述上比GPT- 4更胜一筹。在多模态能力方面,Claude 3模型可以从视觉上识别物体,能用复杂的方式思考,既能理解物体的外观,也能理解它与数学等概念的联系。
Anthropic AI研究工程师Emmanuel Ameisen就晒出了一个测试示例:向Opus输入2小时13分钟视频原始文本,每隔5秒截取的屏幕截图等图文素材,它就能成功将其转换成一篇图文并茂的HTML格式博客文章。
在文本优化方面,Claude 3也交出了一份令人满意的答卷。要知道,先前的Claude 2.1版本常被吐槽长文本理解效果差,Claude 3便在这个方面做了重点改进,顶配Opus在200K tokens NIAH测试中准确率超过99%,展现了强大的召回能力(1K tokens相当于750个单词)。
此外,Claude 3还显著减少了拒绝回答问题的频率。很多大语言模型会频繁拒绝回答询问,Claude 3则显著改进了这一点,它能够更明确的辨别真正的风险问题,减少无故拒绝回答安全询问的情况。
"OpenAI叛军"完美制衡住了GPT-4,未来的AI王者将鹿死谁手?
Anthropic用一记绝杀将GPT-4拉下了神坛,很多人觉得这是AI新秀的一次胜利。但如果你了解过Anthropic与OpenAI之间潜藏的错综复杂的关系的话,就会发现此次Claude 3的胜利,并非偶然。
Anthropic究竟是谁?有消息来源表示,Anthropic其实就是原OpenAI员工组建的公司,这些员工因为某些发展理念不合直接出走,并选择"反叛",最终成为了OpenAI的最强劲敌。
2021年,多名OpenAI员工不满OpenAI在获得微软投资后走向封闭,愤而出走并联合创立了Anthropic。他们对OpenAI在安全问题尚未解决的情况下就直接发布GPT-3的行为感到不满,认为OpenAI已经为追逐利益而"遗忘了初心"。
这一干出走的员工之中就包括打造出GPT-2和GPT-3的研究部门副总裁Dario Amodei。他在2016年进入OpenAI,离开前担任研究副总裁,这绝对是OpenAI的核心位置。离开时,Dario还带走了GPT-3首席工程师Tom Brown,以及担任安全与策略部门副总监的妹妹Daniela Amodei以及10多名心腹,可谓人才多多。这些人才,也最终成为了Anthropic的中流砥柱。
2023年1月,Claude开启内测,彼时很多网友在第一时间体验了Claude,并表示它比当时的GPT-3强太多。
除了拥有诸多人才,Anthropic如今也获得了强大的资本为其背书,截至目前,它已经获得了包括谷歌,亚马逊云科技在内的26个机构或个人的融资,总计融资金额达到了76亿美元。
毫无疑问的是,如今Anthropic的飞速发展和进步令业界十分振奋。这个仅诞生3年的大模型初创公司,不是手握顶级人才,更拥有了钞能力和雄厚的计算资源。这说明OpenAI在大模型技术上的领先身位并非遥不可及。坐拥Top级创始成员和精兵强将的创业团队,完全有能力做出与OpenAI风庭抗礼的产品,所消耗的人力,财力,算力资源却只会更少。
Claude 3的横空出世和巨大成功会给我们带来一些启发:或许,我们也是有机会和能力来做出超越GPT-4的产品的。
如果单论规模,Anthropic显然不及OpenAI,但它依旧取得了巨大的成功。每每提起AI赛道,我们总会认为这个赛道就是要无止尽的烧钱,卷人才,卷技术。不过,相较于耗费了多大的成本去卷,怎么卷,朝哪个方向卷显然是更重要的事情。毕竟,在AI领域,选择永远大于努力。
或许在不久的未来,OpenAI还会推出令人惊艳的GPT-5,但至少就目前而言,GPT不可战胜的神话已经破灭了。
赞(79)
DMCA / ABUSE REPORT
|
TOP
Posted:
03-07 17:21
發表評論
北丁格尔
級別:
聖騎士 ( 11 )
發帖:
2493
威望:
542 點
金錢:
9573 USD
貢獻:
9300 點
註冊:
2023-06-01
赞(17)
|
資料
短信
推薦
編輯
不要用“卷”字
这是良性竞争
对进步无促进作用的内耗才是“卷”
------------------------
*
點評
TOP
Posted:
03-07 17:25
#1樓
引用
|
點評
今日夜已深
級別:
聖騎士 ( 11 )
發帖:
7130
威望:
859 點
金錢:
13843 USD
貢獻:
5300 點
註冊:
2023-08-27
赞(0)
|
資料
短信
推薦
編輯
有竞争科技才会进步
TOP
Posted:
03-07 17:26
#2樓
引用
|
點評
9500168
級別:
精靈王 ( 12 )
發帖:
4798
威望:
489 點
金錢:
60774595 USD
貢獻:
30000 點
註冊:
2012-02-21
赞(0)
|
資料
短信
推薦
編輯
马斯克在X上发图ClosedAI,具体是什么意思
點評
TOP
Posted:
03-07 17:42
#3樓
引用
|
點評
没有不可能
級別:
精靈王 ( 12 )
發帖:
17057
威望:
1805 點
金錢:
32964 USD
貢獻:
0 點
註冊:
2016-11-01
赞(0)
|
資料
短信
推薦
編輯
感谢分享
TOP
Posted:
03-07 17:44
#4樓
引用
|
點評
霍夫曼
級別:
精靈王 ( 12 )
發帖:
6680
威望:
1492 點
金錢:
26818 USD
貢獻:
1 點
註冊:
2011-06-06
赞(0)
|
資料
短信
推薦
編輯
促进科技进步的卷是必须的
點評
TOP
Posted:
03-07 17:49
#5樓
引用
|
點評
月出之光
級別:
精靈王 ( 12 )
發帖:
10894
威望:
1258 點
金錢:
38479 USD
貢獻:
5790 點
註冊:
2023-05-01
赞(0)
|
資料
短信
推薦
編輯
感谢分享!
TOP
Posted:
03-07 17:53
#6樓
引用
|
點評
第二层皮
級別:
精靈王 ( 12 )
發帖:
4177
威望:
1229 點
金錢:
11690 USD
貢獻:
0 點
註冊:
2023-11-05
赞(2)
|
資料
短信
推薦
編輯
我们有伟大思想带领我们去地狱
TOP
Posted:
03-07 18:03
#7樓
引用
|
點評
一味斥行
級別:
禁止發言 ( 8 )
發帖:
749
威望:
105 點
金錢:
2898 USD
貢獻:
3 點
註冊:
2023-01-28
赞(0)
|
資料
短信
推薦
編輯
感谢分享
TOP
Posted:
03-07 18:16
#8樓
引用
|
點評
指南者
級別:
天使 ( 14 )
發帖:
21441
威望:
337 點
金錢:
1308965246 USD
貢獻:
5561024 點
註冊:
2012-09-10
赞(0)
|
資料
短信
推薦
編輯
感谢分享
TOP
Posted:
03-07 18:19
#9樓
引用
|
點評
有彩虹
級別:
聖騎士 ( 11 )
發帖:
6453
威望:
646 點
金錢:
5567 USD
貢獻:
0 點
註冊:
2020-08-12
赞(1)
|
資料
短信
推薦
編輯
感谢分享 我就关心一下AI什么时候拍AV
TOP
Posted:
03-07 19:03
#10樓
引用
|
點評
秦亦书
級別:
聖騎士 ( 11 )
發帖:
5301
威望:
603 點
金錢:
1648 USD
貢獻:
1024 點
註冊:
2020-01-24
赞(0)
|
資料
短信
推薦
編輯
遥遥领先
TOP
Posted:
03-07 19:04
#11樓
引用
|
點評
吸湿逗妇乳
級別:
新手上路 ( 8 )
發帖:
389
威望:
39 點
金錢:
4214 USD
貢獻:
0 點
註冊:
2020-03-28
赞(0)
|
資料
短信
推薦
編輯
真的假的,有没有安装教程,坐等分享
TOP
Posted:
03-07 19:20
#12樓
引用
|
點評
狂飚青骑士
級別:
精靈王 ( 12 )
發帖:
10721
威望:
1077 點
金錢:
729 USD
貢獻:
4566 點
註冊:
2015-01-29
赞(0)
|
資料
短信
推薦
編輯
谁出一个Claude 3,教程
TOP
Posted:
03-07 19:43
#13樓
引用
|
點評
躺在我胸口
級別:
騎士 ( 10 )
發帖:
4127
威望:
413 點
金錢:
4476 USD
貢獻:
0 點
註冊:
2022-02-01
赞(1)
|
資料
短信
推薦
編輯
支持分享
TOP
Posted:
03-07 19:49
#14樓
引用
|
點評
hel516三
級別:
俠客 ( 9 )
發帖:
1095
威望:
110 點
金錢:
6985 USD
貢獻:
100 點
註冊:
2015-02-05
赞(0)
|
資料
短信
推薦
編輯
1024
TOP
Posted:
03-07 19:49
#15樓
引用
|
點評
七线明星
級別:
精靈王 ( 12 )
發帖:
3447
威望:
1153 點
金錢:
3314 USD
貢獻:
21199 點
註冊:
2022-12-01
赞(0)
|
資料
短信
推薦
編輯
国内还是用不了吧
點評
TOP
Posted:
03-07 19:57
#16樓
引用
|
點評
黑草莓
級別:
精靈王 ( 12 )
發帖:
1374
威望:
138 點
金錢:
4810095 USD
貢獻:
60000 點
註冊:
2018-01-02
赞(1)
|
資料
短信
推薦
編輯
遥遥领先
TOP
Posted:
03-07 20:05
#17樓
引用
|
點評
qqq0623
級別:
精靈王 ( 12 )
發帖:
45994
威望:
4482 點
金錢:
1977932 USD
貢獻:
1137 點
註冊:
2011-06-06
赞(0)
|
資料
短信
推薦
編輯
感谢分享
TOP
Posted:
03-07 20:08
#18樓
引用
|
點評
行走中的衣架
級別:
聖騎士 ( 11 )
發帖:
4707
威望:
732 點
金錢:
711 USD
貢獻:
363 點
註冊:
2023-10-03
赞(0)
|
資料
短信
推薦
編輯
坐等技术大佬出安装,测试指引。
TOP
Posted:
03-07 20:21
#19樓
引用
|
點評
如水人生
級別:
聖騎士 ( 11 )
發帖:
6315
威望:
633 點
金錢:
601 USD
貢獻:
266 點
註冊:
2015-06-08
赞(0)
|
資料
短信
推薦
編輯
反正我GPT都还没有用过……
TOP
Posted:
03-07 20:33
#20樓
引用
|
點評
这是个问题啊
級別:
風雲使者 ( 13 )
發帖:
44648
威望:
4510 點
金錢:
0 USD
貢獻:
59077 點
註冊:
2021-01-01
赞(3)
|
資料
短信
推薦
編輯
发帖辛苦
TOP
Posted:
03-07 21:20
#21樓
引用
|
點評
沉睡的木玛
級別:
風雲使者 ( 13 )
發帖:
44648
威望:
4510 點
金錢:
0 USD
貢獻:
59077 點
註冊:
2018-11-16
赞(3)
|
資料
短信
推薦
編輯
支持发帖
TOP
Posted:
03-07 21:20
#22樓
引用
|
點評
鸭打鹅
級別:
精靈王 ( 12 )
發帖:
35568
威望:
3520 點
金錢:
0 USD
貢獻:
15714 點
註冊:
2022-02-02
赞(1)
|
資料
短信
推薦
編輯
感谢分享
TOP
Posted:
03-07 21:20
#23樓
引用
|
點評
铁达尼
級別:
精靈王 ( 12 )
發帖:
1625
威望:
209 點
金錢:
1486209 USD
貢獻:
64400 點
註冊:
2014-06-06
赞(0)
|
資料
短信
推薦
編輯
一个个夸得那么厉害,GPT-4.5一出来就没戏唱了
TOP
Posted:
03-07 21:22
#24樓
引用
|
點評
<
上一頁
1
2
3
下一頁
>
.:.
草榴社區
»
技術討論區
電腦版
手機版
客戶端
DMCA
用時 0.01(s) x2,
11-11 03:29