ChatGPT劲敌现身:Claude3能总结15万单词,长文理解准确率超99%
时间:2024-03-08 08:00:43 来源: 澎湃新闻
Claude 3能总结15万个单词,而ChatGPT只能总结大约3000个单词。用户可以输入大量数据集,并要求Claude 3以备忘录、信件或故事的形式进行总结。
Claude 3 Opus是Anthropic最强大的新模型,在行业基准测试中的表现优于OpenAI的GPT-4和谷歌的Gemini Ultra大模型。Claude 3 Opus对长文的语境理解准确率超99%。
当地时间3月4日,美国人工智能初创公司Anthropic发布最新大模型Claude 3系列,该系列包含Claude 3 Opus(著作)、Claude 3 Sonnet (十四行诗)、Claude 3 Haiku(俳句)三个版本。其中,Claude 3 Opus是Anthropic最强大的新模型,在行业基准测试中的表现优于OpenAI的GPT-4和谷歌的Gemini Ultra大模型。这家初创企业过去一年融资五笔,总额约73亿美元,由OpenAI前高级成员创立,获得了谷歌和亚马逊的支持。可总结15万个单词,长文语境理解准确率超99%
Anthropic表示,Claude3系列是目前市面上速度最快、性能最好的人工智能模型,在推理、数学、编程、多语言理解和视觉方面树立了新的行业基准。
Claude 3 模型与同行大模型在行业基准测试中的表现
Anthropic在官网公布了Claude 3模型与其他模型在多项性能基准上的比较数据。数据显示,在MMLU上,Claude 3 Opus得到86.8%的得分,而GPT-4得到86.4%。一些差距则较大,例如在编程多语言测试上,Claude 3 Opus得到84.9%的得分,而GPT-4得到67%,这或意味着Claude 3 Opus对于新手学编程的更友好。
此外,Claude 3能够总结高达15万个单词,而ChatGPT只能总结大约3000个单词。用户可以输入大量数据集,并要求Claude 3以备忘录、信件或故事的形式进行总结,这一能力使得Claude 3在处理长文本方面超过ChatGPT。其中,Claude 3 Opus对于长文的语境理解准确率超99%,“在某些情况下甚至能识别出有哪些词句是人为插入到原始文本中的。”Anthropic在官网提到。
Claude 3 Opus对长文理解的准确度
Claude 3强大的视觉能力
值得一提的是,与前几代模型相比,这也是Anthropic首次提供多模态支持,允许用户上传图片、文档、图表和其他类型的非结构化数据进行分析和回答,但Claude 3不能生成图像。
不过,Anthropic也在官网最后表示,尽管与之前发布的大模型相比,Claude3在生物知识、网络知识和自主性等相关指标上有所进步,但它仍处于人工智能安全等级2 (ASL-2)。Claude红队评估得出的结论是,目前这些模型带来灾难性风险的可能性非常小,但公司会持续监测未来的模型。
Anthropic拒绝透露训练Claude 3花了多长时间,也不愿透露花了多少钱。目前,Claude 3 Opus和Claude 3 Sonnet已在全球159个国家上线,用户可在 Claude.ai中使用,Claude 3 Haiku也将很快与公众见面。
声明:凡资讯来源注明为其他媒体来源的信息,均为转载自其他媒体,并不代表本网站赞同其观点,也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑,请立即与易造机器人网(www.ez-robot.cn)联系,本网站将迅速给您回应并做处理。
电话:021-63900077