那些挑战GPT-4的大模型们，谁曾短暂登顶？

作者: 机器之心官方分类: 计算机技术发布时间: 2024-04-29 11:01:42 浏览:5597 次

这个up主真硬:
第一名的 gpt4 1257 阿里 13名 1153分..我猜想还是输在数据库.反过来如果用全中文的提问环境,很可能国产大模型可以夺冠,因为中文数据库主要在阿里百度手里.

【回复】因为国产模型的话，为了赶上进步，就只好加大中文语调的训练数据了，这样使得中国用户在使用它的时候好像更厉害，实则就整体能力而言并没有多强，不像gpt4这种规模的模型，是全语言级别的，无论是什么语言它都有很高的一致性
【回复】回复 @聪明的矿洞熊猫 :害，昙花一现，还是蹲一下qwen2-72B怎么样吧吧
【回复】回复 @呛了-口 :中文排行榜里面不是榜一吧，在它刚出来的时候是榜二仅次于gpt4o，当然现在是降到五六名去了，因为冲上几个谷歌系列的最新模型
bili_饭特稀:
付费首选：gpt4 免费首选：Gemini pro1.5， claude3 sonnet 国内首选：通义千问

【回复】Gemini用不了啊[笑哭]得外面账号，ChatGPT不用
I小I叶I子I:
视频里用的是LMSYS网站里的大模型排行榜总榜的数据，同一个网站里的中文榜单下的第一名是Claude 3 Opus 1325分，国产模型最强的Qwen1.5 72b排在第八名 1246分……差距还是很大，不过没有总榜那么大就是了（

【回复】因为国产模型没有送测。。。qwen目前最强的是闭源的qwen-max，文心glm都没有去测，这个榜单对中文模型覆盖很不全，最强的一个没送测
【回复】回复 @Bob家的小蜗 :你的人生就只以贬低别人的成果为支柱吗
【回复】回复 @呛了-口 :最强的是qwen开源的qwen110b吧
StevenJokes:
所以TM的kimi是凭什么跑到我事业单位考试卷上的？[笑哭]跟外国创业公司Mistral差太远啦[笑哭]

【回复】1. kimi的定位是c端应用，不是卷跑分 2. 对国内多数c端用户而言，kimi已经够用 3. kimi的交互体验更好，在c端的传播更快
【回复】回复 @甘蔗的养鸽场 :对的，kimi侧重在应用层，严格来说跟他们不是一个跑道
【回复】回复 @甘蔗的养鸽场 :我用了很长时间我还是觉得3.5更好
战栗的龙卷吖:
gpt4o登场 : 没一个能打的[脱单doge][脱单doge]

lvjiajjj:
国内缺算力缺数据，对标GPT4全是营销幌子

祈符雨_柴源:
gpt4真的有在变强嘛，我用着感觉现版本比以前更傻了

牛油果自助烧烤:
gpt4原版现在一样很猛，只是成本太高了而已

【回复】回复 @l芒夏 :只能算免费试用大概3小时10条

AI 科技人工智能排行榜 ChatGPT GPT4 前沿科技大模型 Llama 3

如果觉得我的文章对您有用，请随意打赏。您的支持将鼓励我继续创作！