那些挑战GPT-4的大模型们,谁曾短暂登顶?

作者: 机器之心官方分类: 计算机技术 发布时间: 2024-04-29 11:01:42 浏览:5597 次

那些挑战GPT-4的大模型们,谁曾短暂登顶?

这个up主真硬:
第一名的 gpt4 1257 阿里 13名 1153分..我猜想还是输在数据库.反过来如果用全中文的提问环境,很可能国产大模型可以夺冠,因为中文数据库主要在阿里百度手里.

【回复】因为国产模型的话,为了赶上进步,就只好加大中文语调的训练数据了,这样使得中国用户在使用它的时候好像更厉害,实则就整体能力而言并没有多强,不像gpt4这种规模的模型,是全语言级别的,无论是什么语言它都有很高的一致性
【回复】回复 @聪明的矿洞熊猫 :害,昙花一现,还是蹲一下qwen2-72B怎么样吧吧
【回复】回复 @呛了-口 :中文排行榜里面不是榜一吧,在它刚出来的时候是榜二仅次于gpt4o,当然现在是降到五六名去了,因为冲上几个谷歌系列的最新模型
bili_饭特稀:
付费首选:gpt4 免费首选:Gemini pro1.5, claude3 sonnet 国内首选:通义千问

【回复】Gemini用不了啊[笑哭]得外面账号,ChatGPT不用
I小I叶I子I:
视频里用的是LMSYS网站里的大模型排行榜总榜的数据,同一个网站里的中文榜单下的第一名是Claude 3 Opus 1325分,国产模型最强的Qwen1.5 72b排在第八名 1246分……差距还是很大,不过没有总榜那么大就是了(

【回复】因为国产模型没有送测。。。qwen目前最强的是闭源的qwen-max,文心glm都没有去测,这个榜单对中文模型覆盖很不全,最强的一个没送测
【回复】回复 @Bob家的小蜗 :你的人生就只以贬低别人的成果为支柱吗
【回复】回复 @呛了-口 :最强的是qwen开源的qwen110b吧
StevenJokes:
所以TM的kimi是凭什么跑到我事业单位考试卷上的?[笑哭]跟外国创业公司Mistral差太远啦[笑哭]

【回复】1. kimi的定位是c端应用,不是卷跑分 2. 对国内多数c端用户而言,kimi已经够用 3. kimi的交互体验更好,在c端的传播更快
【回复】回复 @甘蔗的养鸽场 :对的,kimi侧重在应用层,严格来说跟他们不是一个跑道
【回复】回复 @甘蔗的养鸽场 :我用了很长时间 我还是觉得3.5更好
战栗的龙卷吖:
gpt4o登场 : 没一个能打的[脱单doge][脱单doge]

lvjiajjj:
国内缺算力缺数据,对标GPT4全是营销幌子

祈符雨_柴源:
gpt4真的有在变强嘛,我用着感觉现版本比以前更傻了

牛油果自助烧烤:
gpt4原版现在一样很猛,只是成本太高了而已

【回复】回复 @l芒夏 :只能算免费试用大概3小时10条

AI 科技 人工智能 排行榜 ChatGPT GPT4 前沿科技 大模型 Llama 3

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!