当前位置:首页 > 资讯 > 正文

五款主流国产大模型PK谁最好用?谁更懂你?我们帮你试了试

五款主流国产大模型PK谁最好用?谁更懂你?我们帮你试了试

近日,包括百度、百川智能等8家国产大模型通过首批备案“持证上岗”。用户可在对应平台上申请账号,与AI智能对话。那么,这些大模型是否真的无所不知?真的能帮助用户解决问题?还是一个放大版的Siri呢?记者选取了其中五款模型,包括豆包(字节云雀大模型)、通义千问(阿里通义大模型)、讯飞星火(星火认知大模型)、文心一言(百度文新大模型)、智谱清言(智谱 ChatGLM 2大模型),从搜索能力、上下文理解能力、情感分析力、编程能力四个方面来考察,出了一张20道原创考题的“试卷”,看看哪款模型最好用。

五款模型在信息搜索能力方面表现各异。豆包的信息搜索能力较强,而文心一言、智谱清言或许是因为数据库并未更新,提供的地址均为旧址,无法代替搜索引擎。讯飞星火和通义千问更是离谱,讯飞星火捏造了一个错误的地址,而通义千问则建议记者在搜索引擎搜索,或是去官网寻找,可谓是“问了也白问”。

在涉及法律、经济等专业知识的问题上,五款模型的表现也有所不同。豆包与讯飞星火较为可靠,逻辑清晰且无明显漏洞,似乎可以给男士们提供参考。文心一言的答案则存在较多事实性错误,属于一本正经地瞎说。

总的来说,五款国产大模型在搜索能力和专业知识方面各有优劣,用户可以根据自己的需求选择合适的模型。