近日,包括百度、百川智能等8家国产大模型通过首批备案“持证上岗”。用户可在对应平台上申请账号,与AI智能对话。那么,这些大模型是否真的无所不知?真的能帮助用户解决问题?还是一个放大版的Siri呢?记者选取了其中五款模型,包括豆包(字节云雀大模型)、通义千问(阿里通义大模型)、讯飞星火(星火认知大模型)、文心一言(百度文新大模型)、智谱清言(智谱 ChatGLM 2大模型),从搜索能力、上下文理解能力、情感分析力、编程能力四个方面来考察,出了一张20道原创考题的“试卷”,看看哪款模型最好用。
五款模型在信息搜索能力方面表现各异。豆包的信息搜索能力较强,而文心一言、智谱清言或许是因为数据库并未更新,提供的地址均为旧址,无法代替搜索引擎。讯飞星火和通义千问更是离谱,讯飞星火捏造了一个错误的地址,而通义千问则建议记者在搜索引擎搜索,或是去官网寻找,可谓是“问了也白问”。
在涉及法律、经济等专业知识的问题上,五款模型的表现也有所不同。豆包与讯飞星火较为可靠,逻辑清晰且无明显漏洞,似乎可以给男士们提供参考。文心一言的答案则存在较多事实性错误,属于一本正经地瞎说。
总的来说,五款国产大模型在搜索能力和专业知识方面各有优劣,用户可以根据自己的需求选择合适的模型。
本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕,E-mail:xinmeigg88@163.com
本文链接:http://www.glev.cn/tnews/6983.html
上一篇
饺子怎么来的