前言:
上次我们介绍了同为“国产大模型五虎”的MiniMax,今天就继续来盘点一下国内估值最高的大模型企业智谱AI,同时也是五虎中的另外一虎。
“国产大模型五虎”指的是由阿里投资的五家大模型独角兽:智谱 AI、百川智能、月之暗面、零一万物和Minimax(排名不分先后)
智谱AI:智谱AI开放平台 (aminer.cn)
智谱AI是一家源自清华大学计算机系技术成果的高科技公司
由张鹏作为CEO领军,核心成员多为清华大学等顶尖学府的学者
自2019年成立以来,一直致力于在认知智能领域拓宽人工智能技术的边界
公司的核心愿景是实现让机器具备类似人类的思考方式,向AGI的方向发展。
再来回顾一下智谱AI的发展时间线
2019年,依托清华大学的知识工程实验室,致力于端侧大模型技术,成立了智谱AI
2020年,智谱AI开始研发GLM预训练架构,并训练了百亿参数模型GLM-10B
2021年,公司利用MoE架构成功训练出万亿稀疏模型
2023年10月,完成超25亿元人民币融资,成为国内估值最高的大模型公司,超100亿人民币
目前,智谱AI的核心技术为端侧大模型
ChatGLM系列大模型基于GLM预训练架构,具备高性能、低延迟的特性,包括多个不同规模的版本,早起的产品有ChatGLM-6B、ChatGLM-10B等,截止到目前已经迭代了三款旗舰大模型,分别为:
ChatGLM2(2023年6月)
ChatGLM3(2023年10月)
GLM-4(2024年1月16日)
在中文能力的方面,GLM-4可以比肩ChatGPT-4。该模型在多个英文数据集上达到了GPT-4的90%至100%的水平,在中文对齐能力上甚至整体超过了GPT-4。
GLM-4可以支持128k的上下文窗口长度,单次提示词可以处理的文本长度相当于300页
且在“大海捞针”测试中,GLM-4模型在128K文本长度内能够实现几乎100%的精度召回
并且ChatGLM系列大模型集成了自研的AgentTuning技术,能够通过训练和调整模型,使其更好地适应特定任务的需求
另外,智谱AI还开发了文生图的大模型CogView
CogView模型采用了Transformer+VQVAE架构,这种架构的优势在于它能够同时学习模态间和模态内的多种关联性,从而提升图像与文本之间跨模态语义匹配的效果
其在MS COCO数据集上的表现超过了OpenAI的DALL·E
值得一提的是,CogView的代码已经在GitHub上开源了
目前,智谱AI开放了通用大模型等诸多主流大模型接口
下面我们就简单的从几个方面来测试一下他们最新的模型GLM-4,结果仅供参考哈
我问了一个这两天网上流行的新梗“成都迪士尼”,结果与实际内容相差不二
再试一下数学计算能力
显而易见,在数学计算能力这块,还是答错了,不过数学计算能力一直是大模型需要攻克的难题,强如Claude3也会在这种问题上出错
继续让它帮我们写一篇题为:大模型浪潮来袭,普通人应如何把握机会的文章
这里我的要求是不分点,不少于800字,看看效果如何
通篇读下来,感觉中规中矩,顺序词用的太多了,且“此外”,“总之”重复出现,但是字数的要求达到了,整篇内容大约九百多字
总之,智谱AI作为国内估值最高的大模型公司,产品有自身的独特之处,研发了自主的大模型创新技术,单就这一点,就能够使其在众多的大模型公司中脱颖而出。实际的效果到底怎么样,还是需要大家自己体验才尚可得知。
本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕,E-mail:xinmeigg88@163.com
本文链接:http://www.glev.cn/tnews/6710.html