智譜發(fā)布新一代開源模型,極速版最高達到200tokens/秒
智譜發(fā)布新一代開源模型GLM-4-32B-0414系列,包含基座、推理、沉思模型權(quán)重,并遵循MIT License。目前系列所有模型可以通過“z.ai”訪問體驗。據(jù)介紹,推理模型GLM-Z1-Air/AirX-0414模型推理速度可以做到最高200 Tokens/秒(MaaS平臺bigmodel.cn上實測),這也是目前國內(nèi)迄今最快的商業(yè)模型,而且GLM-Z1-Air-0414 的價格僅需DeepSeek-R1的1/30。(財聯(lián)社)
(投資界)
下載投資界APP