本报告导读:
2023 年11 月6 日,李开复的AI 公司零一万物正式发布首款预训练开源大模型Yi-34B,属唯一登顶Hugging Face 全球开源模型排行榜的国产模型,国内AI 生态将进一步完善。
摘要:
投资建议:零一万物推出开源大模型Yi系列(参数34B和6B两版本),性能达国际一流水平,基于Yi 的相关模型演绎及消费级应用或将加速落地,国内原生AI 产业链的竞争优势凸显。推荐标的:金山办公、科大讯飞、万兴科技,受益标的:福昕软件、高新发展。
Yi-34B 成为全球首个开源超长上下文窗口的大模型,极大提升AI 应用体验。开源大模型Yi-34B 拥有340 亿参数量,且具有全球最长的200K 上下文窗口,可以处理约40 万汉字的超长文本输入。相比之下,GPT-4 的上下文窗口只有32K,文字处理量为2.5 万字。Yi-34B 作为全球首个开源超长上下文窗口大模型,为开发者提供了更丰富的语义信息与微调的可能性,所以基于Yi 系列模型的应用场景将进一步拓展,相关功能潜力也将进一步释放。
Yi-34B 兼顾精度与效率,斩获中英双语“双料冠军”。Yi-34B 在大模型评测中最能反映综合能力的两项指标(MMLU、BBH)上评分极高。
在中文理解力方面,Yi-34B 位居C-Eval 中文模型榜单之首,因而在未来的应用上将能够更好契合国内用户需求。英文理解力方面,Yi-34B在Hugging Face 英文测试预训练开源模型排行榜中位列全球第一,以更小的参数量打败Falcon-180B、LLaMA2-70B 等知名大模型。
定位为通用底座,Yi 剑指To C/消费级的超级应用。自从国外LLaMA开源模型发布后,经过微调的诸多垂域模型快速涌现,所以考虑Yi在预训练阶段尽力保留了模型的通用能力,且上下文容量及中文理解力提升明显,基于国内开源大模型的场景训练和推理将迎来质和量的突破,而且Yi 系列量化版本、对话模型、数学模型、代码模型、多模态模型也将以快节奏推出。因此,在阿里等股东的深度合作下,零一万物有望引领国内大模型消费级应用,相关生态拓展潜力巨大。
风险提示:技术迭代不及预期,AI 应用市场拓展节奏不及预期。