本报告导读:
Llama 4 系列模型拥有MoE 架构、大规模、多模态、长文本等多种特点,为其带来了强大的性能和突出的性价比,有望推动开源AI 持续发展。
投资要点:
投资建议:Llama 4开启了开源AI新纪元,有望进一步推动整个开源AI 生态的发展,推荐标的,华大九天、达梦数据、中国软件、金山办公、海光信息、寒武纪、中科曙光、纳思达、软通动力、新大陆、赛意信息、通行宝、润泽科技。
MoE 架构Llama 4 模型发布,参数巨大性能强大。4 月6 日,Meta发布Llama 4 系列首批模型,包括两款高效模型Llama 4 Scout、Llama 4 Maverick。此外,Meta 还预览了其迄今最强大最智能的模型——Llama 4 Behemoth。Llama 4 模型还是Llama 系列模型中首批采用混合专家(MoE)架构的模型。Llama 4 Scout 包含170 亿活跃参数、16 个专家模型及1090 亿总参数,在各基准测试中性能优于Gemma 3、Gemini 2.0 Flash-Lite 和Mistral 3.1。Llama 4 Maverick 拥有170 亿活跃参数,128 个专家模型及4000 亿总参数。其拥有顶尖的图像定位能力,可将用户指令与相关视觉概念精准对齐,并将响应锚定到图像中的特定区域。主流基准测试中,Maverick 全面超越GPT-4o 与Gemini 2.0 Flash;在活跃参数仅为DeepSeek V3 一半的情况下,其在推理与代码能力方面实现了同等性能,性价比突出。
最强的Llama 4 Behemoth 尚在训练中,其包含2880 亿活跃参数、16 个专家模型以及2 万亿总参数,目前在STEM 领域的基准测试中表现优于GPT-4.5、Claude Sonnet 3.7 和Gemini 2.0 Pro。
Llama 4 长文本能力和多模态能力突出。Llama 4 采用了早期融合(Early Fusion)技术,可以用海量的无标签文本、图片和视频数据一起来预训练模型,实现文本和视觉token 无缝整合到统一的模型框架里。Llama 用各种图像和视频帧静止图像训练两个模型,以赋予它们广泛的视觉理解能力,包括时间活动和相关图像。这支持多图像输入与文本提示的无缝交互,用于视觉推理和理解任务。Llama4 Scout 模型支持高达1000 万token 的上下文窗口,刷新了开源模型的纪录,其他领先模型如GPT-4o 也未达到此规模。我们认为这将为AI 模型的功能打开新的可能,如多文档摘要,解析大规模用户活动以进行个性化任务,以及在庞大的代码库中进行推理。
Llama 4 系列模型有望推动开源AI 持续发展。作为开源模型社区的“领头羊”,Llama 系列模型由Meta 在2022 年推出。2023 年,Meta率先宣布开源Llama 2,并且可免费商用,此举激活了开发者社区的创新潜力,此后基于Llama 2 构建的应用项目数量大大增加。2024年4 月,Llama 3 正式发布,在技术层面实现了诸多突破,不仅在单语言任务上表现卓越,还实现了多模态处理能力,从而开启了多模态的新纪元。我们认为,目前大模型技术正不断突破,大模型竞争趋于白热化,Llama 4 此次在多个技术领域取得了进展,其开源背景使得后来者能够更好地学习借鉴,可以说,Llama 4 开启了开源AI新纪元,有望进一步推动整个开源AI 生态的发展。
风险提示:AI技术发展不及预期;AI商业落地不及预期。



