Reka AI是由十几个谷歌DeepMind前科学家们创办的公司,近日他们掷出了其首个开源模型—— Reka Flash3。这款拥有 210亿参数 的推理模型,一经亮相便引发业内外的广泛关注。
别看 Reka Flash3只有210亿参数,据官方介绍,这款模型是 从零开始训练 的通用推理模型。它不仅在 合成和公共数据集 上进行了监督式微调,还通过 基于模型和规则的强化学习(RLOO) 进行了深度优化。
如此“内外兼修”,使得 Reka Flash3在性能上展现出惊人的实力,甚至 超越了 Command A 和 Gemma327B 等参数量更大的模型。
更令人兴奋的是,Reka Flash3被誉为 同等规模开源模型中的佼佼者。这意味着开发者们终于有了一个性能强大且免费的“趁手兵器”,可以更自由地探索和构建各种创新应用。
Reka Flash3的能力可不止停留在简单的文本生成。它背后蕴藏着诸多令人期待的功能特点:
- 推理能力强劲:作为一款通用推理模型,Reka Flash3在逻辑 reasoning 方面自然有着不俗的表现。无论是回答复杂问题,还是进行多步推理,相信它都能展现出“聪明”的一面。
- 低延迟与设备部署友好:官方特别强调,Reka Flash3是一款 低延迟 的模型,并且非常适合 在设备上进行部署。这意味着未来我们可能会在手机、平板电脑等终端设备上,直接体验到这款强大模型带来的便捷服务。这简直是“效率至上”时代的福音!
- Nexus 平台的核心驱动:Reka Flash3不仅是一个独立的模型,它还是 Reka AI 全新平台 Nexus 的核心驱动力。Nexus 平台旨在帮助组织 创建和管理 AI 工作者,这些 AI 工作者拥有 原生深度研究能力,可以 浏览网页、执行代码以及分析包括文档、图像、视频和音频在内的内部文件。
- “思考”机制与预算控制:Reka Flash3在生成输出之前会进行“思考”,并使用特定的 标签 来标记思考过程的开始和结束。有趣的是,Reka AI 还提供了一种 “预算强制” 机制,允许用户在模型思考一定步数后强制其输出,即使思考尚未完成,但通常仍能产生合理的结果。
尽管 Reka Flash3能力出众,但官方也坦诚地指出,作为一个较小的模型,它 并非知识密集型任务的最佳选择。对于这类需求,Reka AI 建议 将 Reka Flash3与网络搜索等工具相结合 使用,让模型拥有更广阔的知识来源。