​IBM 推出小型AI模型 Granite 3.2 ,强调高效推理与实用性

59
2025-03-06

IBM 最近发布了其最新的 Granite3.2大型语言模型,旨在为企业和开源社区提供 “小巧、高效、实用” 的企业人工智能解决方案。该模型不仅具备多模态和推理能力,还提升了灵活性和成本效益,使得用户更容易采用。



Granite3.2引入了视觉语言模型(VLM),用于处理文档,进行数据分类和提取。IBM 声称,这一新模型在一些关键基准测试中,性能达到或超过了更大型的模型,如 Llama3.211B 和 Pixtral12B。此外,Granite3.2的8B 模型在标准数学推理基准测试中,也显示出能匹敌或超越更大模型的能力。


为了提升推理能力,Granite3.2的某些模型还具备 “思维链” 功能,能够阐明中间推理步骤。该功能虽然需要较大的计算能力,但用户可以根据需求随时启用或禁用,以优化效率并降低整体成本。IBM AI 研究副总裁 Sriram Raghavan 在发布会上表示,下一代人工智能的重点在于效率、整合与实际影响,让企业在不超支的情况下实现强大的成果。


除了推理能力的提升,Granite3.2还推出了 “Granite Guardian” 安全模型的小型化版本,尽管体积缩减了30%,但性能仍然保持在前一代模型的水平。此外,IBM 还引入了一种名为 “可言语化信心” 的能力,这种能力能够更细致地评估风险,并在安全监测中考虑不确定性。


Granite3.2是在 IBM 的开源 Docling 工具包上训练的,该工具包允许开发者将文档转换为定制的企业 AI 模型所需的特定数据。模型训练过程中处理了8500万份 PDF 文件以及2600万个合成问答对,以增强 VLM 处理复杂文档工作流的能力。


IBM 还宣布推出下一代 TinyTimeMixers(TTM)模型,这是一种紧凑的预训练模型,专注于多变量时间序列预测,具备最长可达两年的长远预测能力。


官方博客:https://www.ibm.com/new/announcements/ibm-granite-3-2-open-source-reasoning-and-vision



划重点:  


📊 Granite3.2引入视觉语言模型,提升文档处理与数据提取能力。  


💡 新模型具备思维链功能,能够阐明推理过程,增强推理能力。  


🔍  Granit Guardian 安全模型小型化30%,但性能未受影响,同时推出可言语化信心的风险评估功能。


78538
文章来源于网络,如有侵权请联系本站删除
精选二手好课
更多>>
次卡|宁波哈喽贝比早教课时托班
早教课
¥8800
次卡|泰安克莱沃(金色雨林)早教课。配合更名。 还余76节课。一口价8890转。
早教课
¥8890
次卡|昆明海伦国际七田阳光早教课100节
早教课
¥9000
次卡|西安A索国际早教转课,还剩129节,赠送4节课!
早教课
¥9000
次卡|海口本人在高米早教课有100节,打包9000
早教课
¥9000
次卡|济南市中区欧亚大观金宝贝幼儿早教中心课程
早教课
¥9000
次卡|深圳小马快跑早教,200多一节课现在转让140一节
早教课
¥9400
次卡|北京转纽约国际早教,9800,75节课,可以上蓝色港湾店等很多店
早教课
¥9800
次卡|[new]泰州[右]NYC纽约国际泰州早教中心[右]年卡出售[hot]
早教课
¥9850
年卡|西安西安麦吉森林托育课程一个月➕15天
早教课
¥9999
73
AI资讯

​IBM 推出小型AI模型 Granite 3.2 ,强调高效推理与实用性

IBM 最近发布了其最新的 Granite3.2大型语言模型,旨在为企业和开源社区提供 “小巧、高效、实用” 的企业人工智能解决方案。该模型不仅具备多模态和推理能力,还提升了灵活性和成本效益,使得用户更容易采用。



Granite3.2引入了视觉语言模型(VLM),用于处理文档,进行数据分类和提取。IBM 声称,这一新模型在一些关键基准测试中,性能达到或超过了更大型的模型,如 Llama3.211B 和 Pixtral12B。此外,Granite3.2的8B 模型在标准数学推理基准测试中,也显示出能匹敌或超越更大模型的能力。


为了提升推理能力,Granite3.2的某些模型还具备 “思维链” 功能,能够阐明中间推理步骤。该功能虽然需要较大的计算能力,但用户可以根据需求随时启用或禁用,以优化效率并降低整体成本。IBM AI 研究副总裁 Sriram Raghavan 在发布会上表示,下一代人工智能的重点在于效率、整合与实际影响,让企业在不超支的情况下实现强大的成果。


除了推理能力的提升,Granite3.2还推出了 “Granite Guardian” 安全模型的小型化版本,尽管体积缩减了30%,但性能仍然保持在前一代模型的水平。此外,IBM 还引入了一种名为 “可言语化信心” 的能力,这种能力能够更细致地评估风险,并在安全监测中考虑不确定性。


Granite3.2是在 IBM 的开源 Docling 工具包上训练的,该工具包允许开发者将文档转换为定制的企业 AI 模型所需的特定数据。模型训练过程中处理了8500万份 PDF 文件以及2600万个合成问答对,以增强 VLM 处理复杂文档工作流的能力。


IBM 还宣布推出下一代 TinyTimeMixers(TTM)模型,这是一种紧凑的预训练模型,专注于多变量时间序列预测,具备最长可达两年的长远预测能力。


官方博客:https://www.ibm.com/new/announcements/ibm-granite-3-2-open-source-reasoning-and-vision



划重点:  


📊 Granite3.2引入视觉语言模型,提升文档处理与数据提取能力。  


💡 新模型具备思维链功能,能够阐明推理过程,增强推理能力。  


🔍  Granit Guardian 安全模型小型化30%,但性能未受影响,同时推出可言语化信心的风险评估功能。


78538
文章来源于网络,如有侵权请联系本站删除
二手好课
更多>>
次卡|宁波哈喽贝比早教课时托班
早教课
¥8800
次卡|泰安克莱沃(金色雨林)早教课。配合更名。 还余76节课。一口价8890转。
早教课
¥8890
次卡|昆明海伦国际七田阳光早教课100节
早教课
¥9000
次卡|西安A索国际早教转课,还剩129节,赠送4节课!
早教课
¥9000
次卡|海口本人在高米早教课有100节,打包9000
早教课
¥9000
次卡|济南市中区欧亚大观金宝贝幼儿早教中心课程
早教课
¥9000
次卡|深圳小马快跑早教,200多一节课现在转让140一节
早教课
¥9400
次卡|北京转纽约国际早教,9800,75节课,可以上蓝色港湾店等很多店
早教课
¥9800
次卡|[new]泰州[右]NYC纽约国际泰州早教中心[右]年卡出售[hot]
早教课
¥9850
年卡|西安西安麦吉森林托育课程一个月➕15天
早教课
¥9999