谷歌周四宣布对其 AI 笔记和研究助手NotebookLM进行更新,允许用户获取 YouTube 视频和音频文件的摘要,甚至可以创建可共享的 AI 生成的音频讨论。这家搜索巨头旨在拓宽该工具的使用场景和覆盖范围。该工具最初是去年在其 I/O 开发者大会上作为一个项目推出的,在美国公开发布数月后,已扩展到印度、英国等市场,以及 200 多个国家。
NotebookLM最初由教育工作者和学习者使用,但最近其用户群发生了显著变化,现在吸引了更多工作环境中的人。
谷歌实验室人工智能高级产品经理雷扎·马丁(Raiza Martin)在独家采访中表示,该工具的用户现在大致分为,50%为教育工作者和学习者,另一半为商业专业人士。
她告诉 TechCrunch:“人们现在共享笔记本,这正在形成一种网络效应。”
这促使 NotebookLM 团队推出新功能,希望增强其网络效应并使该工具在不同人群中流行起来。
本月初,NotebookLM添加了音频概览,让用户可以将文档转换为引人入胜的音频讨论。最新更新扩展了该体验,允许用户使用公共 URL 分享 NotebookLM 中生成的音频概览。
要使用该功能,请单击工具中生成的音频概览上的共享图标以获取其 URL,然后您可以复制并与他人共享。
马丁说,她的团队看到专业人士将网页、简历甚至演示文稿上传到 NotebookLM 上以生成音频概述,然后与他们的雇主、同事或客户分享。
NotebookLM 还增加了对 YouTube 视频和音频文件(如 .mp3 和 .wav)的支持,作为新的源类型,同时还支持 Google Docs、PDF、文本文件、Google Slides 和网页。新功能可帮助用户总结 YouTube 视频中的要点,并从学习课程或项目的录音中获取要点和见解。
马丁告诉 TechCrunch,由于谷歌实验室有一个小团队负责 NotebookLM,该工具采用该公司的多模式大型语言模型 Gemini 1.5 Pro,因此团队为该工具添加的每个新功能都是基于用户反馈。
“人工智能工具的有趣之处在于,很多假设都会发生变化,”她说。“去年可能有用的东西,今年可能就没用了。”
谷歌于去年年底在美国首次推出 NotebookLM,今年 6 月将其覆盖范围扩展至 200 多个国家。
Martin 告诉 TechCrunch,尽管没有透露具体数字,但 NotebookLM 在美国仍占主要使用量,日本已成为该工具的下一个大市场。这位高管还强调,部分用户正在使用 NotebookLM 获得与他们在工具上设置的语言不同的基于人工智能的摘要。
“尤其是在日本,我们看到很多文件不是日文的,但 NotebookLM 却设置为日文,”她说。“因此人们用他们的母语进行查询,用它来处理可能复杂且密集的英文文件。”
谷歌表示,用户上传到 NotebookLM 的信息将保持私密,不会用于训练 AI 模型。要使用该工具,用户必须年满 18 岁。
不过,NotebookLM 也面临着作为 AI 工具的固有挑战。其中之一是,如果用户过于依赖 NotebookLM,他们可能会很快失去阅读长篇内容和研究论文的习惯。这也可能导致过度简化的问题。
马丁告诉 TechCrunch,她的团队非常清楚这些担忧。
NotebookLM 提供用户上传内容的可点击引文,让用户更深入地了解总结的笔记。
“我们尽量鼓励你阅读原文。我们鼓励你仔细检查 NotebookLM 给出的所有答案……你可以阅读 SparkNotes 或实际书籍;一切取决于你,”她说。
NotebookLM 目前仅限于网络使用,但 Martin 表示其移动应用程序可能会在明年某个时候推出。
与此同时,团队正忙于添加更多新功能。Martin 表示,这些将专注于增加对输入端的支持和新的输出源。