notebooklm-py:NotebookLM 命令行与 AI Agent 集成工具技术分析
一、新闻概述
1. 标题
notebooklm-py:将 Google NotebookLM 搬进命令行的开源神器
2. 发布时间
2025 年 1 月 15 日
3. 来源
微信公众号:痕小子
二、核心内容
1. 事件摘要
A. 主要内容
GitHub 上新兴的开源项目 notebooklm-py 将 Google NotebookLM 的完整功能搬到了命令行环境中,支持 Claude Skill、CLI 和 Python API 三种使用方式。
B. 核心亮点
- 无需打开网页版 NotebookLM,通过命令行完成所有操作
- 支持 URL、PDF、YouTube 视频、Google Drive 等多种数据源
- 一键生成思维导图、音频播客、PPT、测验等学习内容
- 深度集成 Claude Code,可作为 AI Agent 工具使用
2. 关键信息
A. 版本信息
- 项目名称:notebooklm-py
- 开源平台:GitHub
- 作者:teng-lin
B. 核心能力
- RAG 能力:基于 Gemini 3 Pro 的检索增强生成
- 多模态生成:文本、音频、视频、图表
- 自动化研究:批量处理和可重复研究流程
C. 适用人群
- 研究人员、技术写作者
- YouTube 技术视频学习者
- 需要长期知识库管理的用户
- AI Agent 重度用户
3. 背景介绍
A. NotebookLM 简介
Google 推出的 NotebookLM 是一款基于 Gemini 3 Pro 的 AI 驱动的研究和学习工具,能够自动从文档、视频中提取关键信息,生成播客、思维导图、PPT 等内容。其 RAG 能力在目前市场上属于第一梯队。
B. 痛点分析
网页版 NotebookLM 存在以下限制:
- 需要手动操作,缺乏自动化能力
- 无法集成到自动化工作流中
- 批量处理效率低
- 无法作为 AI Agent 的工具使用
三、详细报道
1. 主要内容
A. 核心功能
AI Agent 工具集成:
- 作为 Claude Code Skill 使用
- 支持异步 Python API
- 可集成到自定义 AI Agent
研究自动化:
- 批量导入多种数据源(URL、PDF、YouTube、Google Drive)
- 运行自动化研究查询
- 以编程方式提取见解
- 构建可重复的研究流程
内容生成:
- 音频播客(AI 主持的深度对话)
- 思维导图
- PPT 演示文稿
- 测验题目
- 抽认卡
- 学习指南
B. 技术架构
notebooklm-py 采用分层架构设计,核心层负责与 Google NotebookLM API 交互,接口层提供多种访问方式。
graph TD
subgraph Input["输入层"]
A[URL源]
B[PDF文件]
C[Youtube视频]
D[Google Drive]
end
subgraph Core["NotebookLM-Py 核心引擎"]
E[认证管理]
F[Notebook管理]
G[源数据处理]
H[AI对话接口]
I[内容生成器]
end
subgraph Output["输出层"]
J[思维导图]
K[音频播客]
L[PPT演示]
M[测验题目]
N[学习指南]
end
subgraph Interface["用户接口层"]
O[Claude Skill]
P[命令行CLI]
Q[Python API]
end
A --> G
B --> G
C --> G
D --> G
E --> F
F --> G
G --> H
G --> I
H --> O
H --> P
H --> Q
I --> J
I --> K
I --> L
I --> M
I --> N
O --> H
P --> H
Q --> H
C. 安装方式
基础安装:
pip install notebooklm-py浏览器登录支持(首次认证需要):
pip install "notebooklm-py[browser]"
playwright install chromium通过 Claude Skill 安装:
notebooklm skill installD. 三种使用方式
方式一:Claude Skills
# 通过自然语言交互
"制作一个关于量子计算的播客"
"将测验下载为markdown格式"
"/notebooklm 生成视频"方式二:命令行界面
# 首次登录认证
notebooklm login
# 创建 notebook
notebooklm create "My Research"
notebooklm use <notebook_id>
# 添加源
notebooklm source add "https://en.wikipedia.org/wiki/Artificial_intelligence"
notebooklm source add "./paper.pdf"
# 自然语言对话
notebooklm ask "What are the key themes?"
# 生成播客
notebooklm generate audio --wait
notebooklm download audio ./podcast.mp3方式三:Python API
import asyncio
from notebooklm import NotebookLMClient
async def main():
async with await NotebookLMClient.from_storage() as client:
# 列出 notebooks
notebooks = await client.notebooks.list()
# 创建 notebook 并添加源
nb = await client.notebooks.create("Research")
await client.sources.add_url(nb.id, "https://example.com")
# 对话
result = await client.chat.ask(nb.id, "Summarize this")
print(result.answer)
# 生成播客
status = await client.artifacts.generate_audio(nb.id)
await client.artifacts.wait_for_completion(nb.id, status.task_id)
asyncio.run(main())2. 技术细节
A. 功能特性对比
| 功能类别 | 网页版 NotebookLM | notebooklm-py |
|---|---|---|
| 数据源导入 | 手动上传 | 批量导入,支持自动化 |
| 内容生成 | 手动点击 | 命令行/API 调用 |
| 播客生成 | 手动操作 | 一键生成 |
| 批量处理 | 不支持 | 完全支持 |
| AI Agent 集成 | 不支持 | 原生支持 |
| 可编程性 | 有限 | 完全可编程 |
B. 工作流程
sequenceDiagram
participant U as 用户
participant C as CLI/API
participant N as NotebookLM引擎
participant G as Google服务
U->>C: 发起请求
C->>N: 创建/使用 Notebook
C->>N: 添加数据源
N->>G: 上传/解析内容
G-->>N: 返回处理结果
U->>C: 提问/生成指令
C->>N: 调用 AI 接口
N->>G: Gemini 3 Pro 处理
G-->>N: 返回生成内容
N-->>C: 返回结果
C-->>U: 展示/下载内容
C. 核心优势
可编程性:
- 完整的 Python 异步 API
- 支持 CI/CD 集成
- 可构建自动化研究管道
灵活性:
- 三种使用方式满足不同场景
- 支持多种数据源
- 可定制化输出格式
效率提升:
- 批量处理能力
- 命令行快速操作
- 无需手动点击
3. 数据与事实
A. 社区反响
- 在 X(Twitter)上获得多位技术大佬关注和推荐
- GitHub 早期即获得较高关注度和 Star 数
B. 技术基础
- 基于 Google NotebookLM API
- 使用 Playwright 进行浏览器自动化认证
- Python 异步编程模型
四、影响分析
1. 行业影响
A. 知识管理趋势
传统的知识管理依赖手动整理和分类,而 notebooklm-py 代表了自动化知识管理的新方向。它将信息处理从手动劳动转变为自动化流水线,是未来知识工作方式的一个缩影。
B. AI Agent 生态
该项目展示了 AI Agent 工具生态的繁荣趋势。将优秀 SaaS 产品通过 API/SDK 的方式开放给 AI Agent 使用,将成为未来的重要模式。
C. 命令行复兴
在 GUI 产品泛滥的今天,该项目证明了命令行界面的价值。对于 Power User 来说,可编程性和自动化远比华丽的 UI 重要。
2. 用户影响
A. 研究人员
- 大幅提升文献调研效率
- 自动化生成学习材料
- 构建可复用的研究流程
B. 内容创作者
- 快速将原始素材转化为结构化内容
- 自动生成音频、视频等多媒体内容
- 提高内容产出效率
C. 开发者
- 获得强大的 AI 辅助工具
- 可集成到现有工作流
- 降低 AI 应用开发门槛
D. 迁移成本
- 网页版用户:零成本切换
- 新用户:需要一定的命令行基础
3. 技术趋势
A. RAG 技术普及
NotebookLM 的 RAG 能力是其核心价值,通过开源工具将其普及到更广泛的用户群体,体现了 RAG 技术在知识管理和内容生成领域的重要性。
B. AI 原生工具
越来越多的工具开始将 AI 能力作为核心功能,而非附加功能。notebooklm-py 正是这种 AI 原生工具的典型代表。
C. 自动化优先
未来的生产力工具将是可编程的、可自动化的。那些能够构建自动化管道的工具将更有价值。
五、各方反应
1. 官方回应
Google 官方尚未对 notebooklm-py 发表评论,但该项目使用的是公开 API,属于合规的第三方开发。
2. 业内评价
A. 专家观点
该项目填补了 NotebookLM 在自动化和可编程性方面的空白,是 AI 工具生态的重要补充。
B. 社区反馈
X 平台上多位技术博主推荐:
- 简化了研究工作流
- 与 Claude Code 的集成非常流畅
- 批量处理能力大幅提升效率
3. 用户反馈
A. 正面评价
- 命令行操作简洁高效
- Python API 设计优雅
- 大幅提升工作效率
B. 关注点
- 首次认证需要浏览器操作
- 依赖 Google NotebookLM 服务稳定性
- 文档相对较新,有待完善
C. 潜在改进
- 增加更多输出格式支持
- 提供更详细的 API 文档
- 支持本地部署方案
六、相关链接
1. GitHub 仓库
https://github.com/teng-lin/notebooklm-py
2. 相关工具
- Google NotebookLM:https://notebooklm.google.com/
- Claude Code:https://claude.ai/code
3. 技术文档
- 项目 README 和使用文档
- API 参考文档