notebooklm-py:NotebookLM 命令行与 AI Agent 集成工具技术分析

一、新闻概述

1. 标题

notebooklm-py:将 Google NotebookLM 搬进命令行的开源神器

2. 发布时间

2025 年 1 月 15 日

3. 来源

微信公众号:痕小子

二、核心内容

1. 事件摘要

A. 主要内容

GitHub 上新兴的开源项目 notebooklm-py 将 Google NotebookLM 的完整功能搬到了命令行环境中,支持 Claude Skill、CLI 和 Python API 三种使用方式。

B. 核心亮点

  • 无需打开网页版 NotebookLM,通过命令行完成所有操作
  • 支持 URL、PDF、YouTube 视频、Google Drive 等多种数据源
  • 一键生成思维导图、音频播客、PPT、测验等学习内容
  • 深度集成 Claude Code,可作为 AI Agent 工具使用

2. 关键信息

A. 版本信息

  • 项目名称:notebooklm-py
  • 开源平台:GitHub
  • 作者:teng-lin

B. 核心能力

  • RAG 能力:基于 Gemini 3 Pro 的检索增强生成
  • 多模态生成:文本、音频、视频、图表
  • 自动化研究:批量处理和可重复研究流程

C. 适用人群

  • 研究人员、技术写作者
  • YouTube 技术视频学习者
  • 需要长期知识库管理的用户
  • AI Agent 重度用户

3. 背景介绍

A. NotebookLM 简介

Google 推出的 NotebookLM 是一款基于 Gemini 3 Pro 的 AI 驱动的研究和学习工具,能够自动从文档、视频中提取关键信息,生成播客、思维导图、PPT 等内容。其 RAG 能力在目前市场上属于第一梯队。

B. 痛点分析

网页版 NotebookLM 存在以下限制:

  • 需要手动操作,缺乏自动化能力
  • 无法集成到自动化工作流中
  • 批量处理效率低
  • 无法作为 AI Agent 的工具使用

三、详细报道

1. 主要内容

A. 核心功能

AI Agent 工具集成:

  • 作为 Claude Code Skill 使用
  • 支持异步 Python API
  • 可集成到自定义 AI Agent

研究自动化:

  • 批量导入多种数据源(URL、PDF、YouTube、Google Drive)
  • 运行自动化研究查询
  • 以编程方式提取见解
  • 构建可重复的研究流程

内容生成:

  • 音频播客(AI 主持的深度对话)
  • 思维导图
  • PPT 演示文稿
  • 测验题目
  • 抽认卡
  • 学习指南

B. 技术架构

notebooklm-py 采用分层架构设计,核心层负责与 Google NotebookLM API 交互,接口层提供多种访问方式。

graph TD
    subgraph Input["输入层"]
        A[URL源]
        B[PDF文件]
        C[Youtube视频]
        D[Google Drive]
    end

    subgraph Core["NotebookLM-Py 核心引擎"]
        E[认证管理]
        F[Notebook管理]
        G[源数据处理]
        H[AI对话接口]
        I[内容生成器]
    end

    subgraph Output["输出层"]
        J[思维导图]
        K[音频播客]
        L[PPT演示]
        M[测验题目]
        N[学习指南]
    end

    subgraph Interface["用户接口层"]
        O[Claude Skill]
        P[命令行CLI]
        Q[Python API]
    end

    A --> G
    B --> G
    C --> G
    D --> G
    E --> F
    F --> G
    G --> H
    G --> I
    H --> O
    H --> P
    H --> Q
    I --> J
    I --> K
    I --> L
    I --> M
    I --> N
    O --> H
    P --> H
    Q --> H

mermaid

C. 安装方式

基础安装:

pip install notebooklm-py

浏览器登录支持(首次认证需要):

pip install "notebooklm-py[browser]"
playwright install chromium

通过 Claude Skill 安装:

notebooklm skill install

D. 三种使用方式

方式一:Claude Skills

# 通过自然语言交互
"制作一个关于量子计算的播客"
"将测验下载为markdown格式"
"/notebooklm 生成视频"

方式二:命令行界面

# 首次登录认证
notebooklm login

# 创建 notebook
notebooklm create "My Research"
notebooklm use <notebook_id>

# 添加源
notebooklm source add "https://en.wikipedia.org/wiki/Artificial_intelligence"
notebooklm source add "./paper.pdf"

# 自然语言对话
notebooklm ask "What are the key themes?"

# 生成播客
notebooklm generate audio --wait
notebooklm download audio ./podcast.mp3

方式三:Python API

import asyncio
from notebooklm import NotebookLMClient

async def main():
    async with await NotebookLMClient.from_storage() as client:
        # 列出 notebooks
        notebooks = await client.notebooks.list()

        # 创建 notebook 并添加源
        nb = await client.notebooks.create("Research")
        await client.sources.add_url(nb.id, "https://example.com")

        # 对话
        result = await client.chat.ask(nb.id, "Summarize this")
        print(result.answer)

        # 生成播客
        status = await client.artifacts.generate_audio(nb.id)
        await client.artifacts.wait_for_completion(nb.id, status.task_id)

asyncio.run(main())

2. 技术细节

A. 功能特性对比

功能类别网页版 NotebookLMnotebooklm-py
数据源导入手动上传批量导入,支持自动化
内容生成手动点击命令行/API 调用
播客生成手动操作一键生成
批量处理不支持完全支持
AI Agent 集成不支持原生支持
可编程性有限完全可编程

B. 工作流程

sequenceDiagram
    participant U as 用户
    participant C as CLI/API
    participant N as NotebookLM引擎
    participant G as Google服务

    U->>C: 发起请求
    C->>N: 创建/使用 Notebook
    C->>N: 添加数据源
    N->>G: 上传/解析内容
    G-->>N: 返回处理结果
    U->>C: 提问/生成指令
    C->>N: 调用 AI 接口
    N->>G: Gemini 3 Pro 处理
    G-->>N: 返回生成内容
    N-->>C: 返回结果
    C-->>U: 展示/下载内容

mermaid

C. 核心优势

可编程性:

  • 完整的 Python 异步 API
  • 支持 CI/CD 集成
  • 可构建自动化研究管道

灵活性:

  • 三种使用方式满足不同场景
  • 支持多种数据源
  • 可定制化输出格式

效率提升:

  • 批量处理能力
  • 命令行快速操作
  • 无需手动点击

3. 数据与事实

A. 社区反响

  • 在 X(Twitter)上获得多位技术大佬关注和推荐
  • GitHub 早期即获得较高关注度和 Star 数

B. 技术基础

  • 基于 Google NotebookLM API
  • 使用 Playwright 进行浏览器自动化认证
  • Python 异步编程模型

四、影响分析

1. 行业影响

A. 知识管理趋势

传统的知识管理依赖手动整理和分类,而 notebooklm-py 代表了自动化知识管理的新方向。它将信息处理从手动劳动转变为自动化流水线,是未来知识工作方式的一个缩影。

B. AI Agent 生态

该项目展示了 AI Agent 工具生态的繁荣趋势。将优秀 SaaS 产品通过 API/SDK 的方式开放给 AI Agent 使用,将成为未来的重要模式。

C. 命令行复兴

在 GUI 产品泛滥的今天,该项目证明了命令行界面的价值。对于 Power User 来说,可编程性和自动化远比华丽的 UI 重要。

2. 用户影响

A. 研究人员

  • 大幅提升文献调研效率
  • 自动化生成学习材料
  • 构建可复用的研究流程

B. 内容创作者

  • 快速将原始素材转化为结构化内容
  • 自动生成音频、视频等多媒体内容
  • 提高内容产出效率

C. 开发者

  • 获得强大的 AI 辅助工具
  • 可集成到现有工作流
  • 降低 AI 应用开发门槛

D. 迁移成本

  • 网页版用户:零成本切换
  • 新用户:需要一定的命令行基础

3. 技术趋势

A. RAG 技术普及

NotebookLM 的 RAG 能力是其核心价值,通过开源工具将其普及到更广泛的用户群体,体现了 RAG 技术在知识管理和内容生成领域的重要性。

B. AI 原生工具

越来越多的工具开始将 AI 能力作为核心功能,而非附加功能。notebooklm-py 正是这种 AI 原生工具的典型代表。

C. 自动化优先

未来的生产力工具将是可编程的、可自动化的。那些能够构建自动化管道的工具将更有价值。

五、各方反应

1. 官方回应

Google 官方尚未对 notebooklm-py 发表评论,但该项目使用的是公开 API,属于合规的第三方开发。

2. 业内评价

A. 专家观点

该项目填补了 NotebookLM 在自动化和可编程性方面的空白,是 AI 工具生态的重要补充。

B. 社区反馈

X 平台上多位技术博主推荐:

  • 简化了研究工作流
  • 与 Claude Code 的集成非常流畅
  • 批量处理能力大幅提升效率

3. 用户反馈

A. 正面评价

  • 命令行操作简洁高效
  • Python API 设计优雅
  • 大幅提升工作效率

B. 关注点

  • 首次认证需要浏览器操作
  • 依赖 Google NotebookLM 服务稳定性
  • 文档相对较新,有待完善

C. 潜在改进

  • 增加更多输出格式支持
  • 提供更详细的 API 文档
  • 支持本地部署方案

六、相关链接

1. GitHub 仓库

https://github.com/teng-lin/notebooklm-py

2. 相关工具

3. 技术文档

  • 项目 README 和使用文档
  • API 参考文档

参考资料

  1. 太强了!这个 NotebookLM Skill,真的把 NotebookLM 搬进了命令行!
最后修改:2026 年 01 月 15 日
如果觉得我的文章对你有用,请随意赞赏