闪电说团队两年 AI 创业踩坑实录

一、访谈概述

1. 背景介绍

A. 访谈对象

余猛和龚震,闪电说创始人。

B. 访谈主题

AI 应用创业两年的踩坑实录与经验分享。

C. 来源

向阳乔木(@vista8)在 X 平台发布的访谈文章。

2. 核心观点

A. 创业本质

"做 AI 应用,本质上就是在卖 token,跟深圳兄弟做跨境电商没什么区别。"——龚震

B. 关键洞察

  • AI 应用具有消费品属性
  • 技术壁垒在长期积累中形成
  • 创业没有方法论,只有长期方向

二、产品演进历程

1. 初始探索(2023 年)

A. 起点:寻找差异化

余猛在 ChatGPT 火了之后思考:大模型时代,真正的差异化在哪里?

  • 计算是通用的
  • 模型结构全球能参与创新的可能就一百来人
  • 剩下的,只有数据

B. 第一次尝试:对话式记忆助手

在手机上做一个用 AI 当界面的记忆工具,记 To-do、记大姨妈、记生日,所有东西都用对话完成。

发现问题

  • 成本太高:用 GPT-4 每个月单人成本 10 美金,人家记大姨妈的 APP 都是免费的
  • 频次太低:本质上没有人喜欢记东西,这是反人性的

C. 第二次尝试:全天候录音

既然主动记录不行,那就被动记录。

产品形态演进

  1. 电脑客户端 + 录音笔
  2. 手机 APP
  3. 耳夹式耳机
  4. 最终方案:装个 APP,用任何耳机都能变成全天候记录设备

核心问题
拿到全天候声音之后,今天的 AI 根本没法充分利用。打呼噜需要专门的 AI 分析,咳嗽需要医疗能力,情绪识别又是另一套。这是个生态问题,不是他们能跨越的鸿沟。

2. 转折点(2025 年初)

A. 发现真需求

Claude Code 发布,余猛和团队从早用到晚,发现:语音编程太爽了。

B. 产品定位转变

从记忆转向语音输入,推出闪电说语音输入法。

3. 产品演进时序

timeline
    title 闪电说产品演进时间线
    2023年 : 对话式记忆助手<br>成本高、频次低
          : 全天候录音项链<br>AI 无法充分利用
    2025年初 : 发现语音编程需求<br>推出闪电说语音输入法
    2025年 : PMF 验证<br>商业化启动

闪电说产品演进时间线

三、创业理念

1. 长期方向

A. 余猛的观点

他在移动互联网做过百万级产品,但没有长期方向,很混乱。到了 AI 时代,他给自己的要求是:一定要找到长期方向。

选择策略

  • 收敛到一个大方向
  • 在里面做暴力破解
  • 从 2024 年 1 月到现在,他们就没做过和声音无关的事情

B. 创新方法论

"创新本质上是用新的方法成功,所以我觉得是没有什么方法论的。"

关键洞察

  • 所有方法论都要被质疑
  • 经验很难简单适用
  • 真正重要的是新的思想、新的方法

2. 大厂经验与创业

A. 龚震的结论

"在大厂工作是学不会创业的。"

原因分析

  • 大厂怎么挣钱,你可以了解,但那套方法你学不会
  • 你不是在大厂里做一个挣钱的机器,你只是机器里的一部分
  • 大厂挣钱模式也是由小长大的,对你怎么挣到第一个 100 万,意义不大

B. 创业 idea 来源

方法一:多看 GitHub 上高赞的项目

  • 前段时间有两个项目反复登上 GitHub 日榜第一
  • 一个做舆情分析,一个做信息 tracking
  • 背后代表的是两类非常明确的需求

方法二:搜索热度验证

  • 看到所有热点和关键词,都拿工具查一下有没有人关注和搜索
  • 简单的微信指数就行
  • 一个被人反复搜的东西,一定有价值

四、技术壁垒与商业模式

1. 技术壁垒的真相

A. 余猛的回答

他也给自己提过这个问题,但还没有得到充分性的答案。

大佬观点
有一天竞争壁垒就是你活过来了,谁走到最后,回头一看这些东西才是你的壁垒。

B. 消费品逻辑

今天的 AI 应用有消费品的属性。

核心特点

  • 核心的大模型技术都是采购的
  • 结合某个场景的独特判断
  • 有点像消费品逻辑

类比说明
奶茶这么多人做,但还有这么多需求。

"我觉得可以把它当做一个 AI 的消费品,但做了之后一定可以形成技术壁垒。"

2. 商业化本质

A. token 分销

本质是做 token 分销。

核心原则
token 分销的本质在于赚有钱人的钱。

B. 转化漏斗数据

闪电说的 AI 纠错开关开启率大概 50%,真正用上 API key 的人不到 20%。

转化路径

  • 50% 开启 AI 纠错
  • 20% 使用 API key
  • 30% 有付费意愿但没被转化
  • 最有钱的前 3% 到 5% 会被转化

C. 商业化公式

只要不是特别奇怪的产品,人均 70% 的毛利。

"所以我们说它是消费品,你就是在卖奶茶。"

3. 付费习惯差异

A. 付费率对比

地区付费率客单价
台湾3% 到 5%中等
中国1% 到 2%较低
美国5% 到 7%

B. 中国用户特点

不是中国人付费习惯差,是经济发展水平没到。但中国有钱人还是很多,做高客单价产品也没问题。

特殊偏好
中国人更喜欢买内容和买实物,买一个能到手的东西。

"送所有礼品里,送麦克风效果最好。你给他 200 块钱,不如给他一个 200 块钱的麦克风。"

五、增长策略

1. 核心原则

大家都在用的招,就是最好用的招。

不要想奇淫巧技,奇淫巧技是你在业务过程中,根据对用户和产品的理解迸发出来的,不能作为日常探索所需。

2. 第一阶段:网红营销

A. 核心逻辑

网红背后代表的是一个用户群体。

你能搞明白你的用户群体是谁,就能找到合适的网红,获得最高效率。

B. KOL 选择策略

不用找大网红,大网红很贵。

正确做法
如果你的产品 PMF 了,应该尽量去找 100 个小 KOL,每个给几百几千。

"最后可能跑出来一条爆款,就把买 20 条的钱赚回来了。"

C. 渠道选择

Monica 最开始在 YouTube 台湾跑得很好,原因有两个:

  • 团队国际化不成熟,台湾文案做得好
  • Monica 是 PC 端产品,YouTube 在 PC 端转化率高

3. 第二阶段:内生增长机制

A. 病毒传播要素

真正要破圈,有很好的自然传播,酷的属性和好玩性很重要。

B. Monica 的案例

Monica 移动端从一个月 1 万刀收入到 10 万刀,就是因为一个很火的东西叫"AI 嘲讽"。

把你的 profile 全部读一遍,给你一个很嘲讽的评论。靠这个东西,移动端收入涨了 10 倍。

4. 第三阶段:SEO 和投放

A. 基本功很重要

SEO 很重要,GEO 很重要。

Google 不会骗你,你很有用它就往前排,你被很多人推崇它就往前排。

B. 投放策略

找到对的人、熟练的人,不要怕花钱。

学习路径
我们都是最开始找 SEO 专家外包,跟他学,学完发现我们也能做。找投放专家跟他学,学完发现也能自己做。

5. 闪电说出海策略

A. 定位

我们是免费的 Wispr Flow。

B. 策略

在一个 Wispr Flow 已经花了几千万美金教育过的市场,最简单粗暴的策略就是告诉大家我们免费。

C. 差异化

他们想猛猛去讲 AI 输入 agent 的体验,因为 Wispr Flow 还没做。

六、技术细节

1. 准确率现状

A. 主流语言表现

主流语言基本都卡在 90% 上下了。

  • 阿里的 SenseVoice 标准测评是 90 多
  • Wispr Flow 在多语言上表现好一点,但在中文上甚至没有 SenseVoice 好
  • Wispr Flow 是个比 SenseVoice 大 10 倍以上的模型

B. 降噪技术

大家更多是在转降噪,因为稍微降噪一点点,准确率就会好很多。

C. 下一个机会

接下来的机会在方言模型。

ROI 计算
你有了足够的语言模型,又构建了语音输入法的商业模式,转方言模型的 ROI 就打正了。

训练成本
训一个模型大概 200 万,大部分成本在数据上。

2. 产品体验设计

A. 快比准更重要

关于产品设置,余猛和龚震都推荐用更聪明的模型,智能效果会明显提升。

B. 交互模式

余猛更喜欢"自由说"模式:按一下说话,再按一下结束。

龚震的习惯:只用一个键,总是开 AI 纠错,但把异步纠错打开。

C. 流式取舍

流式的问题是:你不断说话,字会不断变,因为有不断纠错。

他们希望大家不要被文字输入结果干扰。如果是为了解决安全感问题,分段出就好了,每 5 秒每 10 秒分一段。

七、用户场景

1. 高频场景

A. 最高频

AI coding 和 AI chat。这也是他们能启动的原因,受了用户指向性影响。

B. 次高频

做大量文字工作的人也很猛,比如网文作者、自媒体作者。

C. 职业细分

  • 医生:写病历需求,很多老医生不太会用键盘、不太会拼音
  • 律师:大量文案工作和客户沟通需求
  • 老师:教案和备课需求

这几类频次没那么高,但也是周几次活的水平。

D. 意外场景

用户需要在游戏里喷人,打字喷有点慢,用闪电说喷可能快一点,再加上 AI 体验,能喷得更猛一点。

八、长期愿景

1. 个人模型

A. 初心

提供一个工具,给大家一个选择,可以让大家控制自己的数据,拥有自己的数据。

B. 技术构想

以后可能有一个技术,你的数据在本地,你有一个本地的 10B 模型,能干好管理你的记忆、管理你的上下文。

C. 应用场景

今天可能还要自己说,以后可能只要跟闪电说说"我要买鞋子",它基于你的记忆直接生成描述,发给所有购物 agent。

"我虽然没做任何购物 agent,但我可以跟他们协作。"

2. 记忆入口

A. 前置环节

语音输入法是最前置的环节,可能除了真正把脑子挖出来,这是更好的构建记忆的方式。

B. 真实性

社交媒体发言、写的文档,都是经过加工的,基于某种目的输出给别人看的。但语音输入这个环节更前置,更能代表真实想法。

九、给 AI 创业者的建议

1. 找到长期方向,然后暴力破解

不要为了创业而创业,一定是自己感兴趣的,哪怕不赚钱也愿意做的事情。

收敛到一个大方向,在里面做足够多探索,每天都在复利。

2. 把 AI 应用当消费品来做

技术壁垒暂时回答不了,但消费品逻辑是清晰的。

找到市场空白,用便宜好用的方法生产产品,包装好卖出去。

3. 增长没有奇淫巧技

大家都在用的招,就是最好用的招。

网红营销、SEO、投放,找到对的人学习,不要怕花钱。

4. 出海优先选 T0 国家

不是中国人付费习惯差,是经济水平差异。

美国付费率能到 5% 到 7%,中国 1% 到 2%,而且客单价差距更大。

5. 商业化本质是赚有钱人的钱

5% 的有钱人付费,70% 的毛利,覆盖 100% 的人的成本和推广成本。

算账算得正,就能进入增长循环。

6. 创业给自己足够长的时间

没有任何一个人出来创业一年就要做出什么成果,这是不可能的。

最痛苦的是不知道做什么,找到方向之后,剩下的是耐心。

"除非我确实没有能力做了,那我才会放弃,不然我会一直坚持下去。"

十、关键数据总结

1. 产品数据

  • AI 纠错开启率:50%
  • API key 使用率:不到 20%
  • 付费转化:前 3% 到 5%
  • 毛利率:70%

2. 市场数据

地区付费率备注
台湾3%-5%PMF 产品
中国1%-2%正常情况
美国5%-7%T0 国家

3. 技术数据

  • 主流语言准确率:90% 上下
  • 方言模型提升空间:30% 到 80%
  • 方言模型训练成本:约 200 万

参考资料

  1. 向阳乔木 on X: "做AI应用像卖奶茶:闪电说团队两年踩坑实录,毫无保留,真诚分享!"
最后修改:2026 年 01 月 17 日
如果觉得我的文章对你有用,请随意赞赏