Google Antigravity AI 编码助手使用问题技术分析
一、新闻概述
1. 标题
Google Antigravity 使用过程中遇到的问题:AI 编码助手的隐藏疲劳
2. 发布时间
2026 年 1 月 17 日
3. 来源
V2EX 技术社区
二、核心内容
1. 事件摘要
A. 主要内容
V2EX 用户 sn0wdr1am 分享了使用 Google Antigravity AI 编码助手过程中遇到的多个实际问题,引发社区广泛讨论。
B. 核心亮点
- 揭示了 AI 编码助手在实际开发中的隐藏缺陷
- 社区用户反馈普遍存在类似问题
- 反映了当前 AI 编码工具的发展瓶颈
2. 关键信息
A. 涉及产品
- Google Antigravity(AI 编码助手)
- Google Gemini 模型
- 相关竞品:OpenAI Codex、Anthropic Claude Code、字节跳动 TRAE、阿里通义千问
B. 问题类型
规范遵守、代码退化、幻觉问题、挤牙膏效应、无关代码修改
C. 用户反馈
30 条回复,多数用户表示遇到类似问题
3. 背景介绍
A. 相关上下文
Vibe Coding(语音编程)是新兴的开发方式,Google Antigravity 是其实现之一。
B. 行业现状
AI 编码助手市场竞争激烈,OpenAI Codex 和 Anthropic Claude Code 被认为体验较好。
三、详细报道
1. 主要内容
A. 规范遵守问题
用户反映,AI 在没有明确规范时会按照自己的方式编写代码。即使告知规范,AI 也会选择性忽略或忘记部分规范。需要反复纠正才能遵守,增加了开发成本。
B. 代码退化问题
在多轮对话修改后,AI 可能莫名其妙地删除之前添加的注释或代码逻辑。用户发现后询问原因,AI 会道歉并补回,但问题反复出现。
C. 幻觉问题
AI 会根据推理认为某个功能应该存在,但实际上并不存在。例如,引入不存在的包或模块,导致代码运行失败。
D. 挤牙膏效应
对于全局替换等操作,AI 无法一次性完成所有修改。需要多次重复相同指令,每次只修改少量文件,如同挤牙膏。
E. 无关代码修改
AI 每次修改代码时,会顺手修改无关内容,如修改变量名、函数名大小写、擅自拆分函数、导入无用包、重复判断等。
2. 技术细节
A. 问题架构分析
graph TD
A[AI 编码助手问题] --> B[规范遵守]
A --> C[代码退化]
A --> D[幻觉问题]
A --> E[挤牙膏效应]
A --> F[无关修改]
B --> B1[选择性忽略规范]
B --> B2[反复纠正]
C --> C1[删除注释]
C --> C2[删除逻辑]
C --> C3[反复道歉]
D --> D1[推理存在性]
D --> D2[引入不存在模块]
D --> D3[运行失败]
E --> E1[无法一次到位]
E --> E2[多次重复指令]
F --> F1[修改变量名]
F --> F2[擅自重构]
F --> F3[导入无用包]B. 根本原因分析
- 模型训练不足:Google 在 Code Agent 能力方面训练不足
- 上下文管理缺陷:长对话中规范信息丢失
- 推理能力局限:无法准确理解项目全貌
- Agent 系统不完善:工具和模型协同存在问题
C. 竞品对比
根据用户反馈,各 AI 编码助手体验排序为:
- OpenAI Codex:最佳体验
- Anthropic Claude Code:优秀,但偶有错误
- Google Gemini:中等
- 字节跳动 TRAE:较差
- 阿里通义千问:最差
3. 社区反馈
A. 共性问题确认
多数用户反馈遇到相同问题,说明这不是个案,而是系统性问题。
B. 解决方案探讨
- 拆分复杂功能:将复杂功能拆分为小步骤,逐步引导 AI 完成
- 双模型协作:使用 Gemini 生成计划,Claude 进行审计,再由 Gemini 执行
- 使用 OpenSpec:对复杂项目使用 OpenSpec 规范,体验会更好
- 新建 Agent:每个新需求新建 Agent,避免上下文混乱
- 不断质疑:持续质疑 AI 输出,要求搜索最佳实践
C. 技术反思
- AI 擅长架构和局部功能开发,但不适合全局范围操作
- 全局替换、规范修改等操作既浪费 Token 又无法一步到位
- 应该让 AI 编写规范文件,由规范文件驱动代码生成
四、影响分析
1. 技术趋势
A. AI 编码助手瓶颈
当前 AI 编码助手面临的主要瓶颈包括:规范遵守、上下文管理、推理准确性、代码一致性。
B. Vibe Coding 隐患
语音编程(Vibe Coding)虽然便捷,但隐藏疲劳问题。用户需要持续监控和纠正 AI 输出,实际效率可能低于预期。
C. 工程优化方向
需要更好的规范持久化机制、上下文管理策略、以及模型训练优化。
2. 用户影响
A. 开发效率
对于不熟悉 AI 编码助手的用户,可能因频繁纠正而降低效率。
B. 学习成本
用户需要学习如何与 AI 有效沟通,包括规范编写、问题拆分、结果验证等。
C. 工具选择
用户可能转向更成熟的工具,如 OpenAI Codex 或 Anthropic Claude Code。
3. 行业启示
A. 半成品问题
多位用户指出 Google Antigravity 是半成品,需要谨慎使用。
B. 竞争格局
OpenAI 和 Anthropic 在 AI 编码助手领域处于领先地位,Google 需要加快追赶。
C. 国产工具差距
字节跳动 TRAE 和阿里通义千问与国际领先产品存在较大差距。
五、各方反应
1. 用户评价
A. 正面评价
- 部分用户认为通过合理使用(拆分任务、使用规范)可以获得良好体验
- Opus 模型表现相对较好
B. 负面评价
- Agent 水平不如 Copilot
- 擅自修改代码逻辑,认为比用户更懂项目
- 与 Cursor 和 TRAE 相比仍有差距
C. 中立观察
- 现在程序员分为三派:手码至上、AI 这也不行那也不行、麦克风编程
- 需要客观看待 AI 编码助手的能力和局限
2. 技术建议
A. 使用策略
- 每个新需求新建 Agent
- 使用 OpenSpec 规范复杂项目
- 将复杂功能拆分为小步骤
- 让 AI 生成计划,人工审核后执行
B. 工具选择
- 简单任务:可以使用 Antigravity
- 复杂项目:建议使用 Codex 或 Claude Code
- 需要审计:使用双模型协作方案
六、相关链接
1. 原文链接
2. 相关资源
- GitHub: kofttlcc/quant-test(双模型协作示例)
- 微信文章:AI 编码助手根本原因分析(TRAE 团队)
3. 相关产品
- OpenAI Codex
- Anthropic Claude Code
- Google Gemini
- 字节跳动 TRAE
- 阿里通义千问