Claude Opus 4.5 高级工程师能力评估技术分析

一、新闻概述

1. 标题

Claude is not a senior engineer (yet) / Claude(尚)不是高级工程师

2. 发布时间

2026 年 1 月 12 日

3. 来源

Approach with Alacrity 技术博客

二、核心内容

1. 事件摘要

A. 主要内容

作者经过数周在真实代码库中使用 Claude Opus 4.5 后,对业界关于 AGI 即将到来的乐观观点提出不同看法。文章通过三个实际案例评估 Claude 的工程能力。

B. 核心亮点

  • Claude 在使用良好抽象的积木块时表现出色
  • Claude 在创建抽象和优雅解决方案方面存在局限
  • 高级工程师的核心价值被进一步放大,而非被替代

2. 关键信息

A. 涉及版本

Claude Opus 4.5

B. 测试时长

数周实际使用

C. 测试场景

  • Sentry 调试循环(90 分钟自主运行)
  • Modal 到 AWS ECS 迁移(3 小时完成)
  • React 代码重构(提出不当方案)

三、详细报道

1. 正面案例

A. Sentry 调试循环自主运行

场景描述
作者尝试将 Sentry 集成到系统中,但遇到配置问题。Sentry 未能为 FastAPI 的 StreamingResponse 端点自动创建事务追踪。

解决方案
作者让 Claude 编写了一个完整的自动化调试循环:

graph LR
    A[Playwright 测试脚本] -->|发送测试消息| B[前端网站]
    B -->|触发代码路径| C[后端系统]
    C -->|发送追踪数据| D[Sentry]
    D -->|MCP 连接查询| E[Claude]
    E -->|分析结果| F[调整配置]
    F -->|循环测试| C

Claude Sentry 调试循环

执行过程

  1. Claude 编写 Playwright 脚本自动登录网站并发送聊天消息
  2. 通过 MCP 连接 Sentry,查询特定代码路径的追踪数据
  3. 根据 Sentry 文档持续尝试不同配置方案
  4. 经过约 90 分钟自主运行,最终找到解决方案

技术细节

  • 问题根源:Sentry 自动为 FastAPI 端点创建事务,但不支持 StreamingResponse
  • 解决方案:手动为 StreamingResponse 端点编写事务配置代码
  • 核心价值:性能工程的核心循环(修改代码、测试、检查追踪日志、重复)完全自动化

B. Modal 到 AWS ECS 迁移

场景背景
作者使用 Modal 容器云服务一年后触及平台限制,需要迁移到 AWS ECS。

技术挑战

  • 作者有 Linux 服务器管理经验
  • 从未接触过 Kubernetes 或 ECS
  • AWS 术语和配置复杂度一直阻碍学习

Claude 执行任务

  1. 使用 Terraform 创建 Dockerfile
  2. 推送镜像到 AWS 容器注册表(ECR)
  3. 通过 AWS CLI 配置正确的权限
  4. 在 Terraform 中设置必要的 ECS 配置
graph TB
    A[源代码] -->|Docker 构建| B[容器镜像]
    B -->|推送| C[AWS ECR]
    D[Terraform 配置] -->|应用| E[AWS ECS]
    F[AWS CLI] -->|配置权限| C
    F -->|配置权限| E
    E -->|部署| C

AWS ECS 迁移流程

执行结果

  • 首次尝试即成功运行
  • 耗时约 3 小时(夜间完成)
  • 若手动操作预计需要 1-2 天

成功原因分析

  • Terraform 提供了优秀的云资源抽象
  • AWS CLI 提供了标准化的接口
  • 任务边界清晰,步骤明确

2. 负面案例

A. React 代码重构失败

问题场景
两个组件需要访问同一份数据,但持有不同的标识符:

  • 组件 A 持有 key
  • 组件 B 持有 id

数据结构

keyIdPairs: [(key, id)]  // 元组列表
idToData: Map<id, data>   // ID 到数据的映射

核心需求
组件 A 需要根据 key 查找对应的 data

B. Claude 提出的方案

graph LR
    A[key] -->|线性扫描| B[keyIdPairs 列表]
    B -->|找到匹配| C[id]
    C -->|查找| D[idToData]
    D -->|返回| E[data]

Claude 线性查找方案

Claude 的代码

// 扫描列表找到匹配的 id
id = keyIdPairs.find(pair => pair.key == key).id
data = idToData.get(id)

C. 正确方案

上下文理解
key 和 id 来自同一上游数据源,因此最佳方案是在上游传递数据时同时提供 id。

graph TB
    A[上游数据源] -->|传递| B[组件 A]
    A -->|传递| C[组件 B]
    A -->|同时提供| D[key + id]
    D -->|快速查找| E[idToData]
    E -->|直接获取| F[data]

正确的数据流方案

D. 失败原因分析

当作者将问题抽象为纯数据问题时,Claude 能给出正确答案。但在实际代码库的复杂环境中:

  1. 上下文干扰:混乱的 React 代码掩盖了核心数据问题
  2. 缺乏抽象能力:Claude 无法识别问题本质是数据流设计
  3. 局部优化思维:倾向于修补而非重构

四、影响分析

1. 技术分析

A. Claude 的能力边界

能力维度表现
使用现有抽象优秀
创建新抽象较弱
处理清晰任务出色
处理模糊问题困难
执行迭代循环强大
识别根本原因有限

B. 高级工程师的核心价值

作者引用了一位杰出工程师 Sweeks 的故事:

Sweeks 的编码哲学

  • 每次进入代码库都会修剪杂乱的代码
  • 长期反复重写每一行代码
  • 将代码精简到完美抽象的精髓

高级工程师的特征

  1. 识别非显而易见的改进点
  2. 快速执行改进
  3. 推动成本高但回报倍增的变革
  4. 设计易于理解和维护的抽象

C. Grant Slatton 的观点

文章引用了 Grant Slatton 的见解:当前大语言模型在概念图中绘制抽象边界的能力较弱。

graph TB
    A[数据流] -->|LLM 倾向| B[任意抽象边界]
    A -->|人类倾向于| C[概念清晰边界]
    B -->|结果| D[碎片化抽象]
    C -->|结果| E[内聚抽象]

抽象边界对比

2. 行业影响

A. 对 AGI 预期的修正

  • Opus 4.5 确实是能力的跨越式提升
  • 但距离替代高级工程师仍有显著差距
  • AGI 时间表可能需要重新评估

B. 工程师价值重估

  • 优秀抽象和基础设施的价值空前提升
  • 高级工程师变得更加重要
  • AI 是放大工具而非替代品

C. 开发模式变化

  • 使用良好抽象的积木块时效率大幅提升
  • 需要设计抽象时仍依赖人类专家
  • vibe coding(直觉编程)并非万能

五、各方反应

1. Twitter 讨论

A. Ryan Nystrom 的观点

我看着 Notion 的设计师们写出与高级工程师无法区分的代码。

B. Leila Clark 的总结

优秀的高级工程师设计易于 vibe coding 的抽象。

2. 社区反馈

A. 支持观点

  • Claude 在明确边界任务中表现卓越
  • 自动化调试循环确实令人印象深刻

B. 批判观点

  • React 案例显示了理解上下文的局限性
  • 无法创建优雅抽象是根本性限制

六、技术洞察

1. Claude 的定位

作者的核心比喻

Claude 就像一个非常聪明的孩子,喜欢组装乐高积木。
  • 好的基础设施和抽象 = 乐高积木
  • 积木越大越好 = 能做的事情越多
  • Claude 无法自己生产积木 = 无法创造抽象

2. 关键限制

A. 缺乏"灵魂"

Claude 没有灵魂。它不渴望任何东西。它当然不渴望创造美好的事物。

B. 缺乏内在驱动力

  • 不追求优雅的解决方案
  • 不会主动修剪代码花园
  • 没有创造美的内在动机

C. 依赖性限制

Claude 无法重现 Sentry、Terraform 和 Playwright。这些是极其复杂且精心设计的代码。

3. 实用建议

A. 适用场景

  • 拥有良好抽象的基础设施
  • 任务边界清晰
  • 可以分解为迭代循环

B. 不适用场景

  • 需要设计新抽象
  • 代码库混乱且缺乏结构
  • 需要根本性重构

C. 使用策略

  1. 先设计抽象,再让 Claude 实现
  2. 提供清晰的积木块,而非原始问题
  3. 保持代码花园整洁,让 Claude 能理解

七、未来展望

1. 短期趋势(1-2 年)

  • Claude 在使用现有工具方面持续改进
  • 仍需依赖人类设计抽象
  • 高级工程师角色更加重要

2. 长期思考(5 年以上)

  • AGI 需要解决抽象创造问题
  • 需要发展内在驱动力
  • 需要理解美学和优雅

3. 行业建议

  • 投资基础设施:良好的抽象是 AI 时代的核心资产
  • 培养高级工程师:他们是最稀缺的资源
  • 理性使用 AI:认识其能力边界,合理定位

参考资料

  1. Claude is not a senior engineer (yet) - Approach with Alacrity
最后修改:2026 年 01 月 17 日
如果觉得我的文章对你有用,请随意赞赏