博客

  • OpenClaw + Codex/ClaudeCode Agent Swarm: The One-Person Dev Team

    I don’t use Codex or Claude Code directly anymore.

    I use OpenClaw as my orchestration layer. My orchestrator, Zoe, spawns the agents, writes their prompts, picks the right model for each task, monitors progress, and pings me on Telegram when PRs are ready to merge.

    Proof points from the last 4 weeks:

    94 commits in one day. My most productive day – I had 3 client calls and didn’t open my editor once. The average is around 50 commits a day.

    7 PRs in 30 minutes. Idea to production are blazing fast because coding and validations are mostly automated.

    Commits → MRR: I use this for a real B2B SaaS I’m building — bundling it with founder-led sales to deliver most feature requests same-day. Speed converts leads into paying customers.

    before Jan: CC/codex only | after Jan: Openclaw orchestrates CC/codex

    My git history looks like I just hired a dev team. In reality it’s just me going from managing claude code, to managing an openclaw agent that manages a fleet of other claude code and codex agents.

    Success rate: The system one-shots almost all small to medium tasks without any intervention.

    Cost: ~$100/month for Claude and $90/month for Codex, but you can start with $20.

    Here’s why this works better than using Codex or Claude Code directly:

    >Codex and Claude Code have very little context about your business.

    They see code. They don’t see the full picture of your business.

    OpenClaw changes the equation. It acts as the orchestration layer between you and all agents — it holds all my business context (customer data, meeting notes, past decisions, what worked, what failed) inside my Obsidian vault, and translates historical context into precise prompts for each coding agent. The agents stay focused on code. The orchestrator stays at the high strategy level.

    Here’s how the system works at a high level:

    Last week Stripe wrote about their background agent system called “Minions” — parallel coding agents backed by a centralized orchestration layer. I accidentally built the same thing but it runs locally on my Mac mini.

    Before I tell you how to set this up, you should know WHY you need an agent orchestrator.

    Why One AI Can’t Do Both

    Context windows are zero-sum. You have to choose what goes in.

    Fill it with code → no room for business context. Fill it with customer history → no room for the codebase. This is why the two-tier system works: each AI is loaded with exactly what it needs.

    OpenClaw and Codex have drastically different context:

    Specialization through context, not through different models.

    The Full 8-step Workflow

    Let me walk through a real example from last week.

    Step 1: Customer Request → Scoping with Zoe

    I had a call with an agency customer. They wanted to reuse configurations they’ve already set up across the team.

    After the call, I talked through the request with Zoe. Because all my meeting notes sync automatically to my obsidian vault, zero explanation was needed on my end. We scoped out the feature together — and landed on a template system that lets them save and edit their existing configurations.

    Then Zoe does three things:

    1. Tops up credits to unblock customer immediately — she has admin API access
    2. Pulls customer config from prod database — she has read-only prod DB access (my codex agents will never have this) to retrieve their existing setup, which gets included in the prompt
    3. Spawns a Codex agent — with a detailed prompt containing all the context

    Step 2: Spawn the Agent

    Each agent gets its own worktree (isolated branch) and tmux session:

    bash

    # Create worktree + spawn agent
    git worktree add ../feat-custom-templates -b feat/custom-templates origin/main
    cd ../feat-custom-templates && pnpm install
    
    tmux new-session -d -s "codex-templates" \
      -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \
      "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high"

    The agent runs in a tmux session with full terminal logging via a script.

    Here’s how we launch agents:

    bash

    # Codex
    codex --model gpt-5.3-codex \
      -c "model_reasoning_effort=high" \
      --dangerously-bypass-approvals-and-sandbox \
      "Your prompt here"
    
    # Claude Code  
    claude --model claude-opus-4.5 \
      --dangerously-skip-permissions \
      -p "Your prompt here"

    I used to use codex exec or claude -p, but switch to tmux recently:

    tmux is far better because mid-task redirection is powerful. Agent going the wrong direction? Don’t kill it:

    bash

    # Wrong approach:
    tmux send-keys -t codex-templates "Stop. Focus on the API layer first, not the UI." Enter
    
    # Needs more context:
    tmux send-keys -t codex-templates "The schema is in src/types/template.ts. Use that." Enter

    The task gets tracked in .clawdbot/active-tasks.json:

    json

    {
      "id": "feat-custom-templates",
      "tmuxSession": "codex-templates",
      "agent": "codex",
      "description": "Custom email templates for agency customer",
      "repo": "medialyst",
      "worktree": "feat-custom-templates",
      "branch": "feat/custom-templates",
      "startedAt": 1740268800000,
      "status": "running",
      "notifyOnComplete": true
    }
    

    When complete, it updates with PR number and checks. (More on this in step 5)

    json

    {
      "status": "done",
      "pr": 341,
      "completedAt": 1740275400000,
      "checks": {
        "prCreated": true,
        "ciPassed": true,
        "claudeReviewPassed": true,
        "geminiReviewPassed": true
      },
      "note": "All checks passed. Ready to merge."
    }

    Step 3: Monitoring in a loop

    A cron job runs every 10 minutes to babysit all agents. This pretty much functions as an improved Ralph Loop, more on it later.

    But it doesn’t poll the agents directly — that would be expensive. Instead, it runs a script that reads the JSON registry and checks:

    bash

    .clawdbot/check-agents.sh

    The script is 100% deterministic and extremely token-efficient:

    – Checks if tmux sessions are alive – Checks for open PRs on tracked branches – Checks CI status via gh cli – Auto-respawns failed agents (max 3 attempts) if CI fails or critical review feedback – Only alerts if something needs human attention

    I’m not watching terminals. The system tells me when to look.

    Step 4: Agent Creates PR

    The agent commits, pushes, and opens a PR via `gh pr create –fill`. At this point I do NOT get notified — a PR alone isn’t done.

    Definition of done (very important your agent knows this):

    – PR created – Branch synced to main (no merge conflicts) – CI passing (lint, types, unit tests, E2E) – Codex review passed – Claude Code review passed – Gemini review passed – Screenshots included (if UI changes)

    Step 5: Automated Code Review

    Every PR gets reviewed by three AI models. They catch different things:

    • Codex Reviewer — Exceptional at edge cases. Does the most thorough review. Catches logic errors, missing error handling, race conditions. False positive rate is very low.
    • Gemini Code Assist Reviewer — Free and incredibly useful. Catches security issues, scalability problems other agents miss. And suggests specific fixes. No brainer to install.
    • Claude Code Reviewer — Mostly useless – tends to be overly cautious. Lots of “consider adding…” suggestions that are usually overengineering. I skip everything unless it’s marked critical. It rarely finds critical issues on its own but validates what the other reviewers flag.

    All three post comments directly on the PR.

    Step 6: Automated Testing

    Our CI pipeline runs a heavy amount of automated tests:

    – Lint and TypeScript checks – Unit tests – E2E tests – Playwright tests against a preview environment (identical to prod)

    I added a new rule last week: if the PR changes any UI, it must include a screenshot in the PR description. Otherwise CI fails. This dramatically shortens review time — I can see exactly what changed without clicking through the preview.

    Step 7: Human Review

    Now I get the Telegram notification: “PR #341 ready for review.”

    By this point:

    – CI passed – Three AI reviewers approved the code – Screenshots show the UI changes – All edge cases are documented in review comments

    My review takes 5-10 minutes. Many PRs I merge without reading the code — the screenshot shows me everything I need.

    Step 8: Merge

    PR merges. A daily cron job cleans up orphaned worktrees and task registry json.

    The Ralph Loop V2

    This is essentially the Ralph Loop, but better.

    The Ralph Loop pulls context from memory, generate output, evaluate results, save learnings. But most implementations run the same prompt each cycle. The distilled learnings improve future retrievals, but the prompt itself stays static.

    Our system is different. When an agent fails, Zoe doesn’t just respawn it with the same prompt. She looks at the failure with full business context and figures out how to unblock it:

    • Agent ran out of context? “Focus only on these three files.”
    • Agent went the wrong direction? “Stop. The customer wanted X, not Y. Here’s what they said in the meeting.”
    • Agent need clarification? “Here’s customer’s email and what their company does.”

    Zoe babysits agents through to completion. She has context the agents don’t — customer history, meeting notes, what we tried before, why it failed. She uses that context to write better prompts on each retry.

    But she also doesn’t wait for me to assign tasks. She finds work proactively:

    • Morning: Scans Sentry → finds 4 new errors → spawns 4 agents to investigate and fix
    • After meetings: Scans meeting notes → flags 3 feature requests customers mentioned → spawns 3 Codex agents
    • Evening: Scans git log → spawns Claude Code to update changelog and customer docs

    I take a walk after a customer call. Come back to Telegram: “7 PRs ready for review. 3 features, 4 bug fixes.”

    When agents succeed, the pattern gets logged. “This prompt structure works for billing features.” “Codex needs the type definitions upfront.” “Always include the test file paths.”

    The reward signals are: CI passing, all three code reviews passing, human merge. Any failure triggers the loop. Over time, Zoe writes better prompts because she remembers what shipped.

    Choosing the Right Agent

    Not all coding agents are equal. Quick reference:

    Codex is my workhorse. Backend logic, complex bugs, multi-file refactors, anything that requires reasoning across the codebase. It’s slower but thorough. I use it for 90% of tasks.

    Claude Code is faster and better at frontend work. It also has fewer permission issues, so it’s great for git operations. (I used to use this more to drive day to day, but Codex 5.3 is simply better and faster now)

    Gemini has a different superpower — design sensibility. For beautiful UIs, I’ll have Gemini generate an HTML/CSS spec first, then hand that to Claude Code to implement in our component system. Gemini designs, Claude builds.

    Zoe picks the right agent for each task and routes outputs between them. A billing system bug goes to Codex. A button style fix goes to Claude Code. A new dashboard design starts with Gemini.

    How to Set This Up

    Copy this entire article into OpenClaw and tell it: “Implement this agent swarm setup for my codebase.”

    It’ll read the architecture, create the scripts, set up the directory structure, and configure cron monitoring. Done in 10 minutes.

    No course to sell you.

    The Bottleneck Nobody Expects

    Here’s the ceiling I’m hitting right now: RAM.

    Each agent needs its own worktree. Each worktree needs its own `node_modules`. Each agent runs builds, type checks, tests. Five agents running simultaneously means five parallel TypeScript compilers, five test runners, five sets of dependencies loaded into memory.

    My Mac Mini with 16GB tops out at 4-5 agents before it starts swapping — and I need to be lucky they don’t try to build at the same time.

    So I bought a Mac Studio M4 max with 128GB RAM ($3,500) to power this system. It arrives end of March and I’ll share if it’s worth it.

    Up Next: The One-Person Million-Dollar Company

    We’re going to see a ton of one-person million-dollar companies starting in 2026. The leverage is massive for those who understand how to build recursively self-improving agents.

    This is what it looks like: an AI orchestrator as an extension of yourself (like what Zoe is to me), delegating work to specialized agents that handle different business functions. Engineering. Customer support. Ops. Marketing. Each agent focused on what it’s good at. You maintain laser focus and full control.

    The next generation of entrepreneurs won’t hire a team of 10 to do what one person with the right system can do. They’ll build like this — staying small, moving fast, shipping daily.

    There’s so much AI-generated slop right now. So much hype around agents and “mission controls” without building anything actually useful. Fancy demos with no real-world benefits.

    I’m trying to do the opposite: less hype, more documentation of building an actual business. Real customers, real revenue, real commits that ship to production, and real loss too.

    What am I building? Agentic PR — a one-person company taking on the enterprise PR incumbents. Agents that help startups get press coverage without a $10k/month retainer.

    If you want to see how far I take this, follow along.

  • 《Citrini Research》完整版|2028年全球智能危机

    序言

    一则来自未来的金融史思想演练。

    如果我们对 AI 的看多情绪继续被证明是对的,可如果这件事反而意味着看空呢?

    下面呈现的是一种情景,不是预测。这不是“熊市爽文”,也不是 AI 末日论者的同人幻想。本文唯一的意图,是对一种相对欠缺讨论的情景进行建模。这个问题由我们的朋友阿拉普·沙阿(Alap Shah)提出,我们一起头脑风暴出了答案。我们写了这一部分,他还写了另外两部分,你可以在这里找到。

    希望读完之后,你能对 AI 让经济越来越怪异之际可能出现的左尾风险,更有准备。

    以下内容是 CitriniResearch 在 2028 年 6 月发布的宏观备忘录,记录“全球智能危机”的演进过程及其后果。

    宏观备忘录

    智能充裕的后果

    今早公布的失业率为 10.2%,比预期高出 0.3 个百分点。市场因这项数据下跌 2%,使标普500指数从 2026 年 10 月的高点以来累计回撤达到 38%。

    交易员已经麻木。六个月前,出现这样的读数,足以触发熔断机制。

    两年。只用了两年,我们就从所谓“可控”“只影响特定行业”,走到了一个不再像我们任何人成长时期所熟悉的经济。本季度的宏观备忘录,试图把这条链条复原,也就是对危机前经济做一次事后剖析。

    当时的狂热几乎触手可及。到 2026 年 10 月,标普500指数一度逼近 8000 点,纳斯达克指数突破 30000 点。由于“人类劳动力被淘汰”而起的第一波裁员在 2026 年初就已展开,而且它们确实带来了裁员在账面上“应当”带来的效果。利润率走阔,盈利超预期,股价随之上行。创纪录的企业利润又被迅速回流,继续投入到 AI 算力之中。

    宏观层面的头条指标看起来依然漂亮。名义GDP多次录得年化中高个位数增长,生产率也在飙升。每小时实际产出以自20世纪50年代以来未见的速度上行,推动这一切的,是那些不睡觉、不请病假、也不需要医疗保险的AI代理(AI agents)。

    算力的拥有者在劳动力成本消失之际财富暴涨。与此同时,实际工资增速却明显塌陷。尽管当局反复宣称“生产率创纪录”,白领仍在被机器替代,只能被迫转向更低薪的岗位。

    当消费端开始出现裂缝时,经济评论员把一个说法炒热了,叫“幽灵GDP”:产出在国民核算里能看见,却很少进入真实经济的循环。

    AI在各个方面均超出了预期,而市场即为AI。唯一的问题……经济却并非如此。

    从一开始就该看清:北达科他州的一座GPU集群所生成的产出,竟能顶上此前归功于曼哈顿中城一万名白领的产出。这与其说是经济灵药,不如说更像一种经济层面的“疫情”。货币流通速度几乎停摆。以人为中心的消费经济当时占GDP的70%,却迅速枯萎。我们本可以更早想明白这一点,只要问一句:机器会在可选消费品上花多少钱?提示一下,答案是:零。

    AI 能力提升,企业所需员工减少,白领裁员增加,被替代者支出收缩,利润率承压又迫使企业加大对 AI 的投入,AI 能力再度提升……

    这是一条没有天然刹车的恶性反馈回路,也是一场“人类智能被替代”的螺旋。白领的收入能力因此遭遇结构性削弱,他们的支出也理性地随之收缩。而他们的收入,正是 13 万亿美元住房抵押贷款市场的基石,迫使抵押贷款承销人员重新评估:优质抵押贷款是否仍然属于 “安全无虞”。

    连续 17 年没有真正的违约周期,让私募市场被私募股权支持的软件交易撑得臃肿,这些交易都假设年度经常性收入(ARR)会继续保持经常性,能够年复一年滚动兑现。2027 年中期,由 AI 冲击引发的第一波违约,开始动摇这一假设。 

    如果冲击只停留在软件行业,这本来还算可控,但事实并非如此。到 2027 年末,它已经威胁到所有以中介环节为前提的商业模式。大批公司把人类交易中的“摩擦”变成收入来源,而这类公司开始瓦解。

    结果发现,整个系统不过是一条串联起来的长链,由一系列彼此高度相关的押注构成,押注对象是白领生产率会持续增长。2027 年 11 月的崩盘,只是把那些早已在运转的负面反馈回路进一步加速。

    我们已经等了将近一年,一直在等那种“坏消息就是好消息”的时刻出现。政府开始酝酿一些提案,但公众对政府能否组织起任何形式的救援,信心正在消退。政策反应向来滞后于经济现实,而如今,缺乏一套全面方案,反倒可能加速通缩螺旋。  

    它是如何开始的

    2025 年末,代理式(agentic)编程工具的能力出现了阶跃式跃升。  

    一名合格的开发者若配合 Claude Code(Anthropic)或 Codex(OpenAI),如今可以在数周内复刻一款中端市场 SaaS(软件即服务) 产品的核心功能。未必完美,也未必把每个边界情形都处理到位,但已经足够让一位正在审阅 50 万美元年度续约合同的首席信息官开始追问:“如果我们自己做一个呢?”

    企业财年大多与自然年一致,因此 2026 年的企业支出预算在 2025 年第四季度就已定下,那时“代理式 AI(agentic AI)”还只是个热词。年中复盘,是采购团队第一次在真正看清这些系统究竟能做什么的前提下作出决策。有些公司眼看自家内部团队在几周内就搭起原型,复刻了价值六位数美元的 SaaS 合同所对应的功能。

    那年夏天,我们与一家《财富》500 强的采购经理聊过。他向我们讲了一次预算谈判。销售代表原本以为可以照搬去年的套路:每年 5% 的惯例涨价,再来一套标准的“你们团队离不开我们”的说辞。采购经理告诉他,自己正与 OpenAI 沟通,考虑让他们的前线部署工程师用 AI 工具把这家供应商整体替换掉。最终续约以 30% 折扣成交。他说,这已经算好结果了。SaaS 的“长尾”,比如 Monday.com、Zapier 和 Asana,处境要惨得多。

    投资者对此早有准备,甚至可以说带着某种期待:SaaS 的长尾会被重击。它们也许占到典型企业技术栈支出的三分之一,但显然最为暴露。可按当时的普遍看法,“记录系统(System of Record, SOR)”应当不会轻易被颠覆。 

    直到 ServiceNow 在 2026 年第三季度的财报披露,反身性(reflexivity)的运作机制才更清晰。 

    反身性(reflexivity)指金融市场和经济中的一种反馈机制:市场参与者的认知与预期会影响现实结果,而现实结果又反过来塑造参与者的认知,从而形成循环,进而放大、扭曲繁荣或价格行为,形成自我强化的循环,并可能推动繁荣或泡沫的扩张与破裂。(黄色引用框内灰色文字,系译者就相关内容所作的解读。)

    “SERVICENOW 净新增年度合同价值增速从 23% 放缓至 14%;宣布裁员 15%,并推出‘结构性效率计划(Structural Efficiency Program)’;股价下跌 18%|彭博社,2026年10月” 


    SaaS 并没有“死掉”。自建系统在运行与维护上仍然需要做成本收益权衡。但自建成了一个选项,而这一事实本身就会进入定价谈判。更重要的是,竞争格局已经改变。AI 让开发与发布新功能更容易,差异化随之坍塌。既有厂商在价格上一路向下,既要彼此肉搏,也要与一批突然冒出的新兴挑战者短兵相接。这些挑战者因代理式编程能力的跃升而胆气大增,又没有任何遗留成本结构需要守护,于是以更激进的方式抢夺份额。

    而且,直到这次财报披露,人们才真正看清这些系统之间的相互联动。ServiceNow按“席位”出售订阅许可,也就是按授权用户数计费。《财富》500强客户一旦把员工规模削减 15%,往往就会相应取消 15% 的许可证。于是,同一套由 AI 驱动、在客户侧推高利润率的人员缩减,会按计费规则以一种近乎算术的方式,反过来削弱并侵蚀 ServiceNow 自己的营收基础。

    这家出售“工作流程自动化”的公司,正在被更好的工作流程自动化所颠覆;而它的应对,是裁员,把省下来的钱投向那项正在颠覆它的技术。  

    它还能怎么办?难道原地不动,只求死得慢一点?最受 AI 威胁的公司,反而成了 AI 最激进的采用者。

    事后看,这似乎显而易见,但当时并非如此,至少对我来说不是。传统的颠覆模型认为,在位企业会抵制新技术,随后被灵活的新进入者夺走份额,最后慢慢死去。柯达、百视达、黑莓都是如此。2026 年发生的事不同:在位企业没有抵制,因为他们承受不起抵制的代价。

    在位企业是指在既有行业中已进入并占据主导位置的企业。


    在股价下跌 40% 到 60%、董事会逼问答案的压力下,那些受 AI 威胁的公司只能做他们唯一能做的事:裁员,把节省下来的成本重新部署到 AI 工具上,再用这些工具以更低成本维持产出。

    每家公司单独来看,这种反应都理性;合在一起,结果却是灾难性的。每省下一美元用工成本,就会流入让下一轮裁员成为可能的 AI 能力之中。

    软件只是开场戏。投资者在争论 SaaS 估值倍数是否已经见底时忽略了:这种反身性回路早已逃出软件行业。支撑 ServiceNow 裁员的同一套逻辑,同样适用于任何以白领成本结构为主的公司。

    当摩擦趋近于零

    到 2027 年初,大语言模型(LLM)的使用已成默认。人们在使用 AI 代理(AI agent),却甚至不知道“AI 代理”是什么,就像很多从未弄清“云计算”是什么的人也一直在用流媒体服务一样。他们把它当作自动补全或拼写检查那类东西,也就是手机如今自带的功能。  

    通义千问(Qwen)的开源具代理能力的购物智能体,成了 AI 接管消费决策的催化剂。短短几周内,几乎所有主流 AI 助手都集成了某种“智能代理式电商(agentic commerce)”功能。蒸馏模型使这些代理可以运行在手机和笔记本上,而不再只依赖云端实例,从而显著降低推理的边际成本。  

    真正更该让投资者不安的是:这些代理不会等你开口请求。它们会按用户偏好在后台运行。商业不再是一连串离散的人类决策,而变成一个持续优化的过程,代表每一个联网消费者全天候运转。到 2027 年 3 月,美国的中位数个体每天消耗 400000 个 token,自 2026 年末以来增加了 10 倍。  

    链条的下一环,已经开始断裂。

    中介。


    过去五十年间,美国经济在人类的局限性之上构筑了一个庞大的租金攫取层:事情需要时间,耐心会耗尽,品牌熟悉度代替了审慎判断,而大多数人愿意接受一个糟糕的价格,只为省去多点几次鼠标的麻烦。数以万亿美元计的企业价值,建立在这些约束条件持续存在的假设之上。

    一切开端于简单之处:agent消除了摩擦。


    那些在数月未使用后仍被动续费的订阅会员;那些试用期结束后悄然翻倍的入门价格。每一个原本被包装成“留客手段”的套路,都被agent变成了可谈判的筹码。整个订阅经济赖以建立的核心指标——平均客户终身价值,明显下降。


    消费者智能体开始改变几乎所有消费者交易的运作方式。


    人类没有时间在买一盒蛋白棒之前,先在五个竞争平台上比完价。机器有时间。


    旅游预订平台是最早的牺牲品,因为它们的逻辑最为简单。到2026年第四季度,我们的智能体已经能以更快的速度、更低的成本拼出一份完整的行程(含机票、酒店、地面交通、积分优化、预算控制、退款申请),超越任何平台所能提供的服务。


    保险续保,其整个续约模式都依赖于保单持有人的惰性,也被颠覆。每年自动为您比选保险方案的智能体,瓦解了保险公司从被动续约中赚取的15%至20%的保费溢价。


    财务顾问。报税服务。常规法律事务。任何以“我来帮您应对那些让您感到繁琐的复杂事务”为价值主张的服务类别,统统遭到颠覆——因为智能体对任何事情都不觉得繁琐。agent把破坏的两端都踩了油门。它们一方面让新竞争者更容易出现,另一方面又会转头去使用这些新选择。DoorDash 的护城河本质上就是一句话:你饿了,你懒得折腾,这个 App 就在你主屏幕上。agent没有主屏幕。它会同时比对 DoorDash、Uber Eats、餐厅自营网站,以及二十个用氛围编程迅速拼出来的新替代品,从而每次都选最低费用、最快送达。 
    对机器而言,对某个 App 的惯性偏好与忠诚这种东西根本不存在,而这恰恰是整个商业模式的基础。这件事带着一种古怪的诗意,因为在整段故事里,它几乎是agent对那些即将被替代的白领做过的唯一一件好事:当他们最终去当配送司机时,至少他们一半的收入不再流向 Uber 与 DoorDash。当然,随着自动驾驶车辆迅速扩散,这份“技术的好意”也并没有持续太久。

    当agent掌控了交易,它们就开始寻找“更大的回形针”。

    “更大的回形针”本身是一个借喻。它借用 AI 安全讨论里著名的“回形针最大化器(paperclip maximizer)”意象:一个系统一旦被设定为追求某个目标,就可能把手段不断升级,去占用更多资源,追求更大规模的目标实现。回形针制造机,回形针制造机是瑞典哲学家尼克·博斯特罗姆于2003年提出的一个思想实验,他透过这一假想情景展示了一个看似无害的最终目标如何演变为人类的生存危机,并借此强调了机器伦理研究的重要性。博斯特罗姆的描述如下:

    假设我们有一个人工智能系统,它的最终目标被设定为生产尽可能多的回形针。那么这个人工智能系统可能会意识到,或许人类的消失有助于更有效率的生产回形针,因为毕竟人类有权力对它执行关机,而假如它被关闭,产出的回形针数量就被限制了。此外,构成人类身体的原子也可用作回形针的生产材料。因此对它而言,未来的世界应当是充满回形针,而不会留有人类的存在空间。

    虽然博斯特罗姆并不认为上述场景会在未来真实出现,但他认为超级人工智能对人类生存的威胁是无可否认的,并期望人们可由这个故事意识到这一点。回形针制造机思想实验展示了缺乏人类价值的超能力系统可能引发的严重问题。(黄色引用框内灰色文字,系译者就相关内容所作的解读。)

    比价与聚合能做的事终究有限。agent反复为用户省钱的最大方式,尤其是在agent开始彼此交易之后,就是消灭各种费用。在机器对机器的商业里,2% 到 3% 的银行卡交换费立刻成了显眼靶子。 

    于是,agent开始寻找比银行卡更快、更便宜的方案。多数最终转向通过 Solana或以太坊 Layer 2上的稳定币完成支付与结算,因为结算几乎即时,单笔交易成本低到以几分之一美分计。

    “万事达卡(Mastercard)2027年第一季度:净营收同比 +6%;购买额(purchase volume)增速同比从上季度 +5.9% 放缓至 +3.4%;管理层提到‘agent主导的价格优化’以及‘非必需消费品类别承压’ | 彭博社(Bloomberg),2027年4月29日”

    万事达卡的2027年第一季度财报,成了不可回头的节点。智能代理式电商从“产品层面的叙事”变成了“管道层面的叙事(也就是基础设施层面的叙事)”。万事达卡股价次日下跌9%。Visa也下跌,但分析师指出其在稳定币基础设施上的定位更强后,跌幅有所收窄。

    智能代理式电商通过 agent 绕开交换费,对以银行卡业务为中心的银行与单一业务发卡机构构成的风险更大,因为它们拿走了那2%到3%费用的大头,并围绕由商户补贴所支撑的奖励计划(rewards programs),建立起完整的业务板块。

    美国运通受冲击最重:白领缩编削弱了它的客户基础,agent 绕开交换费又削弱了它的营收模式,双重逆风叠加。Synchrony(SYF US)、第一资本(Capital One, COF US)与发现银行(Discover, DFS US)在接下来几周里也都下跌了10%以上。

    它们的护城河由摩擦构成,而摩擦正在趋近于零。

    从行业风险到系统性风险

    在2026年全年,市场把AI的负面影响当成“行业故事”。软件与咨询被重创,支付以及其他“收费站式”业务开始摇摇欲坠,但更广义的经济看起来还好。劳动力市场虽在走弱,却没有自由落体式下坠。共识认为,创造性破坏是任何技术创新周期的一部分,局部会痛,但AI带来的总体净收益会超过负面影响。

    我们在2027年1月的宏观备忘录里认为,这个心智模型是错的。美国经济是白领服务经济。白领占就业的50%,驱动大约75%的可选消费支出。AI正在啃噬的企业与岗位,并不是美国经济的边缘,它们就是美国经济本身。

    “技术创新会摧毁工作,但随后会创造更多工作。”这是当时最流行、也最有说服力的反驳。它之所以流行且有说服力,是因为两百年来它一直是对的。即便我们一时想象不出未来的工作会是什么,那些工作终究也会出现。

    ATM让银行网点的运营更便宜,于是银行开了更多网点,柜员就业在之后二十年里反而上升。互联网颠覆了旅行社、黄页与实体零售,却也在其位置上催生出全新的产业与岗位。

    然而,每一个新岗位都需要一个人类来执行

    如今的AI是一种通用智能,而且它会在那些人类原本打算转去从事的任务上继续变强。被替代的程序员不可能简单转去做“AI管理”,因为AI已经能胜任那件事。

    今天,AI代理(AI agents)已经能够承担原本需要数周完成的研发任务。指数级增长碾压了我们对“可能性”的想象,尽管沃顿商学院教授们年年都在试图把数据拟合成一条新的S形曲线。 

    它们几乎写出了全部代码。其中表现最强的那批,在几乎所有事情上都显著聪明过几乎所有人类,而且它们还在持续变得更便宜。

    AI确实创造了新工作:提示词工程师、AI安全研究员、基础设施技术员。人类仍在循环之中,在最高层级做协调,或在“品味”层面做指挥。但AI每创造一个新角色,就会让几十个旧角色过时。而且这些新角色的薪酬,只是旧角色的一小部分。

    “美国JOLTS:职位空缺降至550万以下;失业者与职位空缺之比升至约1.7,为2020年8月以来最高 | 彭博社(Bloomberg),2026年10月20日”

    招聘全年都很疲弱,但2026年10月的JOLTS读数提供了更确定的数据:职位空缺降到550万以下,同比下滑15%。 

    “Indeed:软件、金融、咨询岗位发布大幅下滑,‘生产率提升举措’蔓延 | Indeed Hiring Lab,2026年11至12月”

    白领职位空缺正在急剧萎缩,而蓝领职位空缺相对稳定,建筑、医疗与技工等领域依然坚挺。人员流动主要发生在那些写备忘录、审批预算、让经济的中间层保持运转的岗位上,说来也怪,我们居然还在做这门生意。只是,两类人群的实际工资增速在当年大部分时间里都为负,而且还在继续走低。

    股市对 JOLTS 的在意程度,仍不及它对另一条消息的在意,也就是 GE Vernova 的涡轮机产能已被预订到 2040 年。股市在负面宏观消息与 AI 基建利好之间拉扯,慢吞吞地横盘游走。

    不过,债券市场已经开始把“消费遭受冲击”计入价格。随后四个月,10 年期收益率从 4.3% 一路下行至 3.2%。尽管如此,官方公布的总体失业率并未明显飙升,一些人仍然没有看懂其中的结构性细微变化。

    在典型的衰退中,成因最终往往会自我纠偏。比如,过度建设会让开工放缓,开工放缓又更容易带来利率下行,而利率下行最终会促成新一轮建设。又比如,库存积压过头会引发去库存,而去库存走到尽头又会转向补库存。周期机制本身就埋着复苏的种子。

    但这一轮下行的成因并不属于周期性。

    AI 变得更强、更便宜。企业裁员,把省下来的成本投入更多 AI 能力,而更多 AI 能力又让下一轮裁员变得更容易。被替代者支出收缩。面向消费者的公司卖得更少、经营转弱,为了守住利润率又进一步加码 AI。AI 继续变强、继续变便宜。这是一个会自我强化、却不会自动停下来的循环。

    直觉上,人们以为总需求走弱会拖慢 AI 的扩张。但事实并非如此,因为这轮投入并不是超大规模云服务商那种资本支出(CapEx)式扩建,而是一种运营支出(OpEx)替代。比如,一家原本每年在雇佣员工上花 1 亿美元、在 AI 上花 500 万美元的公司,如今可能变成在雇佣员工上花 7000 万美元、在 AI 上花 2000 万美元。AI 投入是倍数增长,但总运营成本反而下降。于是出现了一个关键结果:几乎每家公司的 AI 预算都在上升,而其整体支出却在收缩。

    讽刺之处在于:当被 AI 颠覆的经济开始恶化时,AI 基础设施产业链却仍在持续走强。英伟达依旧交出创纪录营收。台积电(TSMC)仍以 95% 以上的产能利用率运行。超大规模云服务商仍在每个季度投入 1500 亿到 2000 亿美元,用于数据中心的资本性支出(CapEx)。而那些对这一趋势呈凸性受益的经济体,比如台湾与韩国,表现显著跑赢其他地区。

    印度则相反。印度 IT 服务业每年出口超过 2000 亿美元,是印度经常账户顺差的最大单一来源,也是其长期商品贸易逆差的主要对冲项。整个模式建立在一个价值主张之上:印度开发者的成本只是美国同行的一小部分。但 AI 编程 agent 的边际成本已经坍塌到几乎等同于电力成本。塔塔咨询服务公司(TCS)、印孚瑟斯技术有限公司(Infosys)和维布络科技公司(Wipro)的合同取消在 2027 年加速。随着支撑印度外部账户的服务顺差蒸发,卢比在四个月内对美元贬值 18%。到 2028 年第一季度,国际货币基金组织已开始与新德里进行“初步讨论”。

    引发颠覆的那台发动机每个季度都在变强,这意味着颠覆每个季度都在加速。劳动力市场没有天然底部。

    在美国,我们不再追问 AI 基础设施的泡沫会如何破裂。我们在追问的是:当消费者正在被机器替代,一个以消费信贷为核心的经济,会发生什么。

    智能替代螺旋

    2027 年,宏观故事不再含蓄。此前十二个月里那些彼此零散、却明显偏负面的进展,其传导机制已经清晰可见。你甚至不必去翻美国劳工统计局(Bureau of Labor Statistics, BLS)的数据,只要参加一场和朋友的晚餐聚会就能感受到。

    被替代的白领并没有闲着。他们被迫“降档”。许多人转去更低薪的服务业与零工经济岗位,这使这些领域的劳动力供给上升,也把那里的工资一并压低。

    我们有位朋友,2025 年在赛富时(Salesforce)任资深产品经理。头衔、医疗保险、401(k)计划,年薪 18 万美元。她在第三轮裁员中失业。寻找了六个月后,她开始给优步开车,年收入降至 4.5 万美元。重点不在这个个案,而在二阶效应的算账。把这种变化乘以几十万名劳动者,铺开到每一个主要大都市:高资历劳动力涌入服务业与零工经济,进一步压低了那些原本就在这些岗位上、且已举步维艰的劳动者的工资。行业内的冲击就此外溢并蔓延,演化为全经济范围的工资压缩。
    剩余的以人为本的就业岗位存量,正面临着又一轮下行调整,而这一轮调整,恰恰发生在我们写下本文的此时此刻。自动驾驶配送系统与自动驾驶汽车,正在逐步渗透并颠覆零工经济,而正是这个零工经济,当初吸纳了第一波被AI浪潮所冲走的失业工人。

    到 2027 年 2 月,这一点已经很清楚:许多仍在岗的专业人士在花钱时,已经按“自己可能就是下一个”来盘算。他们为了不被裁,只能把工作强度几乎翻倍,大多还得靠 AI 工具撑住产出;升职或加薪的指望也基本消失。于是,储蓄率开始上行,消费开始走软。

    最危险之处在于滞后性。高收入者凭借高于平均水平的储蓄,能在两到三个季度里把生活维持在“看起来还正常”的状态。硬数据直到真实经济里这场变化早已发生、甚至已不算新鲜时,才姗姗来迟地确认问题。随后,一次关键数据读数打碎了这种表象。

    “美国首次申领失业救济人数飙升至 487,000,为 2020 年 4 月以来最高;美国劳工部(Department of Labor),2027 年第三季度”

    首次申领失业救济人数跃升至 487,000,创 2020 年 4 月以来新高。ADP 与 Equifax 证实,新增申请中压倒性多数来自白领专业人士。

    标普 500 指数在随后一周下跌 6%。宏观坏消息开始在拉锯中占上风。

    在典型衰退中,失业往往分布更广。蓝领与白领大致按各自就业占比共同承受冲击。消费受挫也更分散,并且会更快体现在数据里,因为低收入群体的边际消费倾向更高。

    但这一轮周期中,失业主要集中在收入最高的那几档人群。他们在总就业中的占比相对不大,却贡献了极不成比例的消费支出。美国收入最高的 10% 人群贡献了超过 50% 的全部消费支出,最高的 20% 贡献约 65%。买房、买车、度假、餐馆消费、私立学校学费、房屋翻修,主要都是这部分人群在支撑。他们构成了整个非必需消费经济的需求底座。

    当这些人失业,或为了转入现有岗位而被迫接受 50% 的降薪时,消费受到的打击会远远大于失业人数本身所暗示的程度。白领就业只要下降 2%,对应的非必需消费支出就可能受到约 3% 到 4% 的冲击。与蓝领失业往往立刻压缩开支不同,白领失业的影响往往先滞后、后更深:他们通常有储蓄缓冲,能在真正改变消费行为之前,先维持几个月的支出。

    到 2027 年第二季度,经济已经陷入衰退。美国国家经济研究局通常要在几个月后才会正式追溯并标注衰退起点,但数据已经毫无悬念:实际 GDP 连续两个季度负增长。只是,这还算不上“金融危机”,至少暂时还不是。

    相关押注的串联链条

    私募信贷从 2015 年不足 1 万亿美元,膨胀到 2026 年超过 2.5 万亿美元。其中相当一部分资金投向软件与科技交易,很多是对 SaaS 公司的杠杆收购,其估值建立在同一个前提之上:收入可以长期以十几个百分点的年增速持续增长。

    这个前提在第一次代理式(agentic)编程演示与 2026 年第一季度的软件崩盘之间就已破灭,但账面上的估值标记似乎还没承认它已破灭。

    当许多上市 SaaS 公司的估值已跌到扣除利息支付、应付税款、折旧摊销前的利润(EBITDA)的 5 到 8 倍时,私募股权(PE)控股的软件公司仍在资产负债表上按收购时的估值入账,依据的还是早已不再成立的“收入倍数”。管理人只是把估值标记一点点往下挪,从按面值每 1 美元计的 1.00,下调到 0.92、0.85,而公开市场可比公司的定价早已指向 0.50。

    “穆迪投资者服务公司(Moody’s Investors Service)下调 14 家发行人的 180 亿美元 PE 支持软件债务评级,理由是‘AI 驱动的竞争性颠覆带来结构性收入逆风’;为 2015 年能源行业以来最大单一行业行动 | 穆迪,2027 年 4 月”

    所有人都记得评级下调之后发生了什么。行业老兵早就看过 2015 年能源行业被降级后那套剧本。

    以软件为底层资产支撑的贷款在 2027 年第三季度开始违约。信息服务与咨询领域的 PE 组合公司随后跟上。几笔涉及知名 SaaS 公司的数十亿美元杠杆收购融资相继进入重组程序。

    Zendesk 成了那条链条上最直观的铁证。

    “Zendesk 触发债务契约违约,因 AI 驱动的客服自动化侵蚀年度经常性收入(ARR);50 亿美元直接贷款融资安排被标至 0.58;创史上最大私募信贷软件违约 | 《金融时报》(Financial Times),2027 年 9 月”

    2022 年,海尔曼与弗里德曼(Hellman & Friedman)和 Permira 以 102 亿美元将 Zendesk 私有化。其债务包为 50 亿美元直接贷款,在当时是史上最大的 ARR 支持型融资安排,由黑石牵头,阿波罗、Blue Owl 与 HPS 同为贷款方。该贷款结构明确建立在一个前提之上:Zendesk 的年度经常性收入(ARR)会继续保持“经常性”。在约 25 倍 EBITDA 的估值水平上,只有这个前提成立,杠杆才说得通。

    到 2027 年年中,这个前提不成立了。

    AI agents 在将近一年的时间里已能自主处理客户服务。Zendesk 所定义的那类业务范畴,也就是开工单、分流与分派,以及围绕人工客服互动的管理流程,早已被新系统取代,这些系统甚至无需生成工单就能把问题直接解决。于是,这笔贷款在承销时所依据的年度经常性收入(Annualized Recurring Revenue, ARR)已不再具有“经常性”,它更像只是还没流失的收入。  

    史上规模最大的 ARR 支持型贷款,最终变成史上最大的私募信贷软件违约。几乎每个信贷交易部门同时抛出同一个问题:还有谁面对的是长期性的结构性逆风,却被当成周期性波动来解释与定价。

    但至少在最初,市场共识并非全错:从结构设计上看,这一轮冲击本应可以被消化。私募信贷并不是 2008 年那种银行体系。它的安排就是为了避免“被迫抛售”:资金多装在封闭式基金或封闭式工具里,投资者的资金有锁定期;有限合伙人通常承诺七到十年,不会像存款人那样随时挤兑;也不会出现回购协议融资额度突然被抽走、逼着你立刻卖资产的情况。管理人因此可以把受损资产先留在账上,逐步推进重组处置,等待回收。过程会很痛,但仍在可控范围内。系统按理应当能弯过去,而不是当场断裂。

    黑石、KKR 与阿波罗(Apollo)等公司的高管当时也强调,资产里与软件相关的投资只占 7% 到 13%,因此风险可控。卖方研报和社交媒体上的信贷账号更是反复强调同一句话:私募信贷拥有“永久资本(permanent capital)”,足以吸收那些本会炸毁高杠杆银行的损失。

    永久资本。这个词在一场场业绩电话会和一封封安抚投资者的信里反复出现,渐渐成了口号。问题在于,口号往往只留下安全感,却把关键细节盖住了。所谓“永久资本”之所以显得稳,是因为这套资金结构在过去十年里被进一步固化了。大型私募资管巨头通过收购人寿保险公司,把年金资金变成稳定、久期很长的资金来源,再把这笔钱投向自己发起的私募信贷资产。于是同一笔资金一方面在保险公司这本账上赚取利差,另一方面在资管业务这边再收取管理费,形成一种费用叠费用的循环。但它能成立,前提是这些私募信贷资产必须足够可靠。

    私募信贷必须得是 “安全无虞”,也就是说,本息得能按期足额兑付,至少在市场与监管的眼里要“靠得住”。一旦损失落到那种用久期很长的负债资金去持有难以变现资产的资产负债表上,麻烦就来了。原本被视为系统韧性的“永久资本(permanent capital)”,并不是什么抽象的、耐心的机构资金池,也不是什么老练投资者在承担老练风险。它在很大程度上是美国普通家庭的储蓄,也就是所谓“主街(Main Street)”,这些钱被包装成年金,再被投入到如今正在违约的同一批由私募股权支持的软件与科技信用资产里。那些“跑不了”的锁定资金,说到底是寿险保单持有人的钱,而这套体系的规则与银行并不一样。

    与银行体系相比,保险监管机构过去相当温和,甚至可以说有些自满,但这次成了警钟。它们本就对寿险公司在私募信贷上的集中度感到不安,于是开始下调这些资产在风险为本资本框架下的资本计提待遇。  结果就是,保险公司要么补资本,要么卖资产,而在一个正在冻结的市场里,两条路都很难以体面的价格走通。

    “纽约州与艾奥瓦州监管机构着手收紧寿险公司所持部分私评信贷资产的资本计提;美国保险监理官协会(NAIC)指引预计将提高 RBC 因子并触发证券估值办公室(SVO)更多审查 | 路透社,2027 年 11 月”  

    当穆迪将 Athene 的财务实力评级展望调为负面后,阿波罗(Apollo)股价两天内下跌 22%。布鲁克菲尔德(Brookfield)、KKR 以及其他公司随之下挫。

    之后事情只会更复杂。这些公司不只是造出了保险资金的“永动机”,它们还搭建了一套精巧的离岸结构,通过监管套利来最大化回报。  美国的保险公司签发年金后,会把风险分出给自己控制的百慕大或开曼关联再保险公司。这里的“分出”本身就是再保险业务的标准做法。  这些离岸关联方之所以存在,就是为了利用更宽松的监管环境,在同样资产上允许配置更少资本。随后,这些关联方再通过离岸特殊目的载体(SPV)引入外部资金,拉来一层新的交易对手,让外部资金与保险公司一起,把钱投向由同一母公司资管部门发起的私募信贷资产。

    评级机构中有些自身也由私募股权控股,它们并非透明度的典范,这一点几乎没人意外。不同公司、不同资产负债表之间织成的蜘蛛网,其不透明程度令人震惊。底层贷款一旦违约,究竟是谁在承担损失,在当时几乎不可能实时回答。

    2027 年 11 月的崩盘,标志着市场认知从一种可能只是寻常的周期性回撤,转向某种更令人不安的局面。在联邦公开市场委员会(Federal Open Market Committee, FOMC)那场 11 月紧急会议上,美联储主席凯文·沃什(Kevin Warsh)用一句话概括它:这是一条“押注白领生产率增长的相关押注串联链条”。

    要知道,真正引发危机的从来不是损失本身,而是对损失的确认。而在另一个更大、更重要的金融领域,我们已经开始害怕那种确认。

    抵押贷款问题

    “Zillow房屋价值指数(Zillow Home Value Index)显示:旧金山同比下跌11%,西雅图下跌9%,奥斯汀下跌8%;房利美(Fannie Mae)提示,在科技与金融就业占比超过40%的邮政编码区域,‘早期阶段逾期’水平上升 | Zillow / Fannie Mae,2028年6月” 

    本月,Zillow房屋价值指数在旧金山同比下跌11%,西雅图下跌9%,奥斯汀下跌8%。这还不是唯一令人不安的信号。上个月,房利美指出,一些以“超过(房利美/房地美)上限的大额贷款(jumbo loan)”为主的邮政编码区域,早期阶段逾期更高。这些区域的借款人信用评分多在780分以上,过去通常被视为近乎万无一失。 

    美国住宅抵押贷款市场规模约13万亿美元。房贷审批与核保建立在一个基本假设之上:借款人在贷款存续期间,会以大致当前的收入水平持续就业。对大多数房贷而言,这个期限长达三十年。

    白领就业危机通过对未来收入预期的持续下修,正在动摇这一假设。我们不得不重新提出一个三年前还显得荒诞的问题:优质抵押贷款是否仍然“安全无虞”?

    也就是本息是否仍能足额兑付、依旧靠得住。 在美国历史上,每一次抵押贷款危机的成因大体都可归入三类之一:投机过热,比如2008年把钱贷给根本负担不起房子的人;利率冲击,比如20世纪80年代初利率上升,使浮动利率房贷变得难以承受;或局部经济冲击,比如1980年代德州油气业崩塌,或2009年密歇根汽车业受创。

    但这一次都不适用。相关借款人并非次级(subprime)。他们是780分以上的FICO信用评分,首付20%,信用记录干净,就业记录稳定,发放贷款时的收入也经过核验并有完整文件。他们是金融系统各类风险模型所认定的信用质量基石。

    2008年,贷款从第一天起就是坏贷款。2028年,贷款在第一天是好贷款。只是贷款写下之后,世界变了。人们借的是一个他们如今已很难再相信自己负担得起的未来。

    2027年,我们就提示过一些“看不见的压力”信号:住房净值抵押担保信用额度(HELOC)被大量提取,401(k)账户被提前动用,信用卡债务飙升,但房贷仍保持按期还款。随着失业发生、招聘冻结、奖金削减,这些优质家庭的债务收入比翻了一倍。 

    他们仍能按时还房贷,但代价是几乎砍掉全部非必需消费,抽干储蓄,并推迟任何房屋维护与改造。从账面上看,他们依旧“按期还款”,但只要再来一次冲击,就可能迅速陷入困境,而AI能力演进的轨迹暗示那次冲击正在逼近。随后我们看到,旧金山、西雅图、曼哈顿与奥斯汀的逾期开始攀升,即便全国平均仍处在历史常态区间内。

    我们如今正处在最尖锐的阶段。当边际买家健康时,房价下跌通常还能被市场消化。但在这里,边际买家也在遭遇同样的收入能力受损。尽管担忧在积累,我们尚未进入全面的抵押贷款危机。逾期率确实上升了,但仍明显低于2008年的水平。真正的威胁在于趋势本身。

    智能替代螺旋如今又为实体经济的下行加装了两台金融加速器。

    劳动力替代、抵押贷款担忧、私人市场动荡,彼此强化。传统的政策工具箱,例如降息与量化宽松(quantitative easing,QE),可以缓释金融端的压力,却无法修复真实经济端的发动机,因为真实经济端并非由金融条件过紧驱动。它是由AI让人类智能更不稀缺、更不值钱所驱动。你可以把利率降到零,买下市场上每一张住房抵押贷款支持证券(MBS),再把所有违约的软件杠杆收购(LBO)债也都买走。

    这仍改变不了一个事实:一个Claude agent 可以用每月200美元的成本,完成一个年薪18万美元产品经理的工作。如果这些担忧兑现,抵押贷款市场会在今年下半年出现裂缝。在那种情景里,我们预计股市当前的回撤最终会逼近全球金融危机(global financial crisis,GFC)期间的水平,峰值到谷底为57%。这会把标普500指数(S&P 500)拉到约3500点,相当于回到2022年11月“ChatGPT时刻”到来前一个月的水平。 

    可以确定的是,支撑13万亿美元住宅抵押贷款的收入假设已遭到结构性破坏。不确定的是,政策能否在抵押贷款市场完全消化这一影响之前介入。我们仍抱有希望,但也无法否认那些令人悲观的理由。

    与时间赛跑

    第一条负向反馈回路先出现在真实经济里:AI能力提升,企业用工与工资支出缩减,消费走弱,利润空间被挤压,企业为了守住利润又加码购买AI能力,能力随之再提升。随后它传导到金融层面:收入能力受损先冲击抵押贷款,银行端损失上升促使信贷收紧,财富效应开始松动,反馈回路因而加速。而这两条回路又都被迟缓且不足的政策应对进一步放大,说得直白些,这个政府看起来有些摸不着方向。

    现有制度从未为这种危机而设计。联邦政府的收入基础,本质上就是对人类时间征税:人去工作,企业付薪,政府抽走一部分。正常年份里,个人所得税与工资税构成财政收入的脊梁。 

    截至今年第一季度,联邦财政收入比国会预算办公室(Congressional Budget Office,CBO)的基线预测低了12%。  工资税相关收入下滑,是因为以原有薪酬水平就业的人更少了;所得税收入下滑,是因为正在获得的收入在结构上更低了。生产率在飙升,但增益更多流向资本与算力,而不是劳动。

    GDP中的劳动收入份额从1974年的64%降到2024年的56%,这是全球化、自动化以及工人议价能力长期走弱带来的四十年下行。AI开始指数级提升后的四年里,这一比例又跌到46%,创下有记录以来最陡的一次下滑。

    产出仍然存在,但它不再像过去那样先经过家庭收入再回到企业,这意味着它也不再像过去那样先经过家庭再回到美国国税局。  经济的循环流转正在断裂,而政府却被期待站出来把这个断裂补回去。

    和每一次经济下行一样,财政支出往往在税收收入下滑时上升。不同的是,这一次的支出压力并非周期性的。所谓自动稳定器(automatic stabilizers),本来是为“短期失业”设计的,不是为“结构性替代”设计的。  现行福利体系隐含的前提是,失业者终究会被重新吸收回就业市场。可很多人不会,至少不可能以接近原有工资的水平回到市场。新冠期间,政府可以坦然接受 15% 的赤字,因为那被理解为暂时性的;而今天需要政府支持的人,并不是被一场终会过去的疫情击中,他们是被一项仍在持续进步的技术替代了。

    它需要向家庭转移更多资金,恰恰又是在它从这些家庭身上收不到那么多税的时候。

    美国不会违约。它印自己花的货币,也用同一种货币偿还债权人。但压力已经在别处显现。今年以来,市政债券的年内表现开始出现令人不安的分化。不征收所得税的州尚能撑住,但那些依赖所得税的州发行的一般责任市政债券(general obligation munis),已经开始计入一定的违约风险。政客很快嗅到风向,关于“谁该被救助”的争论也迅速沿着党派界线分裂开来。

    值得肯定的是,政府很早就意识到这场危机带有结构性,并开始讨论一些两党方案,将其称为《转型经济法案》(Transition Economy Act):为被替代劳动者建立直接转移支付框架,资金来源由赤字融资与拟议中的 AI 推理算力税共同构成。

    桌面上最激进的方案走得更远。《共享 AI 繁荣法案》(Shared AI Prosperity Act)试图为“智能基础设施本身的回报”设立一种公共索取权,其形式介于主权财富基金与对 AI 生成产出收取版税式机制之间,并以分红为家庭转移支付提供资金。私营部门的游说者则涌入媒体,反复警告这是一条危险的滑坡。

    围绕这些方案的政治博弈,阴郁得几乎可预测,政治作秀与极限博弈更是火上浇油。右翼把转移支付与再分配称为马克思主义,并警告对算力征税会把领先优势拱手让给◽️◽️。左翼则警告,一项在在位者参与下起草的税制,很可能换个名字就变成监管俘获。  财政鹰派指向不可持续的赤字,鸽派则拿全球金融危机(GFC)后过早紧缩当作前车之鉴。随着今年总统大选临近,裂痕还在扩大。

    当政客争吵不休时,社会肌理的撕裂速度,比立法流程能跟上的速度更快。

    “占领硅谷”(Occupy Silicon Valley)运动成了更广泛不满情绪的标志。上个月,示威者连续三周封锁 Anthropic 与 OpenAI 在旧金山办公室的入口。他们的人数仍在增长,而抗议获得的媒体曝光甚至超过了引发抗议的失业数据本身。

    很难想象公众会比全球金融危机后更痛恨银行家,但 AI 实验室正在努力追赶这种厌恶。从大众视角看,原因并不难理解:它们的创始人与早期投资者积累财富的速度,甚至让镀金时代都显得温和。  生产率繁荣带来的收益几乎完全流向算力的拥有者,以及依赖算力运转的实验室股东,美国的不平等因此被推到前所未有的高度。

    每一方都有自己的“反派”,但真正的反派是时间。AI 能力演进的速度,快过制度适应的速度。政策响应按意识形态的节奏前进,而不是按现实的节奏前进。如果政府不能尽快就“问题到底是什么”达成一致,这条下行循环反馈回路就会替他们写出下一章。

    智能溢价的退潮

    在整个现代经济史中,人类智能一直是稀缺投入要素。资本充裕,至少可以复制扩张。自然资源有限,但可以替代。技术进步足够缓慢,人类还能跟上并适应。智能,也就是分析、决策、创造、说服与协调的能力,长期以来无法以规模化方式复制。

    人类智能之所以天然带着溢价,正是因为它稀缺。我们经济中的每一套制度安排,从劳动力市场到抵押贷款市场,再到税制设计,都是为这条假设成立的世界而建。

    如今,我们正在经历这份溢价正在退潮。机器智能已成为人类智能的合格替代品,并且在越来越广的任务范围内迅速进化。金融体系在过去几十年里针对“人类智能稀缺”的世界做了优化,如今正在被迫重新定价。  这场重新定价痛苦、无序,而且远未结束。

    但重新定价不等于崩塌。

    经济仍可能找到新的均衡。抵达那里,是少数仍必须由人类完成的任务之一。我们必须把它做对。这是历史上第一次,经济中最具生产力的资产带来的岗位不是更多,而是更少。没有哪套既有框架适配,因为它们都不是为“稀缺要素变成充裕要素”的世界而设计的。所以我们必须重建框架。能否及时建立这些框架,才是唯一要紧的问题。

    但你读到这里的时间不是 2028 年 6 月,而是 2026 年 2 月。

    标普500指数接近历史高位。下行周期尚未启动。我们确信其中一些情景不会发生,但我们同样确信机器智能会继续加速,人类智能的溢价会收窄。

    作为投资者,我们仍有时间评估自己的投资组合有多少押在在未来十年内难以成立的假设上。作为社会,我们也仍有时间更主动一些。

    金丝雀还活着。

    “金丝雀”是一个风险预警的隐喻,源自早期煤矿作业:矿工会携带对有毒气体更敏感的金丝雀下井。空气一旦恶化,金丝雀会先出现异常甚至死亡,用来提醒人类危险临近、需要立刻撤离。引申到经济与金融语境,“金丝雀还活着”并不是说没有风险,而是说最致命、不可逆的阶段尚未到来,警报还没被彻底触发,体系仍处在可以提前调整、采取行动的窗口期。(黄色引用框内灰色文字,系译者就相关内容所作的解读。)

    《THE 2028 GLOBAL INTELLIGENCE CRISIS》由知名金融研究平台Citrini Research创始人James van Geelen(笔名Citrini)主笔,与Alap Shah联合撰写。Citrini Research专注于主题股权投资与全球宏观趋势分析,其Substack通讯常居财经付费榜首。van Geelen毕业于加州大学洛杉矶分校,获生物学与心理学学位,曾在洛杉矶担任急救医士,后创办医疗保健公司并成功出售给私募股权。他以“第二序思考”著称,早于市场洞察NVIDIA在AI领域的潜力及GLP-1减肥药的投资机会,个人投资组合自2023年5月以来回报率超200%。联合作者Alap Shah现为Lotus Technology Management管理合伙人兼CIO,哈佛大学经济学荣誉毕业生,曾在Viking Global与Citadel对冲基金任职,并共同创立AI驱动金融搜索平台Sentieo(2022年以逾2亿美元出售给AlphaSense),目前担任Littlebird CEO与Thistle联合创始人兼主席,在金融科技及AI代理部署领域经验丰富。本文作为思想实验,展现两位作者在AI时代经济转型领域的深刻洞见与前瞻视野。

  • 年薪150万的工作,我用500美金的AI完成:个人业务Agent升级指南

    XinGPT

    2026 年春节,我做了一个决定:把自己的全部业务流程 Agent 化。

    一周后的今天,这套系统已经跑通了接近 1/3,尽管这套系统还在完善,我每天的常规工作任务已经可以从 6 小时降到 2 小时,但业务产出反而提升了 300%。

    更重要的是,我验证了一个假设:个人业务的 Agent 化改造是可行的,而且我觉得每个人都应该打造这样一套操作系统

    拥有一个 Agent 系统,意味着你的思维彻底转变,从“我如何完成这项工作”到“我该建立怎样的 Agent 来完成这项工作”,这种从被动到主动的思维模式产生的影响是巨大的。

    这篇文章,我不会输出任何 AI 生成的鸡汤,也不会刻意制造 AI 替代的焦虑,而是彻底拆解我是如何一步步完成这个转型的,以及你可以如何免费复制这套方法。

    这是构建 agent 生产力系统的第一篇,现在点击收藏,追踪后续更新不迷路。

    为什么 Agent 化是必选项,不是可选项

    先说一个残酷的事实:

    如果你的业务模式是“时间换收入”,那么你的收入天花板已经被物理定律锁死了。一天只有 24 小时,就算你全年无休,按小时计费的上限也就在那里。

    • 基金经理年薪 ¥150 万 ≈ 每小时 ¥720(按 2080 工作小时算)
    • 咨询合伙人年薪 ¥200 万 ≈ 每小时 ¥960
    • 头部财经 KOL 年入 ¥300 万 ≈ 每小时 ¥1440

    看起来很高?但这已经是人力模式的极限了。

    而 Agent 化的逻辑完全不同:你的收入不再由工作时间决定,而是由系统的运行效率决定

    一个真实的转折点

    2026 年 1 月的某个周五晚上 11 点,我还在电脑前整理当天的市场数据。

    那天美股大跌,我需要:

    • 看完 50+条重要新闻
    • 分析 10 家重点公司的盘后表现
    • 更新我的投资组合策略
    • 写一篇市场解读文章

    我算了一下,至少还要 3 个小时。而第二天早上 8 点,我又要重复同样的流程。

    那一刻我突然意识到:我的时间没有花在投资分析的思考和决策,我只是在做一个数据搬运工

    真正需要我判断的决策,可能只占 20% 的时间。剩下 80% 都是重复性的信息收集和整理。

    这就是我决定 Agent 化的起点。

    我的投研 Agent 系统现在每天自动处理:

    • 20000+条全球财经新闻
    • 50+家公司的财报更新
    • 30+个宏观数据指标
    • 10+个行业研究报告

    如果用人力完成这些工作,需要一个 5 人团队。而我的成本是:每月 API 调用费 500 美金 + 我每天 1 小时的 review 时间。

    这就是 Agent 化的本质:用算法复制你的判断框架,用 API 成本替代人力成本

    01 解构你的业务:从人到系统的三层架构

    任何知识工作都可以被拆解为三层:

    第一层:知识库(Knowledge Base)

    这是 Agent 的“记忆系统”。

    以投研工作为例,我的做法是建立了一个包含我投资所需要的信息和数据的知识库,包含:

    1. 历史数据库

    • 过去 10 年的宏观经济数据(美联储、CPI、非农)
    • 美股 Top 50 公司的财报数据
    • 重大市场事件的复盘笔记(2008 金融危机、2020 疫情、2022 加息周期)

    2. 重要指标与新闻

    • 我关注的主要财经媒体和信息渠道
    • 美联储政策及重点公司发布财报日期
    • 我关注的 50 个 Twitter 账号(宏观分析师、基金经理)
    • 重要宏观指标
    • 重要的行业研究和行业数据跟踪

    3. 个人经验库

    • 我过去 5 年的投资决策记录
    • 每次判断对错的复盘

    一个具体的案例:2026 年 2 月初的市场暴跌

    2 月初市场突然暴跌,黄金白银崩盘,加密货币泄洪,美股港股大 A 接连跳水。

    市场上的解读主要有几个:

    • Anthropic 的法律 AI 太厉害,软件股票崩盘
    • 谷歌资本开支指引过高
    • 即将上任的美联储主席 Warsh 是鹰派

    我的 Agent 系统在暴跌前 48 小时就发出了预警,因为它监控到:

    • 日债收益率跳涨,US2Y-JP2Y 利差大幅收窄
    • TGA 账户余额高企,财政部持续从市场抽水
    • CME 连续 6 次提高金银期货保证金

    这些都是流动性收紧的明确信号。而我的知识库里,有 2022 年 8 月日元套利交易平仓引发市场波动的完整复盘。

    Agent 系统自动匹配了历史模式,在暴跌前给出了“流动性紧张+估值高企→减仓”的建议。

    这次预警帮我避免了至少 30% 的回撤。

    这个知识库有超过 50 万条结构化数据,每天自动更新 200+条。如果用人工维护,需要 2 个全职研究员。

    第二层:Skills(决策框架)

    这是最容易被忽视,但最关键的一层。

    大部分人用 AI 的方式是:打开 ChatGPT → 输入问题 → 得到答案。这种方式的问题是,AI 不知道你的判断标准是什么

    我的做法是把自己的决策逻辑,拆解成独立的 Skills。以投资决策为例:

    Skill 1: 美股价值投资框架

    (以下 Skill 为举例,不代表我实际的投资标准,而且我的投资判断标准也会实时更新):

    markdown

    输入:公司财报数据
    判断标准:
    - ROE > 15%(持续3年以上)
    - 负债率 < 50%
    - 自由现金流 > 净利润的80%
    - 护城河评估(品牌/网络效应/成本优势)
    输出:投资评级(A/B/C/D)+ 理由

    Skill 2: 比特币抄底模型

    markdown

    输入: 比特币市场数据
    判断标准:
    - K线技术指标: RSI < 30 且周线级别超跌
    - 交易量: 恐慌抛售后成交量萎缩(低于30日均量)
    - MVRV比率: < 1.0(市值低于实现市值,持有者整体亏损)
    - 社交媒体情绪: Twitter/Reddit恐慌指数 > 75
    - 矿机关机价: 现价接近或低于主流矿机关机价(如S19 Pro成本线)
    - 长期持有者行为: LTH供应占比上升(抄底信号)
    触发条件:
    - 满足4个以上指标 → 分批建仓信号
    - 满足5个以上指标 → 重仓抄底信号
    输出: 抄底评级(强/中/弱) + 建议仓位比例

    Skill 3: 美股市场情绪监控

    markdown

    监控指标:
    - NAAIM暴露指数: 活跃投资经理的股票持仓比例
      · 数值 > 80 且中位数触及 100 → 机构加仓空间见顶预警
    - 机构股票配置比例: State Street等大型托管机构数据
      · 处于2007年以来历史极值 → 反向预警信号
    - 散户净买入额: 摩根大通追踪的每日散户资金流向
      · 日均买入量 > 85%历史水平 → 情绪过热信号
    - 标普500远期市盈率: 监控是否接近历史估值峰值
      · 接近2000年或2021年水平 → 基本面与股价背离
    - 对冲基金杠杆率: 高杠杆环境下的拥挤仓位
      · 杠杆率处于历史高位 → 潜在波动放大器
    触发条件:
    - 3个以上指标同时预警 → 减仓信号
    - 5个指标全部预警 → 大幅减仓或对冲
    输出: 情绪评级(极度贪婪/贪婪/中性/恐慌) + 仓位建议

    Skill 4: 宏观流动性监控

    markdown

    监控指标:
    - 净流动性 = 美联储总资产 - TGA - ON RRP
    - SOFR(隔夜融资利率)
    - MOVE指数(美债波动率)
    - USDJPY + US2Y-JP2Y利差
    触发条件:
    - 净流动性单周下降>5% → 预警
    - SOFR突破5.5% → 减仓信号
    - MOVE指数>130 → 风险资产止损

    这些 Skills 的本质是:把我的判断标准显性化、结构化,让 AI 能按照我的思维框架工作

    第三层:CRON(自动化执行)

    这是让系统真正运转起来的关键。

    我设置了以下自动化任务:

    现在我的早晨是这样的:

    7:50 起床,刷牙时看手机。Agent 已经把 overnight 全球市场摘要推送完成:

    • 美股昨夜小幅上涨,科技股领涨
    • 日本央行维持利率不变,日元小幅贬值
    • 原油价格因地缘政治上涨 2%
    • 今日重点关注:美国 CPI 数据、英伟达财报

    8:10 吃早餐,打开电脑看详细分析。Agent 已经生成了今日策略:

    • CPI 数据预期符合市场预期,对市场影响中性
    • 英伟达财报关键看 AI 芯片订单指引
    • 建议:持有科技股仓位,关注能源板块机会

    8:30 开始工作,我只需要基于 Agent 的分析,做最终决策:是否调仓,调多少。

    整个过程 30 分钟。

    我不再需要每天早上手忙脚乱地翻新闻,AI 已经帮我做好了预习。

    更重要的是投资决策不再轻易被情绪所影响,而是有着完整的投资逻辑,清晰的判断标准,并且根据投资表现来复盘、总结、迭代;这才是 AI 时代投资的正确路径,而不是继续招一大堆实习生每天加班更新 excel 利润预测表,或者凭感觉就 50 倍杠杆梭哈,等着大力出奇迹。

    02 内容生产的 Agent 化:从手工作坊到生产线

    我的第二个主要业务是做内容,目前主要平台是在推特,也在探索 YouTube 和其他视频形态。

    之前我写一篇文章的一般流程是:

    • 找选题(1 小时)
    • 查资料(2 小时)
    • 写作(3 小时)
    • 修改(1 小时)
    • 发布+互动(1 小时)

    总计 8 小时一篇文章,而且质量不稳定。

    我复盘了一下我之前发布文章的最大问题,主要有几点:

    • 选题太宽泛,没有切入点
    • 内容太理论,缺少具体案例
    • 标题不够吸引人
    • 发布时间

    而 Agent 化融入内容生产,是可以被系统化的工程

    因此在内容层面,我的 Agent 化改造分三步:

    第一步:建立爆款内容知识库

    我做了一件很多人忽略了的事情:系统化地研究爆款文章的规律

    具体做法:

    1. 爬取了过去一年 X 平台上财经/科技领域 Top 200 的爆款文章
    2. 用 AI 分析它们的共性:标题结构、开头方式、论证逻辑、结尾设计
    3. 提炼出可复用的“爆款公式”

    举几个例子:

    标题公式:

    • 数字冲击型:“资产缩水 70% 后,我悟到了……”
    • 反常识型:“互联网已死,Agent 永生”
    • 价值承诺型:“帮你节省……不用上闲鱼买”

    开头公式:

    • 具体事件切入:“2025 年 1 月,我做了一个决定……”
    • 极端对比:“如果你继续按现在的节奏……但 6 个月后……”
    • 先破后立:“市场上的解读主要有几个……我认为以上都不对”

    论证结构:

    • 观点 → 数据支撑 → 案例验证 → 反面论证
    • 用 1/2/3 清晰分层
    • 专业术语+白话解释

    我把这些规律整理成一个“爆款内容框架库”,喂给 AI。

    第二步:人机协作的内容生产线

    现在我的内容生产流程变成了一条高效的人机协作生产线,每个环节都有明确的分工。

    选题阶段(AI 主导,我决策)

    每周一早上,我的 Agent 会自动推送 3-5 个选题建议。

    输入来源:

    • 本周全球市场热点事件(自动抓取)
    • 我的投研笔记和最新思考
    • 社交媒体上的高频讨论话题
    • 读者评论区的高频问题

    AI 输出格式:

    markdown

    选题1: 比特币突破10万美元背后的流动性逻辑
    核心论点: 不是需求驱动,而是美元流动性扩张的结果
    潜在爆点: 数据密集+反常识观点
    预估互动率: 高
    
    选题2: 为什么AI公司都在亏钱,但股价还在涨
    核心论点: 市场定价的是未来现金流折现,不是当下利润
    潜在爆点: 解答大众困惑
    预估互动率: 中高
    
    选题3: 散户情绪指标创新高,该逃顶了吗
    核心论点: 情绪指标需要结合流动性环境判断
    潜在爆点: 实用工具+方法论
    预估互动率: 中

    我会选择最符合当下市场情绪、同时我有独特见解的选题。

    资料收集阶段(AI 执行,我补充)

    选定选题后,Agent 自动启动资料收集流程:

    1. 数据抓取(自动化) 相关公司的最新财报数据 宏观经济指标的历史走势 行业研究报告的核心观点 社交媒体上的代表性观点
    2. 信息整理(AI 处理) 将散乱的信息按论证逻辑分类 提取关键数据和引用来源 生成初步的论证框架
    3. 人工补充(我的价值) 加入我的个人经验和案例 补充 Agent 找不到的小众信息源 标注哪些观点需要重点论证

    这个阶段从原来的 2 小时缩短到 30 分钟。

    写作阶段(人机协作)

    这是最关键的环节,我和 AI 的分工非常明确:

    AI 负责:

    • 根据爆款框架生成文章结构
    • 填充数据和事实性内容
    • 生成多个标题和开头版本供选择
    • 确保论证逻辑的完整性

    我负责:

    • 注入个人观点和价值判断
    • 加入真实案例和细节
    • 调整语气和表达方式
    • 删除 AI 生成的“正确的废话”

    修改阶段(AI 辅助,我主导)

    初稿完成后,我会让 Agent 做几件事:

    1. 可读性检查 句子是否过长(超过 30 字的句子标红) 是否有重复表达 专业术语是否需要解释
    2. 爆款要素检查 标题是否符合高互动率模式 开头 3 段是否有钩子 是否有具体数据支撑 是否有可引用的金句
    3. 多版本生成 生成 3 个不同风格的标题 生成 2 个不同角度的结尾 我选择最合适的版本

    这个阶段从原来的 1 小时缩短到 15 分钟。

    发布阶段(自动化)

    文章定稿后,Agent 自动执行:

    • 转换为各平台的格式(X/微信公众号/小红书)
    • 生成配图建议(我确认后生成)
    • 在最佳时间自动发布(根据历史数据分析)

    第三步:数据驱动的持续优化

    关键认知:内容 Agent 不是一次性搭建,而是持续进化的系统

    我每周会做复盘:

    • 哪类标题收藏率最高? → 更新标题公式权重
    • 哪个论证结构转发最多? → 强化这个模板
    • 读者评论区最常问什么? → 加入 FAQ,下次文章中回应

    举个具体例子:

    我发现“数据密集型”的文章(大量具体数字+图表)收藏率比纯观点文章高 40%。于是我调整了内容框架,要求 AI 在初稿中:

    • 每个核心论点必须有至少 1 个数据支撑
    • 每篇文章至少包含 3 张图表
    • 数据来源必须标注

    结果:最近 5 篇文章的平均收藏率从 8% 提升到 12%。

    2026 年 1 月,我写了一篇《Agent 大爆发的时代,我们应该如何应对 AI 焦虑》。

    这篇文章的数据量不多,但转发率异常高,达到了 20%。

    我让 Agent 分析原因,发现:

    • 文章触及了深层的价值观问题(AI vs 人类意义)
    • 用了“卢浮宫着火救猫还是救名画”这个具体场景
    • 结尾的“成为一个更会用 AI 的人很重要,但更重要的是不要忘记如何成为一个人”引发共鸣

    我把这个发现加入了框架库:在技术类文章中,适当加入哲学思考和价值观讨论,能显著提升转发率。

    这就是 Agent 系统的复利效应:系统在帮我优化系统内容 Agent 也不是一次性搭建就结束,而是持续进化的系统

    03 从个人能力到咨询服务:验证方法论的可复制性

    当我把自己的投研和内容 Agent 系统跑通后,我开始思考:这套方法能否帮助别人?

    去年 12 月的时候,一个基金经理一起吃饭,他说自己忙不过来,他管理着一只 5 亿规模的私募基金,手底下也有将近 10 个人,但还是感觉被市场的消息牵着鼻子走,每天疲于奔命。

    他每天的工作是这样的节奏:

    • 早上 6 点半起床,看 overnight 全球市场
    • 7-8 点:看看overnight 全球市场重点新闻
    • 8 点半-9 点半:开晨会,讨论投资策略
    • 9 点半-15 点:盯盘,处理交易
    • 15-18 点:研究公司,看财报
    • 18-20 点:写投资日志,复盘
    • 22 点:看海外市场开盘

    我帮他做了一次工作流程分析,发现:

    • 60% 的时间在收集和整理信息(可 Agent 化)
    • 20% 的时间在做重复性分析(可 Agent 化)
    • 15% 的时间在做决策(人机协作)
    • 5% 的时间在做交易执行(可自动化)

    因此我用了两周时间,帮他搭建了一套简化版的投研 Agent:

    • 第 1 周:访谈他的工作流程,识别可 Agent 化的环节
    • 第 2 周:搭建知识库 + 配置 3 个核心 Skills + 设置自动化任务

    2 周后他给我发了一条微信:思考的时间更多了之后,投资的心态更稳了。

    这次项目让我意识到:Agent 化改造的需求是普遍存在的,压缩信息处理的时间就是提高投资效率。

    但我很快发现,单纯做咨询有两个问题:

    1. 时间瓶颈:每个项目需要 2-4 周,我一个月最多接 3 个项目
    2. 不可规模化:每个客户的需求都不同,很难标准化

    这让我开始思考下一个阶段:从服务到产品

    04 Agent as a Service:从 SaaS 到 AaaS 的范式转移

    传统软件是 SaaS(Software as a Service):

    • 你给客户一个工具
    • 客户需要学习如何使用
    • 客户自己操作、自己维护

    未来是 AaaS(Agent as a Service):

    • 你给客户一个 Agent
    • 客户只需要下达指令
    • Agent 自动执行、自动优化

    区别在于:SaaS 卖的是“能力”, AaaS 卖的是“结果”

    今年 1 月,我又那个基金经理朋友吃饭。

    他说:“你帮我搭建的这套 Agent 系统太好用了。我推荐给了几个同行,他们都想要。但你一个人做咨询,能服务几个客户?”

    我说:“确实,这是个问题。”

    他说:“你为什么不把它做成产品?就像 Salesforce 那样,但不是卖软件,是卖 Agent 服务。”

    确实,我觉得好的Agent应该做成服务去替代SaaS,就像Openclaw的创造者Peter所预言的那样,未来将是Agent的天下,用户不再需要安装软件。

    因此,我觉得把这套Agent系统跑成熟之后,做成一个开源的项目,让所有人都可以复制使用;对于有商业化需求的机构客户,高级功能进行付费订阅或者按照使用量计费。

    05 Agent 化的本质:从时间杠杆到算法杠杆

    写到这里,我想分享一些更深层的思考。

    传统的个人业务增长路径是:

    1. 初级阶段:卖时间(按小时收费)
    2. 中级阶段:卖产品(一次开发,多次售卖)
    3. 高级阶段:卖系统(建立平台,让别人在上面交易)

    Agent 化提供了第四条路径:卖算法能力

    你不再需要:

    • 雇佣一个团队(省去管理成本)
    • 开发一个复杂的软件(省去技术门槛)
    • 建立一个平台(省去网络效应冷启动)

    你只需要:

    • 把你的专业知识结构化
    • 配置 Agent 系统执行
    • 持续优化算法框架

    这是一种新的杠杆:算法杠杆

    它的特点是:

    • 低成本:主要是 API 调用费,远低于人力成本
    • 可复制:同一套 Agent 可以服务无数客户
    • 可进化:随着大模型能力提升,你的 Agent 自动变强

    你的 Agent 化行动清单

    如果你被这篇文章触动,建议按以下步骤行动:

    第一步:诊断(本周完成)

    列出你每天的工作清单,标注:

    • 哪些是重复性工作(信息收集、数据整理、格式转换)
    • 哪些是判断性工作(决策、创意、战略)
    • 哪些是执行性工作(发布、追踪、回复)

    原则:重复性工作优先 Agent 化,判断性工作人机协作,执行性工作自动化

    一个简单的练习

    拿出一张纸,写下你昨天的工作清单。

    对每一项工作,问自己三个问题:

    1. 这项工作是否可以被标准化?(如果是,可以 Agent 化)
    2. 这项工作是否需要创造性思考?(如果不需要,可以 Agent 化)
    3. 这项工作是否需要我的独特判断?(如果不需要,可以 Agent 化)

    你会发现,至少 50% 的工作可以被 Agent 化。

    第二步:搭建(本月完成)

    选择一个最小可行场景开始实验。

    举几个例子:

    • 如果你是投资者 → 搭建“每日市场摘要 Agent”
    • 如果你是内容创作者 → 搭建“选题建议 Agent”
    • 如果你是销售 → 搭建“客户背景调研 Agent”
    • 如果你是设计师 → 搭建“设计灵感收集 Agent”

    不要追求完美,先跑通一个最小闭环

    第三步:优化(本季度完成)

    记录 Agent 系统为你节省了多少时间,产出质量是否稳定。

    每周做一次复盘:

    • 哪些环节 Agent 做得好?
    • 哪些环节还需要人工介入?
    • 如何调整 Skills 让 Agent 更符合你的标准?

    第四步:商业化(本年度完成)

    当你的 Agent 系统稳定运行后,思考:

    • 这套方法对同行是否有价值?
    • 如果有,他们愿意付多少钱?
    • 你能否把它产品化?

    如果答案是 yes,恭喜你,你已经找到了一个新的商业模式。

  • AI给社会带来的绝不仅仅是大通缩和金融货币危机 — 还有巨大的权力体系重构

    rick awsb ($people, $people)