从入门到运用:AI Agent 完全指南
零基础,一步一步来。读完这篇,你就能让 AI 帮你干活。
本篇目录
第一步:装上必要的工具
很多 AI Agent 依赖这些基础环境。全部免费,30 分钟搞定。
1. 安装 Git —— 学会给代码拍"快照"
Git 解决了一个什么痛点
想象你写一篇论文。你写了一份初稿,改了第二版,又改了第三版。为了保险,你可能会这样存文件:
论文_初稿.doc 论文_初稿_修改版.doc 论文_初稿_修改版_最终版.doc 论文_初稿_修改版_最终版_真的最终版.doc
这就是手动版本管理——混乱、占空间、不知道每个版本之间到底改了什么。
Git 就是解决这个问题的:每次你觉得"这个状态值得保存",就拍一张快照(叫 commit)。Git 会记录下这个版本和上个版本之间每一行的差异。什么时候想回到"昨天下午 3 点的那个版本",一条命令就能回去。
用"写书的团队"来理解 Git 的分支系统
一个团队在写一本书。书的主线(main 分支)是已经出版的内容,不能乱改。现在有三个人同时工作:
- 张三想新加一章 → 他从主线分出一条分支(branch),叫"新章节"。他在这个分支上随便折腾,完全不影响主线。
- 李四在修错别字 → 他也从主线分出一条分支,叫"修错字"。
- 两个人各自在自己的分支上干活,互不干扰。等各自改完了,分别把内容合并(merge)回主线。
这就是 Git 的核心工作方式:主分支保持稳定,每个人在自己的分支上自由实验,改好了再合回去。不会有"你到底改了什么"或者"我的版本被你覆盖了"这种问题。
很多 AI Agent 工具(如 Claude Code)在操作文件时会自动用 Git 做版本追踪,所以需要你电脑上装了 Git。
安装步骤
- 打开 git-scm.com,下载安装包,一路默认选项即可
- 装完验证:终端输入
git --version
2. 注册 GitHub —— 代码界的"百度网盘 + 朋友圈"
Git 和 GitHub 是什么关系
Git 是工具,装在你电脑上。GitHub 是网站,一个把 Git 仓库上传到云端保存的平台。
类比:Git 就像是拍照功能(在你手机里),GitHub 就像是百度网盘(在云端,别人也能看到)。你自己拍的照片存在手机上(本地 Git),上传到百度网盘后(GitHub),别人就能看到、下载、甚至帮你修图(协作)。
代码托管平台到底在"托管"什么
托管的不只是代码文件本身,还包括:
- 全部版本历史:从项目创建第一天到此刻,每一次改动、谁改的、为什么改,全部留档。
- Issues(问题跟踪):发现 bug?提一个 Issue。想要新功能?提一个 Issue。所有人能看到并回复。
- Pull Requests(贡献通道):你想给某个开源项目贡献代码?你 fork 一份、改好、提交 PR。原作者审核通过后,你的代码就合并进主项目了。
- Actions(自动化流水线):每次有新的代码提交,自动跑测试、自动部署到服务器。
GitHub 凭什么成为"代码托管平台"的代名词
- 先发优势:2008 年上线,比其他平台早了几年积累用户。Google 要搜代码,绝大部分结果都在 GitHub 上。
- 社交属性:可以"关注"一个开发者看他最近在写什么、"Star"一个项目收藏它、Fork 一份到自己的仓库里改。这让程序员有了一种类似微博/朋友圈的社交体验。
- 开源社区的约定俗成:当 99% 的开源项目都把代码放在 GitHub 上时,第 100 个项目也只能放在 GitHub——否则别人找不到你。
- AI 时代的不可替代性:你现在要学的 Skill、MCP Server、CLI-Anything、CC Switch——它们全部托管在 GitHub 上。你不注册 GitHub 账号,就没法从这些仓库下载资源,也没法给这些项目提 Issue 反馈问题。
注册步骤
- 打开 github.com → 右上角 Sign up → 填邮箱、设密码、起用户名
- 用户名建议用英文+数字(这是你的技术身份,以后别人会通过它找到你)
- 收邮件验证 → 完成。免费账号。
3. 安装 Node.js —— 你的电脑上需要一个"万能工具箱"
Node.js 不是"又一种编程语言"
JavaScript 以前只能在浏览器里跑(做网页交互效果)。2009 年有人把它从浏览器里"抽"了出来,装到了电脑上——这就是 Node.js:让 JavaScript 能直接在电脑上运行,访问文件系统、执行命令行操作、启动服务器。
对小白来说,你不需要学 JavaScript。你只需要知道:Node.js 自带了一个叫 npm 的东西,它是全世界最大的"软件包仓库"。
npm:全世界最大的"应用商店",只是没有界面
手机上有 App Store 和各大应用市场,你需要什么 App 就搜一下、点安装。npm 就是编程世界的 App Store,只不过它没有界面——你在终端里敲一行命令:
npm install -g @anthropic-ai/claude-code
这一行命令做了手机上的"搜索→下载→安装→配置好桌面快捷方式"四件事。npm 仓库里有 200 多万个软件包,绝大部分 AI Agent 工具(Claude Code、Cursor MCP、Playwright MCP)都通过 npm 发布和安装。
还有一个你可能经常看到的命令 npx:它是 npm 的一个快捷方式,不用安装就能临时运行一个 npm 包。比如用它一键安装 Skill:
npx skills add 仓库名 --skill 技能名 -g -y
安装步骤
- 打开 nodejs.org,下载 LTS 版本(长期支持版,最稳定)
- 装完验证:
node --version和npm --version
4. 安装 Python —— 科学计算和自动化脚本的通用语言
Python 是全世界最流行编程语言之一。Aider、CLI-Anything、大量 MCP Server 和数据处理脚本都是用 Python 写的。你用这些工具的时候,它们在后台靠 Python 运转,你不一定需要学会写 Python,但必须有一个可用的 Python 环境。
Python 自带的 pip 是 Python 世界的包管理器,和 npm 一个作用:
pip install cli-anything-hub
不需要装 Anaconda 或 PyCharm,也不需要激活码。Python 从 python.org 下载完全免费,没有付费版、没有试用期、不需要注册账号。那些要钱的是 PyCharm 专业版之类的编程工具,你用不着。
安装步骤
- 打开 python.org,下载最新版(3.11 以上)
- Windows 用户特别注意:安装时一定要勾选 "Add Python to PATH",否则后面终端里找不到
python命令 - 装完验证:
python --version和pip --version
5. 学会打开终端 —— 和电脑"直接对话"的窗口
平时你在电脑上操作是靠鼠标点来点去(图形界面)。终端是另一种操作方式——用纯文字命令控制电脑。很多 AI Agent 工具运行在终端里,你需要学会最基本的操作。
你不需要成为命令行高手,记住这三个核心操作就够了:
cd 文件夹名—— 进入某个文件夹(就像在文件管理器里双击打开一个文件夹)ls(Mac/Linux)或dir(Windows)—— 列出当前文件夹里有什么文件Ctrl+C—— 终止当前正在运行的程序
打开方式
- Windows:Win+R → 输入
cmd回车。推荐去微软商店免费下载 Windows Terminal,体验好很多 - macOS:Cmd+空格 → 搜索"终端"
验证清单:终端里依次输入以下五条命令,每条都显示版本号就说明环境准备好了:
git --version # 应显示 git version 2.x.x node --version # 应显示 v18.x.x 或更高 npm --version # 应显示 9.x.x 或更高 python --version # 应显示 Python 3.11.x 或更高 pip --version # 应显示 pip 24.x 或更高
第二步:AI 是怎么从聊天进化到帮你干活的
你跟 Siri 说"今天天气怎么样"和你跟 Claude Code 说"帮我重构这个项目",虽然都叫 AI,但背后的能力差了四代。
| 代际 | 类型 | 能做什么 | 例子 |
|---|---|---|---|
| 1. 聊天机器人 | 一问一答 | 回答问题、翻译、闲聊。不记上下文,不能用工具。 | 早期 ChatGPT、Siri |
| 2. 代码补全 | 编辑器内补全 | 你写一行,AI 补完剩下几行。不能对话。 | 早期 Copilot |
| 3. AI 辅助编程 | 对话 + 上下文 | 理解项目结构、对话式改代码、跨文件操作。 | Cursor Chat、Copilot Chat |
| 4. AI Agent | 自主执行 + 多工具 | 自己规划步骤、操作终端、读写文件、调用外部 API。不只是建议你做什么,而是自己去做。 | Claude Code、Cursor Composer |
你现在要学的,就是第 4 代:AI Agent。它能读懂你的项目、自己制定计划、动手写代码改文件、跑命令看结果——像一个真正的队友。
第三步:你必须懂的几个核心概念
不需要精通,知道这些词在说什么就行。每个概念在我们的术语词典里都有详细解释。
AI Agent(智能体)
能自己动手做事的 AI。不是只回答你,而是真的去操作文件、跑命令、调用工具。像一个全能管家。
Prompt(提示词)
你给 AI 的指令。说"帮我弄一下"和"帮我把 CSV 里 age 小于 0 的行删掉",结果天差地别。
MCP(模型上下文协议)
AI 连接外部工具的"USB 标准接口"。装一个 MCP Server,Agent 就能连数据库、操作浏览器、管理 GitHub。
Skill(技能包)
一段告诉 Agent "遇到这类问题怎么处理"的结构化指南。装上 PDF Skill,Agent 就知道怎么合并、拆分、加水印。
第四步:选你的第一个 AI Agent 工具
最重要的分岔口:你的网络能不能直接访问海外网站?
没有代理工具 / 国内网络
有代理工具 / 海外网络
- 追求最强能力 → Claude Code(全栈终端 Agent)
- 编码 + 聊天结合 → Cursor(AI 原生 IDE)
- ChatGPT 生态 → OpenAI Codex(终端 Agent,OpenAI 出品)
- 轻量补全 → GitHub Copilot(编辑器插件)
第五步:安装和使用你的第一个 Agent
以上一步推荐的 Trae 为例(零基础最友好的选择):
安装 Trae
- 打开 trae.ai 下载安装包
- 双击安装,一路默认选项
- 打开后登录(手机号注册)
- 打开你的代码项目文件夹
第一次用 Agent 的正确姿势
- 先让它认识你的项目:"帮我看看这个项目的结构"、"解释一下这个文件在做什么"
- 从简单任务开始:"帮我把这个变量的名字从 oldName 改成 newName"
- 建立信任后再给复杂任务:"给 User 模型加一个 avatar 字段,同步更新 API 和前端表单"
最重要的习惯:学会写好的提示词
别说"帮我优化性能",要说"这个 API 返回数据要 2 秒,帮我看一下有没有 N+1 查询问题"。写好提示词的完整指南
其他工具的详细安装教程在工具教程板块,每种工具都有独立教程。
第六步(进阶):用 CC Switch 把国产大模型接入 Claude Code
Claude Code 的操作体验是目前最好的,但官方 API 贵而且国内访问需要代理。CC Switch 解决了这个问题——你可以用 Claude Code 的壳 + DeepSeek 等国产模型的脑,成本低到几乎免费,而且国内直连。
核心思路:CC Switch 是一个桌面管理工具(9.6 万星),它集成了多家 API 中转服务商。你在中转商注册充值(支持微信/支付宝),拿到便宜的 API 地址,填进 CC Switch,就可以正常使用 Claude Code 了——不需要 Anthropic 官方账号,不需要代理。
第七步(进阶):给 Agent 装上 Skill 和 MCP
熟练掌握基础使用后,你会发现 Agent 有些事做不了——因为它缺少专业知识和外部连接。Skill 和 MCP 就是解决这个问题的。
Skill —— 给 Agent 专业知识
Skill 是一段告诉 Agent "遇到这类问题时怎么处理"的指南。比如装上 PDF Skill,Agent 就知道用什么 Python 库处理 PDF、合并时注意什么、怎么加水印。
- 去哪里找:skill.sh(在线目录)、GitHub 搜索 awesome-agent-skills
- 怎么装:
npx skills add 仓库名 --skill 技能名 -g -y - 完整 Skill 配置教程
MCP —— 连接外部系统
MCP Server 让 Agent 能操作数据库、浏览器、GitHub 等外部系统。每个 MCP Server 是一个"外接设备"——装一个,多一种能力。
- 去哪里找:GitHub 搜索 awesome-mcp-servers、mcp.so
- 怎么配:在 settings.json 里加几行 JSON 配置
- 完整 MCP 配置教程