从入门到运用:AI Agent 完全指南

零基础,一步一步来。读完这篇,你就能让 AI 帮你干活。

第一步:装上必要的工具

很多 AI Agent 依赖这些基础环境。全部免费,30 分钟搞定。

1. 安装 Git —— 学会给代码拍"快照"

Git 解决了一个什么痛点

想象你写一篇论文。你写了一份初稿,改了第二版,又改了第三版。为了保险,你可能会这样存文件:

论文_初稿.doc
论文_初稿_修改版.doc
论文_初稿_修改版_最终版.doc
论文_初稿_修改版_最终版_真的最终版.doc

这就是手动版本管理——混乱、占空间、不知道每个版本之间到底改了什么。

Git 就是解决这个问题的:每次你觉得"这个状态值得保存",就拍一张快照(叫 commit)。Git 会记录下这个版本和上个版本之间每一行的差异。什么时候想回到"昨天下午 3 点的那个版本",一条命令就能回去。

用"写书的团队"来理解 Git 的分支系统

一个团队在写一本书。书的主线(main 分支)是已经出版的内容,不能乱改。现在有三个人同时工作:

  • 张三想新加一章 → 他从主线分出一条分支(branch),叫"新章节"。他在这个分支上随便折腾,完全不影响主线。
  • 李四在修错别字 → 他也从主线分出一条分支,叫"修错字"。
  • 两个人各自在自己的分支上干活,互不干扰。等各自改完了,分别把内容合并(merge)回主线。

这就是 Git 的核心工作方式:主分支保持稳定,每个人在自己的分支上自由实验,改好了再合回去。不会有"你到底改了什么"或者"我的版本被你覆盖了"这种问题。

很多 AI Agent 工具(如 Claude Code)在操作文件时会自动用 Git 做版本追踪,所以需要你电脑上装了 Git。

安装步骤

  • 打开 git-scm.com,下载安装包,一路默认选项即可
  • 装完验证:终端输入 git --version
看视频教程:Git 环境搭建

2. 注册 GitHub —— 代码界的"百度网盘 + 朋友圈"

Git 和 GitHub 是什么关系

Git 是工具,装在你电脑上。GitHub 是网站,一个把 Git 仓库上传到云端保存的平台。

类比:Git 就像是拍照功能(在你手机里),GitHub 就像是百度网盘(在云端,别人也能看到)。你自己拍的照片存在手机上(本地 Git),上传到百度网盘后(GitHub),别人就能看到、下载、甚至帮你修图(协作)。

代码托管平台到底在"托管"什么

托管的不只是代码文件本身,还包括:

  • 全部版本历史:从项目创建第一天到此刻,每一次改动、谁改的、为什么改,全部留档。
  • Issues(问题跟踪):发现 bug?提一个 Issue。想要新功能?提一个 Issue。所有人能看到并回复。
  • Pull Requests(贡献通道):你想给某个开源项目贡献代码?你 fork 一份、改好、提交 PR。原作者审核通过后,你的代码就合并进主项目了。
  • Actions(自动化流水线):每次有新的代码提交,自动跑测试、自动部署到服务器。

GitHub 凭什么成为"代码托管平台"的代名词

  • 先发优势:2008 年上线,比其他平台早了几年积累用户。Google 要搜代码,绝大部分结果都在 GitHub 上。
  • 社交属性:可以"关注"一个开发者看他最近在写什么、"Star"一个项目收藏它、Fork 一份到自己的仓库里改。这让程序员有了一种类似微博/朋友圈的社交体验。
  • 开源社区的约定俗成:当 99% 的开源项目都把代码放在 GitHub 上时,第 100 个项目也只能放在 GitHub——否则别人找不到你。
  • AI 时代的不可替代性:你现在要学的 Skill、MCP Server、CLI-Anything、CC Switch——它们全部托管在 GitHub 上。你不注册 GitHub 账号,就没法从这些仓库下载资源,也没法给这些项目提 Issue 反馈问题。

注册步骤

  • 打开 github.com → 右上角 Sign up → 填邮箱、设密码、起用户名
  • 用户名建议用英文+数字(这是你的技术身份,以后别人会通过它找到你)
  • 收邮件验证 → 完成。免费账号。

3. 安装 Node.js —— 你的电脑上需要一个"万能工具箱"

Node.js 不是"又一种编程语言"

JavaScript 以前只能在浏览器里跑(做网页交互效果)。2009 年有人把它从浏览器里"抽"了出来,装到了电脑上——这就是 Node.js:让 JavaScript 能直接在电脑上运行,访问文件系统、执行命令行操作、启动服务器。

对小白来说,你不需要学 JavaScript。你只需要知道:Node.js 自带了一个叫 npm 的东西,它是全世界最大的"软件包仓库"。

npm:全世界最大的"应用商店",只是没有界面

手机上有 App Store 和各大应用市场,你需要什么 App 就搜一下、点安装。npm 就是编程世界的 App Store,只不过它没有界面——你在终端里敲一行命令:

npm install -g @anthropic-ai/claude-code

这一行命令做了手机上的"搜索→下载→安装→配置好桌面快捷方式"四件事。npm 仓库里有 200 多万个软件包,绝大部分 AI Agent 工具(Claude Code、Cursor MCP、Playwright MCP)都通过 npm 发布和安装。

还有一个你可能经常看到的命令 npx:它是 npm 的一个快捷方式,不用安装就能临时运行一个 npm 包。比如用它一键安装 Skill:

npx skills add 仓库名 --skill 技能名 -g -y

安装步骤

  • 打开 nodejs.org,下载 LTS 版本(长期支持版,最稳定)
  • 装完验证:node --versionnpm --version
看视频教程:Node.js 安装

4. 安装 Python —— 科学计算和自动化脚本的通用语言

Python 是全世界最流行编程语言之一。Aider、CLI-Anything、大量 MCP Server 和数据处理脚本都是用 Python 写的。你用这些工具的时候,它们在后台靠 Python 运转,你不一定需要学会写 Python,但必须有一个可用的 Python 环境。

Python 自带的 pip 是 Python 世界的包管理器,和 npm 一个作用:

pip install cli-anything-hub

不需要装 Anaconda 或 PyCharm,也不需要激活码。Python 从 python.org 下载完全免费,没有付费版、没有试用期、不需要注册账号。那些要钱的是 PyCharm 专业版之类的编程工具,你用不着。

安装步骤

  • 打开 python.org,下载最新版(3.11 以上)
  • Windows 用户特别注意:安装时一定要勾选 "Add Python to PATH",否则后面终端里找不到 python 命令
  • 装完验证:python --versionpip --version

5. 学会打开终端 —— 和电脑"直接对话"的窗口

平时你在电脑上操作是靠鼠标点来点去(图形界面)。终端是另一种操作方式——用纯文字命令控制电脑。很多 AI Agent 工具运行在终端里,你需要学会最基本的操作。

你不需要成为命令行高手,记住这三个核心操作就够了:

  • cd 文件夹名 —— 进入某个文件夹(就像在文件管理器里双击打开一个文件夹)
  • ls(Mac/Linux)或 dir(Windows)—— 列出当前文件夹里有什么文件
  • Ctrl+C —— 终止当前正在运行的程序

打开方式

  • Windows:Win+R → 输入 cmd 回车。推荐去微软商店免费下载 Windows Terminal,体验好很多
  • macOS:Cmd+空格 → 搜索"终端"

验证清单:终端里依次输入以下五条命令,每条都显示版本号就说明环境准备好了:

git --version          # 应显示 git version 2.x.x
node --version         # 应显示 v18.x.x 或更高
npm --version          # 应显示 9.x.x 或更高
python --version       # 应显示 Python 3.11.x 或更高
pip --version          # 应显示 pip 24.x 或更高

第二步:AI 是怎么从聊天进化到帮你干活的

你跟 Siri 说"今天天气怎么样"和你跟 Claude Code 说"帮我重构这个项目",虽然都叫 AI,但背后的能力差了四代。

代际 类型 能做什么 例子
1. 聊天机器人 一问一答 回答问题、翻译、闲聊。不记上下文,不能用工具。 早期 ChatGPT、Siri
2. 代码补全 编辑器内补全 你写一行,AI 补完剩下几行。不能对话。 早期 Copilot
3. AI 辅助编程 对话 + 上下文 理解项目结构、对话式改代码、跨文件操作。 Cursor Chat、Copilot Chat
4. AI Agent 自主执行 + 多工具 自己规划步骤、操作终端、读写文件、调用外部 API。不只是建议你做什么,而是自己去做。 Claude Code、Cursor Composer

你现在要学的,就是第 4 代:AI Agent。它能读懂你的项目、自己制定计划、动手写代码改文件、跑命令看结果——像一个真正的队友。

第三步:你必须懂的几个核心概念

不需要精通,知道这些词在说什么就行。每个概念在我们的术语词典里都有详细解释。

AI Agent(智能体)

能自己动手做事的 AI。不是只回答你,而是真的去操作文件、跑命令、调用工具。像一个全能管家。

Prompt(提示词)

你给 AI 的指令。说"帮我弄一下"和"帮我把 CSV 里 age 小于 0 的行删掉",结果天差地别。

MCP(模型上下文协议)

AI 连接外部工具的"USB 标准接口"。装一个 MCP Server,Agent 就能连数据库、操作浏览器、管理 GitHub。

Skill(技能包)

一段告诉 Agent "遇到这类问题怎么处理"的结构化指南。装上 PDF Skill,Agent 就知道怎么合并、拆分、加水印。

第四步:选你的第一个 AI Agent 工具

最重要的分岔口:你的网络能不能直接访问海外网站?

没有代理工具 / 国内网络

  • 零基础新手Trae(字节出品,全中文,免费,国内直连)
  • Java 后端开发通义灵码(阿里出品,完全免费)
  • 微信小程序开发CodeBuddy(腾讯出品)
  • 终端爱好者WorkBuddy(国产模型,中文终端)

有代理工具 / 海外网络

  • 追求最强能力Claude Code(全栈终端 Agent)
  • 编码 + 聊天结合Cursor(AI 原生 IDE)
  • ChatGPT 生态OpenAI Codex(终端 Agent,OpenAI 出品)
  • 轻量补全GitHub Copilot(编辑器插件)

不确定?按照学习路线图一步步走。想看全部工具对比?去工具对比表

第五步:安装和使用你的第一个 Agent

以上一步推荐的 Trae 为例(零基础最友好的选择):

安装 Trae

  1. 打开 trae.ai 下载安装包
  2. 双击安装,一路默认选项
  3. 打开后登录(手机号注册)
  4. 打开你的代码项目文件夹

第一次用 Agent 的正确姿势

  1. 先让它认识你的项目:"帮我看看这个项目的结构"、"解释一下这个文件在做什么"
  2. 从简单任务开始:"帮我把这个变量的名字从 oldName 改成 newName"
  3. 建立信任后再给复杂任务:"给 User 模型加一个 avatar 字段,同步更新 API 和前端表单"

最重要的习惯:学会写好的提示词

别说"帮我优化性能",要说"这个 API 返回数据要 2 秒,帮我看一下有没有 N+1 查询问题"。写好提示词的完整指南

其他工具的详细安装教程在工具教程板块,每种工具都有独立教程。

第六步(进阶):用 CC Switch 把国产大模型接入 Claude Code

Claude Code 的操作体验是目前最好的,但官方 API 贵而且国内访问需要代理。CC Switch 解决了这个问题——你可以用 Claude Code 的壳 + DeepSeek 等国产模型的脑,成本低到几乎免费,而且国内直连。

核心思路:CC Switch 是一个桌面管理工具(9.6 万星),它集成了多家 API 中转服务商。你在中转商注册充值(支持微信/支付宝),拿到便宜的 API 地址,填进 CC Switch,就可以正常使用 Claude Code 了——不需要 Anthropic 官方账号,不需要代理。

第七步(进阶):给 Agent 装上 Skill 和 MCP

熟练掌握基础使用后,你会发现 Agent 有些事做不了——因为它缺少专业知识和外部连接。Skill 和 MCP 就是解决这个问题的。

Skill —— 给 Agent 专业知识

Skill 是一段告诉 Agent "遇到这类问题时怎么处理"的指南。比如装上 PDF Skill,Agent 就知道用什么 Python 库处理 PDF、合并时注意什么、怎么加水印。

  • 去哪里找:skill.sh(在线目录)、GitHub 搜索 awesome-agent-skills
  • 怎么装:npx skills add 仓库名 --skill 技能名 -g -y
  • 完整 Skill 配置教程

MCP —— 连接外部系统

MCP Server 让 Agent 能操作数据库、浏览器、GitHub 等外部系统。每个 MCP Server 是一个"外接设备"——装一个,多一种能力。

  • 去哪里找:GitHub 搜索 awesome-mcp-servers、mcp.so
  • 怎么配:在 settings.json 里加几行 JSON 配置
  • 完整 MCP 配置教程