🔤 一、基础概念
AI Artificial Intelligence 概念
📖 词源:Artificial = 人造的,Intelligence = 智能。让人造物具备人类智能
🗣️ 人话:让机器像人一样思考和做事。扫地机器人、自动驾驶、ChatGPT 都是 AI,只是强弱不同。
AGI Artificial General Intelligence 概念
📖 词源:General = 通用的/全面的。具备人类全部智能的AI
🗣️ 人话:能完成任何人类能完成的智力任务,而不是只会一件事。扫地机只会扫地,AGI 能扫地、能做饭、能写代码、能陪你聊天。AGI 是 AI 的终极目标,目前还没实现。
LLM Large Language Model 概念
📖 词源:Large = 大规模,Language = 语言,Model = 模型。用海量文本训练的语言模型
🗣️ 人话:看过整个互联网文字后,能生成人类语言的AI大脑。ChatGPT、Claude、DeepSeek 本质都是 LLM——一个读了几千亿句话的超级"文字预测机器"。
Token Token 概念
📖 词源:Token = 代币/令牌。AI处理文本的最小单元
🗣️ 人话:AI不是按字或词处理,而是按"token"(约0.75个汉字 = 1 token)。你跟AI说的每句话、它生成的每个字,都要消耗token。ChatGPT按token计费,就是按"字数"计费。
Prompt Prompt / 提示词 概念
📖 词源:Prompt = 提示/激励。给AI的指令
🗣️ 人话:跟AI说的话就是Prompt。好的Prompt = 清晰的任务 + 足够的背景 + 明确的格式。写好Prompt本身就是一种技能,叫"提示工程"(Prompt Engineering)。
幻觉 Hallucination 概念
📖 词源:Hallucination = 幻觉。AI一本正经地胡说八道
🗣️ 人话:AI很会"编",它能把一个不存在的论文说得有模有样,把从没发生过的事描述得栩栩如生。这是因为AI本质是"文字接龙",它只管下一个字"像不像真的",不管"是不是真的"。
Transformer Transformer / 自注意力模型 方法
📖 词源:Transformer = 变压器/变形金刚。Google 2017年提出的革命性模型架构
🗣️ 人话:ChatGPT 之所以能理解长文章、能写代码、能做数学题,靠的就是这个架构。它让AI学会"瞻前顾后"——处理每个字时,同时考虑它和所有其他字的关系。相当于从"单线程阅读"升级到"全息扫描"。
Fine-tuning Fine-tuning / 微调 方法
📖 词源:Fine = 精细的,Tuning = 调参。在预训练模型基础上做针对性训练
🗣️ 人话:不用从零训练AI,而是在现成大模型基础上,用特定数据再训练一下,让它更懂你的领域。比如用医学文献微调,AI就能当半个医生。
Temperature Temperature / 温度参数 概念
📖 词源:Temperature = 温度。控制AI输出的随机性/创造性
🗣️ 人话:温度低 = AI很"保守",每次答案都一样;温度高 = AI很"发散",每次回答都不一样。写代码要低温度(准确),写小说要高温度(有创意)。
涌现 Emergent / Emergence 概念
📖 词源:Emergent = 涌现的。简单组件组合后产生复杂新行为
🗣️ 人话:小模型不会、大模型突然会的现象叫"涌现"。就像蚂蚁很简单,但蚁群能修桥、能种地——个体没有的能力,整体突然有了。
Scaling Law Scaling Law / 规模定律 概念
📖 词源:Scaling = 规模化,Law = 法则。模型越大能力越强的规律
🗣️ 人话:AI领域的"大力出奇迹"法则——参数越多、训练数据越多、算力越强,AI就越聪明。只要这三点持续增加,AI能力就能持续提升。这也是为什么各大厂疯狂砸钱堆显卡。
AI 幻觉 AI Hallucination 概念
📖 词源:Hallucination = 幻觉/错觉。AI生成看似真实但实际错误的内容
🗣️ 人话:AI一本正经地胡说八道——编造不存在的论文、捏造从未发生的事件细节、杜撰不存在的法规条文。它不是故意骗你,而是它的本质就是"文字接龙",只管"下一个字看起来对",不管"这件事是不是真的"。
🤖 二、模型家族
GPT Generative Pre-trained Transformer 模型
📖 词源:Generative = 生成式,Pre-trained = 预训练,Transformer = 变换器架构
🗣️ 人话:ChatGPT 的底层模型,OpenAI 出品。GPT-4 是目前最主流的通用大模型,GPT-4o 支持多模态(看图、听声音),GPT-4o-mini 是轻量省钱版。
Claude Claude / 克劳德 模型
📖 词源:名字来自计算机科学家 Claude Shannon(信息论之父)
🗣️ 人话:Anthropic 出品的 AI,主打"更安全、更helpful"。Claude 3.5 Sonnet 以性价比著称,在代码和写作上口碑极佳。擅长超长文本处理(支持 20 万 token)。
Gemini Gemini / 双子座 模型
📖 词源:Gemini = 双子座。Google 用来对标 GPT 的 AI 模型家族
🗣️ 人话:Google 自家的 AI,有 Ultra / Pro / Nano 三档。Gemini 1.5 Pro 支持 100 万 token 超长上下文。能直接运行在手机上的叫 Gemini Nano。原生多模态——从设计之初就是文字+图片+视频+音频一起训练的。
DeepSeek DeepSeek / 深度求索 模型
📖 词源:Deep = 深度,Seek = 求索。国产开源大模型公司
🗣️ 人话:国产之光,DeepSeek-V3 和 DeepSeek-R1 在数学和编程上表现接近 GPT-4,且 API 价格只有 GPT-4 的几十分之一。开源模型 DeepSeek-V3 可以本地部署,免费使用。
Kimi Kimi / 月之暗面 模型
📖 词源:Kimi = Kimi,月球背面。Moonshot AI(月之暗面)出品
🗣️ 人话:国内大模型,长上下文能力极强(支持100万汉字),擅长中英文对话,上下文记忆超长。Kimi+ 是它的智能体平台。
通义千问 Qwen / 阿里云 模型
📖 词源:Qwen = Q-wen(千问),寓意能回答千万种问题。阿里云出品
🗣️ 人话:阿里云的大模型家族,Qwen2 / Qwen2.5 系列全面开源可商用,支持几十种开源的尺寸(0.5B到72B),在中文场景表现优秀,API 便宜。
豆包 Doubao / 字节跳动 模型
📖 词源:Doubao = 豆包,字节跳动 AI 助手产品名
🗣️ 人话:字节跳动的 AI 助手,内嵌火山引擎大模型。豆包的最大优势是"超级便宜",API 价格几乎是最低档。也有 PC 和手机 App。
文心一言 ERNIE Bot / 百度 模型
📖 词源:ERNIE = Enhanced Representation through Knowledge Integration,百度自研模型
🗣️ 人话:百度的大模型产品,对标 ChatGPT。接入百度搜索和中英文翻译能力,在中文语境有积累。API 叫"文心一言 API"。
智谱清言 GLM / 智谱AI 模型
📖 词源:GLM = General Language Model,清华大学背景的 AI 公司
🗣️ 人话:清华大学技术团队创办,GLM-4 是主力模型。对中文理解能力强,ChatGLM 系列全面开源可本地部署,API 价格亲民。
Llama Llama / Meta 开源羊驼 模型
📖 词源:Llama = 大羊驼。Meta(Facebook)出品的开源大模型
🗣️ 人话:Meta 的开源大模型,相当于 AI 界的"安卓"。Llama 3 是目前最强的开源模型之一(70B),开源免费可商用,很多国产模型都是基于 Llama 微调的。
Mistral Mistral AI / 法国独角兽 模型
📖 词源:Mistral = 法国南部的一种干冷北风。法国最强 AI 公司
🗣️ 人话:法国 AI 独角兽,Mistral 7B 以"小而强"闻名——7B 参数就能打其他 13B 模型。MoE 模型 Mixtral 8x7B 性能接近 GPT-3.5,免费开源。
🛠️ 三、工具 & 平台
Coze Coze / 扣子 / BotStudio 平台
📖 词源:Coze = 扣子,像搭扣子一样拼装 AI 应用。字节跳动出品
🗣️ 人话:零代码搭 AI 机器人的平台,像搭积木一样把 AI 能力(聊天、画图、搜索等)组合起来,不需要写一行代码。Coze 中文版叫"扣子",海外版叫 Coze。搭好的 Bot 可以发布到抖音、微信、飞书等。
Dify Dify / 开源应用平台 平台
📖 词源:Dify = Define + Modify +ify,自己定义和修改的 AI 应用平台
🗣️ 人话:开源版 Coze,你可以自己部署在服务器上,不用担心数据跑到别人那里。适合有技术能力的人自建 AI 工作流。
n8n n8n / 工作流自动化 平台
📖 词源:n8n = node-based,手动操作节点的工作流引擎
🗣️ 人话:像乐高一样把各种服务(邮件、Slack、AI、数据库)拼成自动化流程的开源工具。比 Zapier 便宜(免费开源),比 Coze 更偏向 API 层面的自动化。
LangChain LangChain / LLM应用框架 平台
📖 词源:Lang = Language,Chain = 链,把 AI 和工具串起来的框架
🗣️ 人话:程序员用来快速开发 AI 应用的工具包。就像给程序员提供了一套"AI 乐高积木",不用从零写,就能让 AI 连接数据库、搜索网页、调用 API。LangGraph 是它的进阶版,支持复杂流程。
Cursor Cursor / AI编程IDE 工具
📖 词源:Cursor = 光标。AI加持的代码编辑器
🗣️ 人话:专门给程序员用的 AI 编程工具,基于 VS Code,支持 AI 自动补全代码、AI 帮你写整个函数、AI 解释代码。编程效率提升明显,按月订阅。
Hugging Face Hugging Face / 模型市场 平台
📖 词源:Hugging Face = 做鬼脸,AI 界的 GitHub + 模型商店
🗣️ 人话:全球最大的 AI 模型社区,程序员在这里分享和下载开源模型。也是 Transformers 库的开发者——几乎所有大模型底层都在用这个库。
OpenAI API OpenAI API / GPT 接口 平台
📖 词源:API = Application Programming Interface,AI的"遥控器"
🗣️ 人话:给程序员用的 GPT 接口,付钱调用,不限次数。比如你的应用接入 API,就能让 AI 帮你回复客服、分析数据、写文案。按 token 计费。
API Key API Key / 密钥 概念
📖 词源:Key = 钥匙。用API的"通行证"
🗣️ 人话:一串像密码的字符,告诉你"你有权用这个服务"。API Key 要保密——泄露了别人就能用你的额度,你来买单。
Assistants API OpenAI 助手接口 平台
📖 词源:Assistant = 助手。OpenAI 提供的现成 AI 助手框架
🗣️ 人话:比普通 API 更高级的接口,能让 AI 记住对话历史、自动调用工具、读文件,不用你自己写对话管理逻辑。
⚙️ 四、技术方法
NLP Natural Language Processing 方法
📖 词源:Natural = 自然语言(人话),Processing = 处理。AI理解人话的技术
🗣️ 人话:让 AI 能读懂、生成、分析人类语言的总称。GPT 属于 NLP,但 NLP 不等于 GPT——语音助手、翻译、情感分析都属于 NLP。
CV Computer Vision 方法
📖 词源:Computer = 计算机,Vision = 视觉。让计算机看懂图片/视频
🗣️ 人话:让 AI 看得懂图像和视频的技术。人脸识别、自动驾驶中的车道线检测、AI 给图片打分都属于 CV。
RAG Retrieval-Augmented Generation 方法
📖 词源:Retrieval = 检索,Augmented = 增强,Generation = 生成。AI回答前先去资料库搜一下
🗣️ 人话:AI回答问题之前先去你的资料库里查一下,就像开卷考试。防止 AI 胡说八道(幻觉)的核心技术。你把 PDF、文档丢给 AI,它先查再答,答案有据可查。
LoRA Low-Rank Adaptation / 低秩适配 方法
📖 词源:Low-Rank = 低秩,Adaption = 适配。用"小补丁"微调大模型
🗣️ 人话:不用重训整个大模型,只训练几个"小补丁"就能让 AI 学会新技能。省 99% 的算力,普通显卡也能微调。
MoE Mixture of Experts / 混合专家 方法
📖 词源:Mixture = 混合,Experts = 专家。让不同专家负责不同任务
🗣️ 人话:大模型内部有多个"专家",AI 只激活相关的那几个专家来回答问题,省大量算力。DeepSeek-V3、GPT-4 都被认为是 MoE 架构。
CoT Chain of Thought / 思维链 方法
📖 词源:Chain = 链条,Thought = 思维。让AI把思考过程说出来
🗣️ 人话:让 AI 先说解题思路再给答案。Prompt 里加一句"让我们一步步思考",AI 正确率能提高 20-30%。
扩散模型 Diffusion Model 方法
📖 词源:Diffusion = 扩散。AI"去噪"生成图片的核心算法
🗣️ 人话:AI 生成图片的原理:先给图片加噪点(扩散),再一步步去噪恢复(生成)。Stable Diffusion、DALL·E 3 都基于此。
GAN Generative Adversarial Network 方法
📖 词源:Generative = 生成,Adversarial = 对抗。两个AI互相对抗进步
🗣️ 人话:一个AI负责生成,一个AI负责"找茬",两者对抗着训练。生成器越画越好,判别器越来越挑,直到生成的图片骗过判别器。早期的AI换脸、深伪视频很多基于GAN。
📡 五、协议 & 接口
API Application Programming Interface 概念
📖 词源:Application = 应用,Programming = 编程,Interface = 接口。程序之间的"对话窗口"
🗣️ 人话:让两个软件互相"打电话"的接口。你的应用调用 GPT 的 API,就是把你的文字发给 GPT 服务器,把回答拿回来。
REST REST / RESTful API 概念
📖 词源:REST = REpresentational State Transfer,互联网最常用的API设计风格
🗣️ 人话:一种约定俗成的 API 格式——URL + HTTP 方法(GET查、POST增、PUT改、DELETE删)。GPT API 就是 REST 格式。
Webhook Webhook / 回调接口 概念
📖 词源:Web + Hook = 网页钩子。事件触发时自动通知你的接口
🗣️ 人话:不用你一直问"好了没",事情办完了服务器主动通知你。比如你调用 AI 生成一张图,Webhook 就是图生成好了之后自动发消息给你说"图好了,来拿"。
JSON JavaScript Object Notation 概念
📖 词源:JavaScript + Object + Notation。互联网数据传输格式
🗣️ 人话:一种人类容易读、程序容易解析的数据格式。AI 的输入输出基本都是 JSON。格式简单:{"键":"值"},键值对用冒号。
SSE Server-Sent Events / 服务器推送 概念
📖 词源:Server-Sent = 服务器发送,Events = 事件。服务器主动推送数据的技术
🗣️ 人话:让 AI 能一个字一个字输出给你看(流式输出)的技术。ChatGPT 打字效果就是 SSE——服务器不断发送,页面不断显示。
📦 六、部署 & 运维
Docker Docker / 容器技术 工具
📖 词源:Docker = 集装箱船。让应用在任何环境都能运行的容器技术
🗣️ 人话:把 AI 应用连同它的运行环境一起打包,"集装箱"式部署。你的代码在我电脑上跑,在我服务器上也跑,不存在"在我这明明好好的"问题。
GPU Graphics Processing Unit / 显卡 概念
📖 词源:Graphics = 图形,Processing = 处理。AI的"发动机"
🗣️ 人话:训练和运行 AI 必须靠显卡。GPU 并行计算能力比 CPU 强 100-1000 倍。NVIDIA(英伟达)是绝对霸主,A100/H100 是 AI 训练旗舰卡。
VPS Virtual Private Server / 虚拟服务器 概念
📖 词源:Virtual = 虚拟,Private = 私有,Sercver = 服务器。一台云上的电脑
🗣️ 人话:云服务商给你分配一台虚拟电脑,你可以在上面部署 AI 模型、搭网站、跑脚本。阿里云、腾讯云、AWS 都是常见 VPS 提供商。
GitHub GitHub / 代码托管平台 平台
📖 词源:Git = 代码版本管理工具,Hub = 中心。全球最大的代码托管平台
🗣️ 人话:程序员的"网盘",但专为代码设计。能追踪修改历史、多人协作、CI/CD 自动部署。开源项目基本都在 GitHub 上。
CI/CD Continuous Integration / 持续部署 概念
📖 词源:Continuous = 持续,Integration = 集成,Deployment = 部署。代码更新自动上线
🗣️ 人话:程序员提交代码 → 自动测试 → 自动部署上线,人工干预最少。提高效率、减少人为错误。
Nginx Nginx / Web服务器 工具
📖 词源:Nginx = Engine X的缩写。俄罗斯程序员Igor Sysoev创建的高性能Web服务器
🗣️ 人话:网站的"前台接待员"。用户访问你的网站时,Nginx负责接待、分配、转发请求。部署AI应用到服务器上,几乎都要配置Nginx。
边缘计算 Edge Computing 概念
📖 词源:Edge = 边缘/终端。在数据产生的"边缘"计算,而不是传到远端云服务器
🗣️ 人话:把AI塞到手机、电脑上直接跑,而不是把数据传到云端。好处:快(不用等网速)、省流量、隐私安全。手机上的AI助理就是边缘计算。
💼 七、商业 & 应用
SaaS Software as a Service 概念
📖 词源:Software = 软件,as a Service = 作为服务。软件不再是产品而是服务
🗣️ 人话:不再买断软件,而是按月/按量付费使用。ChatGPT Plus每月20美元 = SaaS。你用水用电也是SaaS模式——按用量付费,不是一辈子买断自来水管道。
AIGC AI-Generated Content 概念
📖 词源:AI = 人工智能,Generated = 生成的,Content = 内容。AI自动生成文字/图片/视频/音频
🗣️ 人话:所有AI创作出来的东西都叫AIGC。AI写的文章、AI画的图、AI做的视频、AI写的代码——全都是AIGC。本质上就是AI变现。
MVP Minimum Viable Product 概念
📖 词源:Minimum = 最小的,Viable = 可行的,Product = 产品。能验证想法的最简产品
🗣️ 人话:先做最简版本试水,上来就做完美的等于白干。你要卖笔记服务,MVP就是:用BibiGPT手动总结1个视频 → 挂闲鱼 → 有人买就继续 → 自动化减少人工。
MaaS Model as a Service 概念
📖 词源:Model = 模型,as a Service = 作为服务。AI模型按需供应
🗣️ 人话:SaaS是"软件服务",MaaS是"AI模型服务"。你不需要自训练模型,直接调用别人的模型API按量付费。OpenAI、阿里云都提供MaaS。就像你不需要建发电厂,直接用电就行。
PMF Product-Market Fit 概念
📖 词源:Product = 产品,Market = 市场,Fit = 匹配。产品正好满足市场需求
🗣️ 人话:你的产品有人愿意掏钱 = 达到PMF。没达到PMF = 你做的东西没人要。做笔记服务,有人买=PMF了,没人买=没PMF,需要调整产品方向。
护城河 Moat 概念
📖 词源:Moat = 城墙外的护城河。巴菲特投资理论核心概念,指企业的竞争护城河
🗣️ 人话:别人copy不了、抢不去的竞争优势。你的笔记服务,护城河是什么?是"一对一服务的理解力"还是"有垂直细分市场"?如果你的总结谁都能做,护城河就很浅。
数据飞轮 Data Flywheel 概念
📖 词源:Flywheel = 飞轮。源自物理中的飞轮效应——越转越快,停不下来
🗣️ 人话:用户越多→数据越多→AI越好→产品越好→用户更多。像飞轮一样越转越快,一旦转起来竞争对手就赶不上。这就是为什么ChatGPT越用越好——你的使用数据在训练它。
AI工作流 AI Workflow 概念
📖 词源:Work = 工作,Flow = 流程。一系列AI操作按顺序自动执行
🗣️ 人话:把多个AI步骤串起来自动跑。你给一个指令 → 工作流自动提取文字 → 自动总结 → 自动配色 → 自动生成PDF。你只管下指令,全程自动化。Coze就是干这个的。
🎨 八、多模态 & 创作
文生图 Text-to-Image / T2I 概念
📖 词源:Text = 文字,Image = 图片。输入文字描述,AI生成对应图片
🗣️ 人话:你说"一只穿着盔甲的猫在吃火锅",AI就画出来。Midjourney、DALL·E、Stable Diffusion都是文生图工具。
文生视频 Text-to-Video / T2V 概念
📖 词源:Text = 文字,Video = 视频。输入文字描述,AI生成视频
🗣️ 人话:文生图的升级版——从画一张图到拍一段视频。Sora、可灵(快手)、Vidu(生数科技)都是。能随便用,但很快就会饱和。
图生图 Image-to-Image / I2I 概念
📖 词源:Image = 图片。输入一张图,AI基于它生成新图
🗣️ 人话:给AI一张草图,它帮你画成美图。比如你的简笔画 → 变成精美插画。就像PS的"一变"功能,但强100倍。
ControlNet ControlNet 方法
📖 词源:Control = 控制,Net = 网络。给SD加一个"控制层",精确控制生成结果
🗣️ 人话:跟AI"说话"的技术。没有ControlNet:AI可能画出"坐着"的动作。有ControlNet:给一张姿势草图,AI就严格按照姿势画。就像从"随便画"变成"按图纸画"。
AI工作流 AI Workflow 概念
📖 词源:Work = 工作,Flow = 流程。一系列AI操作按顺序自动执行
🗣️ 人话:把多个AI步骤串起来自动跑。你给一个指令 → 工作流自动提取文字 → 自动总结 → 自动配色 → 自动生成PDF。你只管下指令,全程自动化。Coze就是干这个的。
Perplexity Perplexity.ai 平台
📖 词源:Perplexity = 困惑度(AI领域的专业指标,衡量模型对文本的"困惑程度"),也指"困惑"
🗣️ 人话:AI搜索引擎。你问问题,它不是给你一堆链接,而是直接给你答案+来源。就像一个帮你总结搜索结果的"助手"。国外最火的AI搜索,国内类似产品有秘塔AI搜索。
种子 Seed 概念
📖 词源:Seed = 种子。计算机中"随机种子"决定随机数的起点
🗣️ 人话:AI画图的"存档码"。同样的提示词 + 同样的种子 = 同样的图。换一个种子,风格类似但画面不同。你看到一张好看的AI图想复现,需要查它的种子号。
Checkpoint Checkpoint 概念
📖 词源:Check = 检查,Point = 点。游戏中的存档点。AI中指训练好的模型权重文件
🗣️ 人话:AI画图的"基础画布层"。不同的checkpoint = 不同的基础风格(在写实/动漫/古风上训练过)。就像在不同底稿上画画,出来的就是写实风、动漫风、古风。 Civitai就是分享checkpoint的网站。
正向/反向提示词 Positive / Negative Prompt 概念
📖 词源:Positive = 正面的(想要的),Negative = 负面的(不想要的)
🗣️ 人话:正向提示词="我要什么"(如:一片美丽的花海),反向提示词="我不要什么"(如:没有人、没有版权、不要模糊)。反向提示词就像"禁忌清单"——告诉AI不吃什么,避免翻车。
📌 本文收录 0 个AI名词 | 🔍 搜索或按 Ctrl+F 查找