[AI前沿] 揭开人工智能术语的神秘面纱，让你不再困惑

人工智能正在改变世界，同时也创造了一整套新的语言来描述这一过程。阅读五分钟的AI相关内容，你会遇到LLMs、RAG、RLHF等一长串术语，这些术语让即便是科技界的聪明人也感到困惑。以下是我们试图解决这一问题的术语表，随着领域的发展，我们会定期更新它，视作一个活文档，正如它所描述的AI系统。

AGI

人工通用智能（AGI）是一个模糊的术语，通常指在许多任务上比普通人更具能力的AI。OpenAI首席执行官Sam Altman曾将AGI描述为“可以作为同事雇用的中等人类智能的等价物”。

AI agent

AI代理是指使用AI技术为你执行一系列任务的工具，超越了基本的AI聊天机器人。它可以处理诸如报销、预订机票或餐桌，甚至编写和维护代码等任务。

API endpoints

API端点可视为软件背后的“按钮”，其他程序可以按下这些按钮以执行操作。开发人员使用这些接口构建集成，使得一个应用能够从另一个应用中提取数据。

Chain of thought

在AI上下文中，链式思维推理意味着将一个问题分解为更小的中间步骤，以提高最终结果的质量。这通常需要更长的时间，但答案更有可能是正确的。

Coding agents

编程代理是指能够自主执行步骤以完成目标的程序。它们不仅建议代码，还可以独立编写、测试和调试代码。

Compute

计算力通常指的是使AI模型运行的关键计算能力。这个术语常常是指提供计算能力的硬件，如GPU、CPU等。

Deep learning

深度学习是自我改进的机器学习子集，AI算法采用多层次的人工神经网络结构，使其能够进行更复杂的关联。

Diffusion

扩散是许多艺术、音乐和文本生成AI模型背后的技术。它通过逐渐“破坏”数据结构并添加噪声，旨在学习一种“反向扩散”过程。

Distillation

蒸馏是一种从大型AI模型中提取知识的技术，通过教师-学生模型的方式进行。

Fine-tuning

微调是指对AI模型进行进一步训练，以优化其在更具体任务或领域的表现。

GAN

生成对抗网络（GAN）是一种机器学习框架，支持生成AI的关键发展。

Hallucination

在AI行业中，幻觉是指AI模型生成不正确的信息，这是一个巨大的质量问题。

Inference

推理是运行AI模型的过程，它通过先前见过的数据做出预测或得出结论。

Large language model (LLM)

大语言模型是流行AI助手使用的模型，例如ChatGPT。

Memory cache

内存缓存是提升推理效率的重要过程，旨在减少模型可能需要运行的计算次数。

Neural network

神经网络是深度学习的基础结构，灵感来源于人脑神经元的互联通路。

Open source

开源是指软件或AI模型的底层代码对公众开放，允许任何人使用、检查或修改。

Parallelization

并行化意味着同时执行许多任务，是现代GPU设计的核心。

RAMageddon

RAMageddon是一个有趣的术语，指的是随机存取存储器（RAM芯片）短缺的趋势。

Recursive self-improvement

递归自我改进是AI模型在没有人类干预的情况下自我提升的能力。

Reinforcement learning

强化学习是一种通过尝试和反馈来训练AI的方式。

Token

在人与机器的沟通中，令牌是桥接人类语言和AI程序的基本构件。

Training

训练是开发机器学习AI的过程，涉及将数据输入模型以使其学习模式。

Transfer learning

迁移学习是一种使用先前训练的AI模型作为新模型的起点的技术。

Validation loss

验证损失是一个数字，告诉你AI模型在训练期间的学习效果。

Weights

权重是AI训练的核心，决定了在训练过程中不同特征的重要性。