人工智能正在改变世界,同时也创造了一整套新的语言来描述这一过程。阅读五分钟的AI相关内容,你会遇到LLMs、RAG、RLHF等一长串术语,这些术语让即便是科技界的聪明人也感到困惑。以下是我们试图解决这一问题的术语表,随着领域的发展,我们会定期更新它,视作一个活文档,正如它所描述的AI系统。
AGI
人工通用智能(AGI)是一个模糊的术语,通常指在许多任务上比普通人更具能力的AI。OpenAI首席执行官Sam Altman曾将AGI描述为“可以作为同事雇用的中等人类的等价物”。
AI agent
AI代理是指使用AI技术为你执行一系列任务的工具,超越了基本的AI聊天机器人。它可以处理诸如报销、预订机票或餐桌,甚至编写和维护代码等任务。
API endpoints
API端点可视为软件背后的“按钮”,其他程序可以按下这些按钮以执行操作。开发人员使用这些接口构建集成,使得一个应用能够从另一个应用中提取数据。
Chain of thought
在AI上下文中,链式思维推理意味着将一个问题分解为更小的中间步骤,以提高最终结果的质量。这通常需要更长的时间,但答案更有可能是正确的。
Coding agents
编程代理是指能够自主执行步骤以完成目标的程序。它们不仅建议代码,还可以独立编写、测试和调试代码。
Compute
计算力通常指的是使AI模型运行的关键计算能力。这个术语常常是指提供计算能力的硬件,如GPU、CPU等。
Deep learning
深度学习是自我改进的机器学习子集,AI算法采用多层次的人工神经网络结构,使其能够进行更复杂的关联。
Diffusion
扩散是许多艺术、音乐和文本生成AI模型背后的技术。它通过逐渐“破坏”数据结构并添加噪声,旨在学习一种“反向扩散”过程。
Distillation
蒸馏是一种从大型AI模型中提取知识的技术,通过教师-学生模型的方式进行。
Fine-tuning
微调是指对AI模型进行进一步训练,以优化其在更具体任务或领域的表现。
GAN
生成对抗网络(GAN)是一种机器学习框架,支持生成AI的关键发展。
Hallucination
在AI行业中,幻觉是指AI模型生成不正确的信息,这是一个巨大的质量问题。
Inference
推理是运行AI模型的过程,它通过先前见过的数据做出预测或得出结论。
Large language model (LLM)
大语言模型是流行AI助手使用的模型,例如ChatGPT。
Memory cache
内存缓存是提升推理效率的重要过程,旨在减少模型可能需要运行的计算次数。
Neural network
神经网络是深度学习的基础结构,灵感来源于人脑神经元的互联通路。
Open source
开源是指软件或AI模型的底层代码对公众开放,允许任何人使用、检查或修改。
Parallelization
并行化意味着同时执行许多任务,是现代GPU设计的核心。
RAMageddon
RAMageddon是一个有趣的术语,指的是随机存取存储器(RAM芯片)短缺的趋势。
Recursive self-improvement
递归自我改进是AI模型在没有人类干预的情况下自我提升的能力。
Reinforcement learning
强化学习是一种通过尝试和反馈来训练AI的方式。
Token
在人与机器的沟通中,令牌是桥接人类语言和AI程序的基本构件。
Training
训练是开发机器学习AI的过程,涉及将数据输入模型以使其学习模式。
Transfer learning
迁移学习是一种使用先前训练的AI模型作为新模型的起点的技术。
Validation loss
验证损失是一个数字,告诉你AI模型在训练期间的学习效果。
Weights
权重是AI训练的核心,决定了在训练过程中不同特征的重要性。