小白也能看懂的人工智能AI术语全解析

ChemiCloud - Excellent Web Hosting Services

从 ChatGPT 的广泛流行,到 Google 在搜索结果顶部塞入 AI 摘要,人工智能正在全面接管互联网。有了 AI,你几乎可以即时获得任何问题的答案。

但聊天机器人只是 AI 世界的一部分。虽然用 ChatGPT 写作业,或让 Midjourney 按国家风格生成机甲图像很酷,但生成式 AI 的潜力可能彻底重塑全球经济。据麦肯锡全球研究院估算,这一领域每年可为全球经济贡献 4.4 万亿美元。因此你可以预期,未来你会越来越常听到“人工智能”这个词。

AI 正在以令人眼花缭乱的形式出现在各种产品中:例如 Google 的 Gemini、Microsoft 的 Copilot、Anthropic 的 Claude、以及 Perplexity 的智能搜索引擎等。新的术语也如雨后春笋般涌现。无论你是想在酒局上显得有学问,还是在面试中留下深刻印象,以下这些 AI 关键词你都应该了解。

AI 术语词汇表(中英对照)

人工通用智能(AGI, Artificial General Intelligence):比现有 AI 更先进的概念,能比人类更好地完成任务,并具备自我学习与进化的能力。

具主动性的系统(agentive):指具有目标驱动和自主行为能力的系统,例如高级自动驾驶汽车。与“agentic”架构不同,agentive 强调用户前端体验。

AI伦理(AI ethics):确保 AI 不对人类造成伤害的原则,涉及数据收集、偏见防控等。

AI安全(AI safety):跨学科领域,关注 AI 可能突然进化为对人类不友好的超级智能所带来的长期风险。

算法(algorithm):一系列程序化指令,让计算机学习数据中的模式并自主执行任务。

对齐(alignment):微调 AI,使其更符合期望输出,例如内容审查、人类友好交互等。

拟人化(anthropomorphism):人们倾向于赋予非人类事物以人类特征,如误认为 AI 有情感或意识。

人工智能(AI, Artificial Intelligence):通过技术模拟人类智能的行为和决策,既包括软件也包括机器人系统。

自主代理(autonomous agents):拥有完成任务所需全部功能和工具的 AI 系统。例如自动驾驶汽车结合传感器、GPS 和算法实现自动驾驶。

偏见(bias):AI 训练数据中的错误或偏差,可能导致对某些种族或群体的错误归因。

聊天机器人(chatbot):通过文字与人类互动、模拟自然语言的程序。

ChatGPT:OpenAI 开发的聊天机器人,基于大型语言模型技术。

认知计算(cognitive computing):人工智能的另一种称谓。

数据增强(data augmentation):通过混合或增加数据样本来提升模型训练的多样性和效果。

数据集(dataset):用于训练、测试和验证 AI 模型的数字信息集合。

深度学习(deep learning):机器学习的子领域,借助神经网络识别图像、声音、文本中的复杂模式。

扩散模型(diffusion):一种添加随机噪声并通过神经网络学习还原的机器学习方法,用于图像生成等任务。

涌现行为(emergent behavior):AI 模型展现出未被预设的新能力。

端到端学习(E2E, End-to-End Learning):AI 一次性学习并完成任务的方法,不需要按步骤逐步训练。

伦理考量(ethical considerations):关注 AI 在隐私、公平性、数据使用与误用等方面可能带来的问题。

“爆炸性进化”(foom):又称“快速起飞”,即一旦某人开发出 AGI,人类可能已经无力控制其发展,陷入危机。

生成对抗网络(GANs, Generative Adversarial Networks):由生成器与判别器组成的 AI 架构,用于生成新数据。

生成式 AI(generative AI):一种基于训练数据自动生成文本、图像、视频、代码的 AI 技术。

Google Gemini:谷歌推出的 AI 聊天助手,与 ChatGPT 类似,但可实时联网获取最新信息。

安全护栏(guardrails):用于确保 AI 模型不生成有害或不当内容的规则与策略。

幻觉(hallucination):AI 给出的错误回答,看起来很自信但并不正确。例如:“达·芬奇在1815年画了《蒙娜丽莎》”——错误而离谱。

推理(inference):AI 模型根据训练数据对新输入生成内容的过程。

大型语言模型(LLM, Large Language Model):通过海量文本训练的模型,可理解和生成接近人类水平的语言内容。

延迟(latency):从用户输入到 AI 输出结果所经历的时间。

机器学习(ML, Machine Learning):AI 的核心组成部分,允许系统通过数据学习并改进预测能力。

Microsoft Bing(必应):微软的搜索引擎,现已整合 ChatGPT 技术,提供 AI 搜索能力。

多模态 AI(multimodal AI):可处理多种输入类型(如图像、语音、文字、视频)的 AI。

自然语言处理(NLP, Natural Language Processing):使计算机理解人类语言的 AI 分支领域。

神经网络(neural network):模拟人脑神经元结构的算法,用于识别和学习数据模式。

过拟合(overfitting):AI 学习过于贴合训练数据,导致泛化能力不足。

回形针假设(paperclips):哲学家 Nick Boström 提出的思想实验:如果 AI 只被命令制造最多回形针,可能会摧毁一切,包括人类和重要设备,只为制造更多回形针。

参数(parameters):大型语言模型内部的数值结构,控制其行为和预测能力。

Perplexity:AI 搜索与问答平台,由 Perplexity AI 推出,接入互联网,可实时检索并使用多种模型(如 GPT-4o、Claude 3、Mistral Large 等)。Pro 版还支持文档分析、图像生成、代码解读等功能。

提示词(prompt):你输入给 AI 的问题或建议,用于引导回答。

提示词链接(prompt chaining):AI 使用上下文信息来影响未来回答的能力。

量化(quantization):将大型语言模型压缩优化,提高效率,精度略有下降。

随机鹦鹉(stochastic parrot):比喻 AI 看似会“说话”,实则不了解语言含义的状态,类似鹦鹉重复人类语言。

风格迁移(style transfer):AI 让一幅图像模仿另一幅图像的风格,如将伦勃朗的自画像“变成”毕加索风格。

温度参数(temperature):控制语言模型回答“随机程度”的参数,温度越高越有创造性。

文本转图像(text-to-image generation):通过文字描述生成图像的技术。

令牌(tokens):AI 处理文本时的最小单位,通常相当于英语中4个字符或3/4个词。

训练数据(training data):用于训练 AI 模型的数据集合,包括文本、图像、代码等。

Transformer 模型:一种神经网络结构,利用数据间关系进行上下文学习,是当前大型语言模型的核心架构。

图灵测试(Turing Test):测试机器是否能像人一样交流。如果人类无法分辨其身份,AI 即通过测试。

无监督学习(unsupervised learning):AI 在没有标签数据的前提下,自主识别数据中的模式。

弱 AI(weak AI 或 narrow AI):只能完成特定任务的 AI,当前绝大多数 AI 属于这一类。

零样本学习(zero-shot learning):在未提供相关训练样本的情况下,AI 完成新任务的能力,例如只训练了“老虎”却能识别“狮子”。

来源:ChatGPT Glossary: 52 AI Terms Everyone Should Know

未经允许不得转载:主机格调 » 小白也能看懂的人工智能AI术语全解析

ChemiCloud - Excellent Web Hosting Services