Google DeepMind

AI快讯

谷歌Veo 3 AI的“字幕门”:为何这款先进的视频模型会生成恼人的乱码?

谷歌最新的视频生成AI模型Veo 3,在五月底发布后便引爆了创作热潮。它首次允许用户生成声音和对话,被誉为走出了“视频生成的默片时代”。然而,用户们很快发现,这个强大的工具存在一个令人费解且成本高昂的缺陷:它常常会不受控制地生成毫无意义的乱码字幕。 创作者的困境:高昂的试错成本 这个“字幕门”问题在于,即使用户在提示词中明确要求“不要添加任何字幕”,这种 &...
AI快讯

谷歌Gemini发展全解析:从2018到2025年多模态AI技术进化时间线

本文详细梳理了谷歌Gemini系列大型语言模型的发展历程,从2018年Transformer模型的诞生,到2025年Gemini 2的多模态输入支持,全面展示了谷歌在多模态AI、推理能力和安全合规方面的重大突破。文章涵盖Gemini各版本关键更新,包括文本生成、图像理解、代码生成、边缘计算优化及企业定制服务,深度解读了其对AI应用生态的影响。适合关注人工智能...