主机格调AI日报(26.03.05)：Gemini 3.1 Flash-Lite发布、Qwen团队变动、Google搜索AI模式更新

Simon

2 月前

本文目录 隐藏

1 Gemini 3.1 Flash-Lite发布：Google推出超低价AI模型

2 阿里Qwen技术负责人离职，开源模型未来引关注

3 Google搜索AI模式更新：食谱类结果展示调整

4 WordPress官方发布AI插件：集成Claude、Gemini、OpenAI

5 Claude解决数学界开放问题，AI推理能力获认可

6 Amazon Nova AI挑战赛回归：开放模型定制权限

7 NVIDIA发布电信AI蓝图：自主网络与AI-RAN落地

8 Hugging Face整合GGML与llama.cpp：强化本地AI生态

9 PyTorch解锁Llama 3.1-8B推理能力：DGX Spark本地微调方案

10 Weaviate发布Agent Skills库：简化生产级AI Agent构建

AI模型迭代进入性价比竞争阶段，Google推出Gemini 3.1 Flash-Lite以超低定价抢占市场，而阿里Qwen团队核心成员离职引发开源社区担忧。与此同时，Google搜索的AI模式正在重塑流量格局，WordPress官方接入三大AI模型降低建站门槛。如何本地部署DeepSeek？RTX 4090跑大模型要多少显存？这些问题正成为开发者关注焦点。

Gemini 3.1 Flash-Lite发布：Google推出超低价AI模型

Google发布Gemini 3.1 Flash-Lite，输入价格仅0.25美元/百万token，输出1.5美元/百万token，成本降至前代1/8。该模型面向成本敏感场景，与Claude、GPT-4o等形成差异化竞争。

阿里Qwen技术负责人离职，开源模型未来引关注

阿里巴巴Qwen团队技术负责人林俊旸离职，此前团队刚发布Qwen 3.5系列开源模型。该系列模型性能表现突出，核心人员变动引发社区对Qwen后续发展的担忧。

Google搜索AI模式更新：食谱类结果展示调整

Google针对创作者反馈优化AI Mode食谱展示方式，调整链接呈现逻辑以平衡AI摘要与原创内容引流，回应SEO行业对搜索流量流失的担忧。

WordPress官方发布AI插件：集成Claude、Gemini、OpenAI

WordPress推出三款官方AI插件，支持直接接入Claude、Gemini或OpenAI，帮助站长无需代码即可在网站嵌入AI功能，降低AI应用部署门槛。

Claude解决数学界开放问题，AI推理能力获认可

图灵奖得主Donald Knuth透露，Claude Opus 4.6在三周内解决了他研究数周的开放数学问题。该混合推理模型展现出的数学推理能力引发学术界关注。

Amazon Nova AI挑战赛回归：开放模型定制权限

Amazon Nova AI挑战赛首次向参赛学生开放Nova Forge模型定制权限，允许基于前沿模型构建可信软件Agent，推动AI Agent学术研究发展。

NVIDIA发布电信AI蓝图：自主网络与AI-RAN落地

NVIDIA发布面向电信行业的Agentic AI蓝图和推理模型，推动自主网络从愿景变为现实。报告显示网络自动化已成为电信AI投资的首要场景。

Hugging Face整合GGML与llama.cpp：强化本地AI生态

GGML和llama.cpp项目正式加入Hugging Face，确保本地AI推理技术的长期发展。此举将加速端侧大模型部署工具的整合与优化。

PyTorch解锁Llama 3.1-8B推理能力：DGX Spark本地微调方案

PyTorch发布在NVIDIA DGX Spark上完整微调Llama 3.1-8B的技术方案，使消费级硬件运行具备推理能力的本地模型成为可能，降低AI开发硬件门槛。

Weaviate发布Agent Skills库：简化生产级AI Agent构建

向量数据库Weaviate推出Agent Skills库，支持通过单条提示词在Claude Code、Cursor等工具中构建生产级Agent工作流，简化RAG应用开发流程。

退出移动版