主机格调AI日报(26.03.06):GPT-5.4发布、Gemini 3.1 Flash-Lite、Cursor推出自动化编码代理

主机格调AI日报(26.03.06):GPT-5.4发布、Gemini 3.1 Flash-Lite、Cursor推出自动化编码代理AI快讯主机格调

AI产业正经历从「对话工具」向「自主执行」的关键跃迁。OpenAI推出GPT-5.4双版本降低API成本40%,Google以Gemini 3.1 Flash-Lite极致定价抢占高频场景,而Cursor Automations标志着编码代理进入工作流自动化阶段。Agentic AI不再只是聊天,而是能主动观察,触发,执行任务的数字员工。与此同时,AWS医疗代理,Luma创意代理等垂直场景落地加速,企业级部署推动推理效率与成本优化成为核心战场。如何评估AI Agent的可靠性?边缘部署需要哪些基础设施?开发者正面临从「使用AI」到「工程化AI」的能力升级挑战。

OpenAI发布GPT-5.4:Pro与Thinking双版本上线

OpenAI发布GPT-5.4系列API模型,包含标准版gpt-5.4和增强版gpt-5.4-pro,同时推出支持深度推理的Thinking版本。新模型针对知识工作优化,API调用成本较GPT-4降低40%,上下文窗口扩展至256K tokens。

Gemini 3.1 Flash-Lite发布:成本降至前代1/8

Google发布Gemini 3.1 Flash-Lite,输入定价0.25美元/百万tokens,输出1.5美元/百万tokens,仅为前代Gemini 2.0 Flash-Lite价格的八分之一。该模型面向高频,低成本应用场景优化。

Cursor推出Automations:自动化编码代理系统

Cursor发布Automations功能,允许用户设置触发条件自动启动编码代理。支持代码库新增文件,Slack消息,定时任务等多种触发方式,实现开发工作流的端到端自动化。

Luma发布创意AI代理:Unified Intelligence模型驱动

Luma推出Luma Agents创意代理系统,基于自研Unified Intelligence多模态模型,可协调文本,图像,视频,音频生成工具,完成端到端创意内容生产。

AWS发布医疗专用AI代理平台Amazon Connect Health

AWS推出Amazon Connect Health医疗AI代理平台,支持患者预约排程,病历文档处理,身份核验等场景,面向医疗机构提供合规的语音与文本代理服务。

DiligenceSquared:AI语音代理重塑并购研究

初创公司DiligenceSquared使用AI语音代理自动执行目标公司客户访谈,替代传统管理咨询团队的人工尽调流程,将私募股权并购研究成本降低90%以上。

PyTorch集成FlashAttention-4:FlexAttention性能提升

PyTorch为Hopper和Blackwell架构GPU引入FlashAttention-4后端,FlexAttention模块通过自动生成CuTeDSL内核代码,实现自定义注意力模式的JIT编译优化。

Netflix收购Ben Affleck的AI影视后期公司InterPositive

Netflix收购AI影视后期公司InterPositive,该公司开发模型帮助制作团队基于自有拍摄素材进行智能剪辑,不生成合成演员或虚拟表演。

Weaviate 1.36发布:HFresh向量索引与Server-side Batching

向量数据库Weaviate发布1.36版本,新增HFresh向量索引预览版,Server-side Batching,对象TTL,异步复制优化等功能进入正式可用阶段。

Google移除JavaScript SEO警告:称建议已过时

Google从帮助文档中删除JavaScript可访问性指南,表示该建议已过时,Google爬虫已支持JavaScript渲染多年,网站无需额外配置即可被完整索引。

未经允许不得转载:主机格调 » 主机格调AI日报(26.03.06):GPT-5.4发布、Gemini 3.1 Flash-Lite、Cursor推出自动化编码代理

评论

8+5=