OpenAI实现重大技术突破,模型推理成本降低一半
据新智元报道,OpenAI通过系统优化实现了重大技术突破,将模型推理成本降低了一半。这一突破将显著降低API调用成本,使得AI应用的大规模部署更加经济可行。
信息来源: AI/GPU行业早报 ->星期五
据新智元报道,OpenAI通过系统优化实现了重大技术突破,将模型推理成本降低了一半。这一突破将显著降低API调用成本,使得AI应用的大规模部署更加经济可行。
信息来源: AI/GPU行业早报 ->继OpenAI与Broadcom合作推出Jalapeño芯片后,Anthropic开始与三星探索自研芯片。三星已是NVIDIA主要代工伙伴,三方关系微妙。这标志着AI大模型公司正从单纯算法竞争转向软硬件一体化竞争。
信息来源: 今日AI速读 ->微软以25亿美元承诺成立自己的AI部署公司,6000名行业+工程专家组成,直接嵌入企业客户现场交付生产级AI代理系统。首批客户包括伦敦证交所、联合利华和埃森哲。
信息来源: 今日AI速读 ->Z.ai推出ZCode编程IDE,支持macOS/Windows/Linux,支持BYOK,20+工具和多代理协作。GLM Coding Plan用户享1.5倍配额加成。GLM-5.2在编程竞赛中以远低于竞品的成本提供有竞争力的输出。
信息来源: 今日AI速读 ->继Alexa+全面AI化后,Amazon进一步下探硬件层,开始为自家消费设备设计专用AI芯片。此举可降低对外部芯片供应商的依赖,提升端侧AI推理性能。
信息来源: 今日AI速读 ->阿里巴巴新AI框架不加载全部工具而是动态路由,Agent调用工具时的Token开销直降99%。当Agent面对成千上万个工具时,这套路由方案解决了核心瓶颈。
信息来源: 今日AI速读 ->可立点科技获得战略融资,聚焦"AI+机器人"养老场景,已推出主动陪伴机器人和康复助行转运机器人,均已完成工程样机开发。陪伴机器人具备健康监测、跌倒检测、语音情感识别等功能。
信息来源: AI/GPU行业早报 ->韩国科技信息通信部正讨论利用半导体繁荣带来的增量税收购买约1万个英伟达Vera Rubin GPU模块,并招募AI人才以推进自主AI模型开发。
信息来源: AI/GPU行业早报 ->硅羽科技(SPARO)专注于通用空中智能,已获耀途资本、锦秋基金、阿里巴巴、弘毅投资等机构押注。公司构建了多模态感知、端到端小脑、世界导航模型大脑及灵巧作业与集群协同全栈技术体系。
信息来源: AI/GPU行业早报 ->Sam Altman向FT透露此方案,目的是"确保与政府良好关系并回应政治反弹"。需国会批准。Sanders参议员则提出更激进的50% AI企业股票税法案。
信息来源: 今日AI速读 ->Google最新环境报告显示,AI数据中心的大规模扩建使公司总用电量一年暴涨37%,尽管公司称清洁能源努力也在同步推进。
信息来源: 今日AI速读 ->德国无人机+AI防御初创公司Quantum Systems在国防热潮中完成12亿美元融资,反映出AI+国防赛道的资本热度。
信息来源: 今日AI速读 ->将有害内容检测与拒绝响应进行联合优化,使模型在面对越狱攻击时更稳定地拒绝而非产生有害输出。对实际部署中的AI安全防护有直接工程价值。
信息来源: 今日AI速读 ->MIT等团队提出FurnitureVLA,实现双臂机器人的长序列家具装配。将VLA模型从简单抓取推进到真实世界的复杂操作任务。
信息来源: 今日AI速读 ->今日AI行业最显著的趋势是"软硬一体化"加速:OpenAI实现推理成本减半,Anthropic与三星洽谈定制芯片,微软成立25亿美元AI部署公司。这表明AI公司正从单纯的模型算法竞争,转向底层硬件、系统优化和落地能力的全面较量。
与此同时,AI应用场景持续拓展:阿里巴巴解决Agent Token消耗瓶颈,Z.ai推出编程IDE挑战Cursor,Amazon自研端侧AI芯片。这些产品级突破预示着AI正从"能用"走向"好用",开发者和终端用户体验将持续提升。
资本方面,韩国政府动用税收推进自主AI开发、Quantum Systems获12亿美元国防AI融资,显示全球各国和资本对AI领域的投入持续加码。AI治理也在同步推进,OpenAI提议捐股份给主权基金正是这一背景下的回应。