你的位置:凤凰彩票官网首页 - Welcome > 学校简介 > 凤凰彩票首页 谷歌新内存时刻“炸”了存储芯片阛阓 闪迪暴跌超11%

凤凰彩票首页 谷歌新内存时刻“炸”了存储芯片阛阓 闪迪暴跌超11%

时间:2026-03-29 09:05 点击:68 次

凤凰彩票首页 谷歌新内存时刻“炸”了存储芯片阛阓 闪迪暴跌超11%

3月27日音问,据媒体报说念,好意思东时辰3月26日,存储芯片股集体重挫,闪迪跌超11%,希捷跌逾8%,超威半导体、西部数据跌逾7%,好意思光科技跌近7%。

业内东说念主士分析,这一波动源自谷歌探讨院行将在国外学习表征会议(ICLR 2026)上崇拜亮相的学术论文,该探讨推出了一种新式AI内存压缩时刻“TurboQuant”。

谷歌声称,该时刻可将大谈话模子推理中的缓存内存占用压缩至六分之一,并在英伟达H100 GPU上终了最高8倍的性能加快。

九游娱乐 36, 36); text-wrap-mode: wrap; background-color: rgb(247, 247, 247);">AI模子初始时存在一种“使命内存”,即KV缓存(Key-Value Cache)。每当模子科罚信息、生成回当令,KV缓存便会飞速扩张,且凹凸文窗口越长,缓存占用的内存越大。

TurboQuant本色上是一种极致的量化压缩算法,传统量化关节需要在压缩精度和非凡存储支拨之间协调,凤凰彩票官网首页而谷歌团队通过PolarQuant(极坐标量化)和QJL(量化JL变换)两项改动,终明显在“零耗损”前提下将KV缓存压缩至3-bit精度。

Cloudflare首席实行官将这一后果称为谷歌的“DeepSeek时刻”,以为其有望像DeepSeek相同,通过极致服从大幅拉低AI的初始资本。

图片

不外,摩根士丹利在最新研报中指出,阛阓对此存在误读。该时刻仅作用于推理阶段的键值缓存,并不影响模子权重所占用的高带宽内存(HBM),也与AI测验任务无关。

分析师强调,所谓的“6倍压缩”并非存储总需求的减少,而是通过服从提高加多单GPU的隐晦量。这意味着在交流硬件条目下,不错赈济4倍至8倍更长的凹凸文,或在不触发内存溢出的前提下显赫提高批科罚界限。

现在,谷歌尚未公布TurboQuant在Gemini等自研模子中的具体部署时辰表凤凰彩票首页,探讨团队打算不才个月的ICLR 2026会议上崇拜发布策划后果。

本站仅提供存储做事,统统内容均由用户发布,如发现存害或侵权内容,请点击举报。 杏彩(XingCai)官网平台
回到顶部
服务热线
官方网站:http://www.ncybedu.com/
工作时间:周一至周六(09:00-18:00)
联系我们
QQ:888888888
邮箱:@http://www.ncybedu.com/
地址:武汉东湖新技术开发区光谷大道国际企业中心
关注公众号

Copyright © 1998-2026 凤凰彩票官网首页 - Welcome™版权所有

ncybedu.com 备案号 备案号: 赣ICP备15012886号

技术支持:®凤凰彩票  RSS地图 HTML地图