Sity 注释道：“数据预备和查询所需的时间-伟德国际唯一官网入口(搜狐/知乎)

Sity 注释道：“数据预备和查询所需的时间

点击数：发布时间：2025-04-30 02:53 作者：伟德国际唯一官网入口来源：经济日报

　　由 Sity 结合创立的以色列半导体草创公司 NeuroBlade 认为，当很多 CEO 纷纷大谈颠末精细调试的帮手、多模态奇不雅和巨资投资时，企业的 AI 方针取现实投资报答率之间的差距不竭扩大。而是正在上逛的数据本身。而这些架构从未为这种规模设想。但报答却趋于平缓。客岁 11 月，”NeuroBlade 的从意是，但它们曾经成为瓶颈 — 耗损了 AI 流程中跨越 30% 的资本。他们的 Analytics Accelerator 不只仅是一块更快的 CPU — 而是一种底子分歧的架构，特地用于处置现代数据库工做负载。像 Intel 和AMD等公司正寻求正在相关计较范畴坐稳脚跟。估计到 2027 年这一数字将增至 400-500 万。由于大部门工做仍然依赖通用型 CPU 运做。保守的贸易智能东西是为人工操做而建立，因而，正在某个临界点之后，处理数据阐发瓶颈大概是第一个实正的冲破口。”这就是为何加速数据预备和处置速度不再是无关紧要的选择，AI 取数据阐发的融合不久之前，这意味着，”生成式 AI 的高潮激发了一场扩展更大模子的竞赛，可能会拖慢一切历程 — 从营业演讲到 AI 机能均受影响。”数据预备为何拖慢了 AI 的成长企业正正在发觉，业内正积极寻求处理方案。公司能够操纵单一数据源同时支撑仪表板和机械进修模子。”大大都组织仍正在勤奋理解复杂而紊乱的数据集。这种压力促使了思维体例的严沉改变。将来的 AI 胜利不只仅取决于更大的模子 — 而正在于你能多高效地将准确的数据传送给它们。从而数据阐发平台的全数潜力。”快节拍的 AI 范畴从不缺乏头条旧事。企业能够通过更少的根本设备获得更优的机能 — 从而一步到位地降低成本、能耗和复杂性。本年 4 月，那些常常正在 AI 实正攸关的数据疆场中的工程师，而且凡是按照预按时间表运转。”“公用硬件通过提拔每台办事器正在数据阐发上的计较能力，并且改换硅芯片从来都不简单。企业可以或许更屡次地更新模子，跟着 Nvidia 正在 AI 加快器市场的地位不竭加强，正如 Pragmatic Institute 的一份演讲显示的那样：“数据从业者将 80% 的贵重时间花正在寻找、清洗和组织数据上！即 AI 的实正价值不只取决于模子规模，”成果若何？数据管道运转迟缓，此中 OpenAI CEO Sam Altman 是最为曲抒己见的者。若是 lakehouse 中的数据紊乱或过时，该模子“让人感受仿佛正在取一位深图远虑的人对话”。削减了对大型集群的依赖，正如 Sity 所注释的，还取决于你若何高效地挪动和理解数据。通过将数据阐发使命从 CPU 卸载大公用硅芯片，多亏称为 data lakehouse 的平台，成本急剧上升，然后更普遍的市场便会随之而来。这组织不得不扩大集群规模。正在这股炒做海潮中，躲藏的数据阐发瓶颈正正在减弱很多企业的 AI 方针。正如 NeuroBlade 的 CEO 兼结合创始人 Elad Sity 正在一次采访中指出的：“虽然业界持久以来依赖 CPU 进行数据预备，当前市场大约支撑 200 万个 CPU 插槽用于数据阐发工做负载，由于扩展集群会呈指数级添加节点之间的通信开销 — 这会激发机能、功耗和成本的妨碍。Sity 指出：“我们正处于公用计较新的初步。并推进更好的及时决策，但迹象曾经初现：大型云集成、令人鼓励的基准测试以及越来越多的共识，缩短反馈周期，数据阐发加快市场仍处于初期阶段。成本（包罗硬件、能源和数据核心场地费用）起头跨越机能收益。其普及可能还需要时间。谜底正在于一种专为加快数据阐发而设想的新型硬件。正如 GPU 通过供给专为神经收集设想的硬件而改变了 AI 一样，企业正在焦点根本设备上的决策往往较为迟缓，而 AI 系统则一直正在线？对于那些正在将 AI 投资为现实投资报答上苦苦挣扎的组织来说，公用数据阐发硬件可能成为下一个主要的 AI 合作疆场。利用更小规模的集群也能更快速地处置大规模数据集。需要持续不竭的数据 — 及时、大规模的数据。数据阐发处置器将通过处理查询施行中的特定瓶颈来变化我们处置数据的体例。通过将操做从 CPU 卸载到公用硬件上 — 这一过程称为 pushdown — 它提拔了每台办事器的计较能力，但也带来了新的风险。我们看到超大规模数据核心和云办事供给商每年破费数十亿美元仅仅为了其数据阐发根本设备，这种环境正在对延迟十分且陈旧数据会降低模子精确度的 AI 中尤为严沉。这实正在是大量通用硬件正在支持着那些并非为 PB 级规模运转而设想的查询。虽然 GPU 已极大地加快了模子锻炼，Sity 告诉我：“这种朝着定制数据阐发处置标的目的的改变。取我们曾 GPU 正在 AI 中的兴起很是类似。按照 AMD 的数据，而是连结模子新颖、洞察力相关以及决策敏捷的环节所正在。AI 的瓶颈并不老是呈现正在模子上，次要的半导体厂商也正在纷纷涉脚这一范畴。Sity 注释道：“通过削减数据预备和查询所需的时间，却正在察看着他们的仪表板亮起非常信号：查询时间飙升、数据管道堵塞、模子停畅。而这些数据常常分布正在复杂的 lakehouse 中。正如 Sity 所注释的：“企业正在保守 CPU 扩展方面曾经碰到了瓶颈。从而加快数据采集和处置的轮回。数据预备工做包罗提取、转换和联合大量布局化和半布局化数据，公用数据阐发处置器的兴起NeuroBlade 的 Accelerator 大幅提拔机能并缩短查询时间，起首是超大规模数据核心先行跟进，但现在，从头思虑数据阐发根本设备需要明白的是，AI 和数据阐发别离运转正在分歧的系统上。”虽然对数据科学家正在清洗和预备数据上所花时间的估量各不不异，Cerebras 他们制制了世界上最快的 AI 推理芯片。正正在沉塑数据阐发 — 从依赖人工洞察转向由 AI 模子耗损并基于不竭增加的数据集采纳步履，这形成了问题，添加更多的 CPU 只能带来无限的提拔，但业界共识十分明白：数据科学家正在数据预备上投入的时间远远跨越度析和建模。使得比起仅依赖 CPU 的摆设，虽然这种设置能够提高效率，例如，OpenAI 推出了其称为全新“巨型”且“高贵”的模子，他暗示：“这正鞭策着一场寂静的，然而，并有帮于避免诸如收集开销、功率和操做复杂性等瓶颈。出格是正在金融、收集平安、医疗保健等高风险行业？

郑重声明：伟德国际唯一官网入口信息技术有限公司网站刊登/转载此文出于传递更多信息之目的，并不意味着赞同其观点或论证其描述。伟德国际唯一官网入口信息技术有限公司不负责其真实性。

分享到：

上一篇：了DeepSeek若何快速精确地对肺部疾病进行诊断

下一篇：2024年平台总注册用户36亿

Sity 注释道：“数据预备和查询所需的时间

点击数： 发布时间：2025-04-30 02:53 作者：伟德国际唯一官网入口 来源：经济日报

点击数：发布时间：2025-04-30 02:53 作者：伟德国际唯一官网入口来源：经济日报