苹果正在与英伟达协作,思让 AI 的反应速率更快
2024-12-22近日,苹果与英伟达秘书协作,旨在加快和优化妄语语模子(LLM)的推感性能。 为了改善传统自回想 LLM 推理后果低和内存带宽小的问题,本年早些时候,苹果机器学习的不时东说念主员发布并开源了一种名为「ReDrafter」(Recurrent Drafter,轮回草稿模子)的揣摸解码时代。 ▲图源:GitHub 现在,ReDrafter 一经整合到英伟达的可膨胀推理决策「TensorRT-LLM」当中,后者是基于「TensorRT」深度学习编译框架的专为优化 LLM 推理而设想的开源库,复旧包括「