富士通の新アーキテクチャPHOTON、GPU効率を最大475倍と主張
PHOTONは少ないGPUで動かせる新しいLLMアーキテクチャだ。GPU当たりのスループットが現行の Transformer の最大475倍に達するとされる。運用GPUを抑えることでコスト削減が見込まれる点が注目される。今後の適用範囲や実運用での安定性が焦点となるだろう。
出典: 「Transformerの最大475倍」 富士通、GPUを効率的に使うLLMアーキテクチャ「PHOTON」開発
出典: 「Transformerの最大475倍」 富士通、GPUを効率的に使うLLMアーキテクチャ「PHOTON」開発