IPU i GPU, czyli czy Softbank po przejęciu Graphcore ma szansę zmierzyć się z Nvidią?
Niedawno pojawiła się wiadomość, że SoftBank przejął Graphcore, firmę często nazywaną „brytyjską Nvidią”. Graphcore to start-up z dziedziny sztucznej inteligencji, który zaprojektował nowy typ inteligentnej jednostki przetwarzającej (IPU).
W niektórych testach modeli jego wydajność przekroczyła wydajność systemów GPU NVIDIA, dlatego branża optymistycznie ocenia jego potencjał w zakresie konkurowania z procesorami graficznymi Nvidii.
Jak podaje TrendForce, jako procesor zaprojektowany specjalnie do obliczeń AI, znany również jako procesor AI, IPU przoduje w takich dziedzinach, jak głębokie uczenie się, uczenie maszynowe i przetwarzanie języka naturalnego, mogąc przyspieszyć różne zadania związane ze sztuczną inteligencją. Z drugiej strony procesor graficzny został początkowo zaprojektowany, aby sprostać wymaganiom renderowania grafiki i przetwarzania obrazu.
Wraz z szybkim rozprzestrzenianiem się sztucznej inteligencji i technologii dużych zbiorów danych, wysokowydajny procesor graficzny, znany z potężnych możliwości przetwarzania równoległego, może obsługiwać wiele punktów danych i zadań jednocześnie, przyspieszając w ten sposób procesy uczenia i wnioskowania, co razem umożliwia stopniowe stosowanie procesora graficznego w dziedzinie sztucznej inteligencji, szczególnie w zakresie głębokiego uczenia się i uczenia maszynowego.
Chociaż w domenie AI można używać zarówno IPU, jak i GPU, różnią się one znacznie pod kilkoma względami, takimi jak architektura obliczeniowa i architektura pamięci.
Wcześniej Lu Tao, prezes i dyrektor generalny na region Chin w Graphcore, wyjaśnił, że Graphcore C600 ma 1472 rdzenie przetwarzające na jednostkę IPU, zdolne do równoległej obsługi 8832 niezależnych wątków programu.
Dla porównania, procesor graficzny SM Core (Stream Multiprocessor Core) firmy NVIDIA ma około 100 rdzeni, różniących się w zależności od konfiguracji produktu. Jeśli chodzi o architekturę pamięci, procesory graficzne NVIDIA mają dwupoziomową strukturę pamięci. Pierwszy poziom składa się z około 40-50 MB pamięci w chipie, z podłączonym zewnętrznym HBM lub VRAM. Jednakże IPU Graphcore zawiera 900 MB wbudowanej pamięci SRAM, która jest dystrybuowana.
Lu podsumował, że architektura IPU wykazuje większe zalety w przypadku zadań o wysokich wymaganiach dotyczących rzadkości i dużych wymiarów w porównaniu z procesorem graficznym. W przypadku operacji macierzowych jego wydajność może być podobna do GPU lub nieco mniej konkurencyjna.