Amerykańskie sankcje nałożone na Chiny pod koniec 2019 roku miały zastopować rozwój technologiczny kraju. To było znacznie więcej niż tylko uderzenie w pozycję Huawei na rynku smartfonów. Częściowo efektem tych działań jest nowy chiński superkomputer, którego wydajność plasuje go na drugim miejscu na świecie. Udało się go stworzyć pomimo braku dostępu do amerykańskich układów graficznych.

- Chiny stworzyły nowy superkomputer LineShine, zbudowany z procesorów rodzimej produkcji.
- Architektura chińskiego superkomputera jest inna od znanych rozwiązań. Zamiast połączenia procesorów CPU z układami graficznymi GPU, wykorzystuje on wyłącznie CPU.
- Chiński superkomputer osiąga drugą najwyższą wydajność na świecie, ale to nie przekłada się ona na wszystkie zastosowania. Tradycyjne superkomputery wykorzystujące GPU o wiele lepiej sprawdzają się w trenowaniu modeli AI.
Sankcje, które pierwsza administracja Donalda Trumpa nałożyły na Chiny, to było znacznie więcej, niż próba zastopowania ekspansji Huawei pod pretekstem dbania o bezpieczeństwo narodowe. Huawei był nie tylko liderem rynku smartfonów, ale też przede wszystkim tworzył własne procesory w spółce HiSilicon, które nie były gorsze od amerykańskich odpowiedników.
Działania USA faktycznie zatrzymały rozwój chińskiej technologii, przede wszystkim procesorów i wręcz cofnęły je o kilka lat. Chińczycy stracili dostęp do amerykańskich rozwiązań i musieli rozwinąć własne. Po kilku latach udaje im się nadrobić technologiczną stratę.
Jak Apple zaczął przegrywać z Huawei, a Tim Cook kłamał inwestorom
Chiński superkomputer zaskakuje wydajnością. Jest zrobiony... inaczej

Superkomputer El Capitan (fot. Bloomberg / Getty Images)
Znane nam superkomputery są budowane na mniej więcej tej samej zasadzie. Wykorzystuję one procesory CPU do zadań ogólnych oraz jednocześnie wykorzystują procesory graficzne GPU do obliczeń równoległych oraz zastosowań AI, dzięki czemu możliwe jest osiągnięcie wysokiej wydajności na poziomie exaflopsów. Aktualnie najszybszy amerykański superkomputer El Capitan osiąga wydajność na poziomie 1,809 eksaflopsów.
Flopsy to jednostka mocy obliczeniowej komputerów, którą możemy określić jako liczba operacji wykonywanych na sekundę. Przedrostek oznacza krotność operacji, więc obecnie mamy megaflopsy, gigaflopsy, teraflopsy, petaflopsy oraz eksaflopsy. Jeden eksaflops oznacza miliard miliardów operacji na sekundę (10 do potęgi 18).
Wracając do tematu architektury superkomputerów, Chiny nie mają dostępu do wydajnych amerykańskich układów graficznych, a obecnie nie mają jeszcze odpowiednio wydajnych własnych. Dlatego też w chińskim Narodowym Centrum Superkomputerów (NSC) uruchomiony został komputer LineShine składający się z samych procesorów CPU. Konkretnie użyto 20 480 jednostek ARMv9, a każda zawiera dwa procesory LX2, których wydajność to 1,54 eksaflopsów, co jest obecnie drugim wynikiem na świecie.
Użyte procesory LX2 zostały zaprojektowane do zadań zawiązanych ze sztuczną inteligencją i obliczeniami o wysokiej wydajności (HPC). Oficjalnie NSC nie mówi, kto jest dostawcą procesorów, ale jak informuje Jon Paddie Research, są to procesory stworzone przez Huawei. Każdy procesor ma osiem klastrów po 38 rdzeni, co łącznie daje 304 rdzenie na jedną jednostkę. Każdy pojedynczy procesor LX2 ma zapewniać do 960 teraflopsów wydajności.
Chiński superkomputer to pokaz siły, ale jak możemy go odbierać?

Superkomputer Colossus wygenerowany przez Groka. Jeszcze sporo nauki przed nim... (fot. Grok)
Architektura chińskiego superkomputera ma swoje zalety. Oparcie jej wyłącznie na procesorach CPU omija wymagający transfer pomiędzy nimi a układami graficznymi, to upraszcza konstrukcje. Pozwala to również na udostępnianiu większej, bardziej spójnej puli pamięci, co jest przydatne podczas analizy bardzo obszernych zbiorów danych. Taka architektura jest też prostsza do integracji środowiskami HPC, służącymi do rozwiązywania skomplikowanych problemów, jak np. badania nad zmianami klimatu.
Przede wszystkim jednak jest to ogromny pokaz siły, zmniejszenie zależności od zachodu i pokazanie, że Chiny potrafią stworzyć wydajny superkomputer bazując wyłącznie na własnych rozwiązaniach. To sygnał mówiący – my też potrafimy.
Narwal Flow 2 zmierza na polski rynek. To jeden z najbardziej wyczekiwanych robotów
Nie wszystko jest jednak tak idealne. Porównywanie wydajności superkomputerów to niestety jedno wielkie – to zależy. A konkretnie zależy od tego, do czego są zbudowane i wykorzystywane. Bo o ile wspomniany wcześniej El Capitan osiąga wydajność 1,809 exaflopsów, tak biorąc pod uwagę samo trenowanie modeli AI ustępuje on wydajności superkomputera Colossus Elona Muska. Jego ogólna wydajność nie jest znana, ale już w zastosowaniach związanych tylko z AI, jego szczytowa wydajność to nawet 497,7 exafplosów.
Dlatego też, jeśli ktoś spodziewa się, że superkomputer LineShine spowoduje, że chińska AI zanotuje spektakularny rozwój i dogoni modele amerykańskie to nie. Tutaj tradycyjna konstrukcja CPU+GPU nadal jest niedościgniona. A przy tym, wbrew pozorom, jest to architektura bardziej energooszczędna, niż rozwiązanie chińskie. Bez konkretnych danych trudno jest podać precyzyjne wartości, ale wydajność energetyczna chińskiego superkomputera może być od kilku do kilkunastu razy niższa.
