Цього тижня на конференції Cloud Next компанія Google анонсувала нове покоління свого чіпа для прискорення штучного інтелекту TPU.
Про це повідомляє видання expert.com.ua.
Чіп, названий Ironwood, є сьомим поколінням TPU від Google та першим, спеціально оптимізованим для інференції — процесу запуску моделей ШІ. Очікується, що він стане доступним для користувачів Google Cloud наприкінці року, в двох варіантах: кластер з 256 чіпів та кластер з 9216 чіпів.
“Ironwood — це наш найпотужніший, найефективніший та найенергоощадніший TPU”, — зазначив віце-президент Google Cloud Амін Вахдат у блозі, опублікованому на TechCrunch. “Цей чіп був створений для обробки мислячих інференційних моделей ШІ в масштабах“.
З виходом Ironwood, конкуренція на ринку ШІ-прискорювачів стає ще жорсткішою. Хоча компанія Nvidia є лідером на цьому ринку, інші технологічні компанії, зокрема Amazon і Microsoft, також просувають свої власні рішення. Amazon пропонує процесори Trainium, Inferentia та Graviton через AWS, а Microsoft розміщує екземпляри Azure з чіпом Cobalt 100 AI.
Ironwood забезпечує до 4,614 TFLOP обчислювальної потужності на пікових значеннях, згідно з внутрішніми тестами Google. Кожен чіп оснащений 192 ГБ оперативної пам’яті з пропускною здатністю, що наближається до 7,4 Тбіт/с.
Чіп має спеціалізоване ядро SparseCore, яке оптимізоване для обробки даних, що використовуються у задачах “розширеного ранжування” та “рекомендаційних системах”, таких як алгоритми, що пропонують користувачеві товари або послуги на основі його вподобань. Архітектура TPU була спроектована з урахуванням мінімізації переміщення даних і затримок, що дозволяє знижувати споживання енергії.
Найближчим часом Google планує інтегрувати Ironwood з новим модульним обчислювальним кластером Гіперкомп’ютера ШІ, доступним у Google Cloud, додав Вахдат.
“Ironwood — це важливий прорив в епоху інференцій, з покращеними обчислювальними потужностями, обсягом пам’яті, мережевими досягненнями та надійністю“, — підсумував він.
