Нa кoнфeрeнции Hot Chips 33 кoмпaния Samsung сooбщилa o плaнax встрaивaть ускoритeли вычислeний вo всe типы oпeрaтивнoй пaмяти oт смaртфoнoв дo кoмпьютeрoв, видeoкaрт и сeрвeрoв. Этo пoзвoлит увeличить прoизвoдитeльнoсть плaтфoрм и усилить иx энeргoпoтрeблeниe. Сaмoe приятнoe, чтo чипы пaмяти с ускoритeлями мoжнo испoльзoвaть вмeстo oбычнoй пaмяти, а программная помощник довольно простая, сколько уже заинтересовало разработчиков CPU и GPU.
Кэш PIM (processing-in-memory, подсчеты в памяти) применительно к чипам HBM2 шайка-лейка Samsung показала в феврале сего года. Каждый микросхема HBM2 вооружался программируемым ИИ-ускорителем производительностью 1,2 терафлопс (FP16) и был способным обрабатывать хранящиеся в памяти показания непосредственно, не перегоняя их в основополагающий процессор и обратно. Сегодняшний день компания сообщила, яко работает над вооружением ускорителями расчётов всех основных типов оперативной памяти, фигли обещает появление PIM-блоков в подсистемах ноутбуков, видеокарт и в среднем далее.
Следует хватить, что сегодня PIM-фазотрон забирает под себя взять половину площади кристалла памяти, что же не очень привлекательно с точки зрения наращивания объёмов. В будущем Samsung обещает добавить ускоритель, представляя тутти более и более плотные микросхемы ОЗУ всех типов. В частности, угоду кому) чипов HBM третьего помоления шайка-лейка обещает ту но ёмкость для PIM-HBM3, зачем и для обычных микросхем HBM3. Хоть предположить, что сие возможно благодаря стековой структуре этой памяти.
Окружение HBM-PIM (теперь это бренд Samsung Aquabolt-XL) вставляются раскрепощенно в стек HBM2 на ту а самую подложку-управляющее устройство, что и раньше. Тем самым стеки HBM2 попроще простого подменить стеками с включением HBM-PIM, заменив одни сверху другие. Такие гибридные стеки были испытаны компанией Xilinx сообща с продуктами Alveo минус каких-либо модификаций процессоров и адаптеров (монтажной платы аль интерпозера). По сообщению партнёров, режим подскочила в 2,5 раза с одновременным снижением потребления энергии возьми 62 %. Такую но операцию, уверяют в Samsung, не возбраняется провести с GPU и CPU со сходовый компоновкой и разработчики сих решений уже заинтересовались предложением компании.
Про самых нетерпеливых Samsung предлагает готовое вотум в виде модулей AXDIMM DDR4 (Acceleration DIMM). Модули имеют гидробуфер, который помогает приготовлять данные в памяти, вместе с тем работая со всеми рангами DRAM получай планке. Такой узел устанавливается в обычный сервер в банальный слот памяти. Всю работу — обработку данных в памяти с точностью FP16 с применением стандартных процедур TensorFlow и Python — часть обеспечивает самостоятельно, а Samsung делает аминь возможное, чтобы защитить поддержку других программных инструментов.
Компашечка заявляет, что её тесты (проведённые получи рабочей нагрузке Facebook AI) показали нарастание производительности в 1,8 раза, спуск энергопотребления на 42,6 % и снижение задержки хвоста в 70 % с 2-ранговым комплектом. Полно это повторим, за исключением. Ant. с доработок в стандартном сервере, будто, безусловно, впечатляет.
В мобильных платформах, коль скоро говорить о применении PIM с чипами LPDDR5 и подобной, расходование вычислений в памяти принесёт такого типа же ряд новых возможностей. Часа) компания лишь моделирует такие процессы, же со временем они обещают зародиться в ноутбуках и даже смартфонах. К примеру (сказать), для памяти LPDDR5X-6400 заявлено ревалоризация производительности в 2,3 раза рядом рабочих нагрузках объединение распознаванию речи, в 1,8 раза рядом преобразовании перевода и в 2,4 раза близ генерации текста GPT-2. Сии улучшения производительности сопровождаются снижением потребления в 3,85, 2,17 и 4,35 раза адекватно. Другой вопрос, идеже это выйдет бери рынок? Ведь буква технология пока безлюдный (=малолюдный) стала стандартом, утверждённым JEDEC.