Представлен релиз проекта PoCL 3.0 (Portable Computing Language OpenCL), развивающего реализацию стандарта OpenCL, независимую от производителей графических ускорителей и позволяющую использовать различные бэкенды для выполнения OpenCL-ядер на разных типах графических и центральных процессоров. Код проекта распространяется под лицензией MIT. Поддерживается работа на платформах X86_64, MIPS32, ARM v7, AMD HSA APU, NVIDIA GPU и различных специализированных ASIP (Application-Specific Instruction-set Processor) и TTA-процессорах (Transport Triggered Architecture) c архитектурой VLIW...Подробнее: https://www.opennet.dev/opennews/art.shtml?num=57330
Это быстрее cuda?
Медленнее. Если вообще заработает.
Стандарт индустрии де-факто -- CUDA. А про опенцооль никто не слышал.
Да, увы, проприетарь победила. CUDA везде. Гегемония. Абсолютная монархия. Царизм. На долгие-долгие десятилетия вперёд. Про всякие жалкие ROCm и практически брошенный OpenCL никто из пилящих AI-решения не слыхал даже, потому, что они или тормозные, или неудобные. И вот, как следствие, их никто не делает ни удобными, ни быстрыми. А потом NVidia царским образом сдепрекейтит CUDу, как это неизбежно делает каждая корпорация, когда, посмотрев на графики котировок, возжелает перезагрузки. И все разрабы будут перепиливать свой код под новый фреймворк от той же NVidia. И никто не вспомнит ни про ROCm, ни про OpenCL.
Будто с опенсорсом такое не случается регулярно. С проприетарщиной вот не случается, качественная гарантированная поддержка и совместимость на десятилетия, это причина, почему используют CUDA.
>И все разрабы будут перепиливать свой код под новый фреймворк от той же NVidia.Не будут. CUDA взлетела в ИИ из-за cuDNN. Либа проприетарная, написанная невидией. Просто заменят начинку, оставив API.
Первое место в top500:Frontier - HPE Cray EX235a, AMD Optimized 3rd Generation EPYC 64C 2GHz, AMD Instinct MI250X, Slingshot-11
Третье место:
LUMI - HPE Cray EX235a, AMD Optimized 3rd Generation EPYC 64C 2GHz, AMD Instinct MI250X, Slingshot-11
10 место:
ADASTRA - HPE CRAY EX235A, AMD OPTIMIZED 3RD GENERATION EPYC 64C 2GHZ, AMD INSTINCT MI250X, SLINGSHOT-11
По энергоэффективности AMD заняла первые 4 места.
Нвидия на открытие дравера так то видимо стала расщедриваться после слива эн жирных контрактов более адекватному конкуренту. Который не вертит на известном месте своих кастомеров, впихивая левый блоб в их опенсорсную систему, что не очень хорошо работает.
> Нвидия на открытие дравера так то видимо стала расщедриваться после слива эн
> жирных контрактов более адекватному конкуренту. Который не вертит на известном месте
> своих кастомеров, впихивая левый блоб в их опенсорсную систему, что не
> очень хорошо работает.Treemaps за полгода вообще полностью изменился. Амуда 1/4 мощностей забрала за это время себе.
> Treemaps за полгода вообще полностью изменился. Амуда 1/4 мощностей забрала за это
> время себе.Ну так это заслуженно - и системным интеграторам так то меньше долботни будет. У амд те кому надо свежак - хотят просто последний линукс кернел. Это логично, хорошо работает, легко организуемо, заодно решает кучу других проблем. А теперь сравним с нвидией, телящейся месяцами с выпуском блоботы под новый кернел, поскольку руководитель проекта им фак на камену кажет, а спевшиеся с ним майнтайнеры еще и GPL_ONLY "технический фак" в подсистемах DRM/KMS вывешивают, так что нвидия и пыхтит потом месяцами тужась накодить свой эрзац тех подсистем - а в ядре всем плевать насколько им там (не)удобно. Логично что это ведет к куче технических проблем с глюкоблобом нвидии. И это вполне заслуженно и ожидаемо. Нвидия действительно думала что обыграет ядерщиков на их поле? :)
А это тут при чём вообще? Где-то в мире кто-то всё же использует ROCm для каких-то узкоспециальных научных целей, и что с того. Могли бы вообще самодельной либой пользоваться, учёным им весь остальной мир по барабану.
CDNA карты захватили 1/4 мощностей top500 за полгода. Это и есть самый жирный рынок, большое количество карт с большой маржой.
Вот купил я топовую карточку амд (дешевле в пересчете на gflops64, мне нужны именно операции с плавающей точкой двойной точности) и плюсом еще проц мощный.Как мне на всем этом запустить куду чтобы максимально эффективно использовать эти мощности?
AMD HSA APU
прикольно когда очередного брошенного амд детище спасает сообщество. а я ведь в 2014 году повёлся на красивые картинки и маркетинг, взяв 7850K. так ниразу и заюзал это детище. хз где кроме Libre Calc и Blender (до удаления OpenCL) я даже могу это использовать.
Это всё фигня, вот купить в 2009 году ноут на мобильном радике то ли 3650, то ли 3850 с гордой пометкой OpenCL-ready и пролететь, т.к. куцую-прекуцую поддержку оного запилили только в 4000-серии, это да.
Вообще, куда/опенцл, всё фигня, за SPIR будущее. OpenCL вообще непойми зачем нужен, если примерно всё то же самое можно делать на фрагментных шейдерах.
На шейдерах медленнее. Где то были бенчмарки.
Открытый сикель это печальное зрелище
Какие есть альтернативы для запуска одного и того же кода на cpu и gpu разных производителей?
Pocl это хорошо.