Войти через соцсеть:
Войти через email:
* рассказать что такое GEMM(general matrix multiplication)
* области применения в ML(MLP, CV, Attention, ... ) и других областях например анализе графов(что бы показать широту возможного применения)
* рассказать в общих словах про подходы к реализации и оптимизации для GPU
* показать пример реализации с нуля(но тоже кратко, и остановиться только на самых интересных/важных местах) для CUDA или OpenCL
* показать сравнительные тесты производительности своей реализации c cuBLASS, cutalss, CLBlast и CPU реализациями например MKL и OpenBLASS