NVidia CUDA

December 09, 2016

9 декабря: Постигаю преимущества распараллеливания задач для выполнения на процессоре видеокарты (GPU).

Уже переделал кучу всего, чтобы максимально ускорить всю эту кучу вложенных циклов, но пока не смог полностью нагрузить видеокарту. Из 14 GPU Nodes работает полностью только Node1, плюс кое-что прыгает на Node7. Надо читать дальше…

6 декабря: Как я уже упоминал в посте чуть ниже, пишу я одну штуку на питоне. Вчера пришлось переписать “брутфорсную” часть этой тулзы с питона на си.

Сделал хитро так, с runtime генерацией кода питона, который, в свою очередь, генерирует си-код прям в файл “data.c” с входными данными для утилиты на си.

Но ситуацию это не спасло. 11 позиций, даже если каждая может иметь всего 100 вариантов - то - 1.e+22 комбинаций для перебора. :) Придется придумывать какой-то алгоритм….