Optimalizace sekvencí mapovaných funkcí na GPU pomocí jejich skládání
暂无分享,去创建一个
Během implementace mapovani funkci na soudobých GPU je třeba brat v potaz několik proti sobě působicich výkonnostnich faktorů. V ramci předchozi prace bylo navrženo dekompozicně-fůzni schema pro vytvařeni těchto implementaci a je v teto diplomove praci dale rozvedeno. Byl implementovan optimalizujici kompilator automatizujici výse uvedene schema a hlavnim přinosem teto prace jsou algoritmy generujici a prohledavajici stavový prostor vsech možných implementaci dane mapovane funkce. V ramci vyhodnoceni je prezentovan výkon generovaných implementaci spolu s vyhodnocenim složitosti jednotlivých algoritmů.