Strassenov algoritmus

z Wikipédie, slobodnej encyklopédie

Strassenov algoritmus, pomenovaný podľa Volkera Strassena, je algoritmus na násobenie matíc. Oproti štandardnému algoritmu násobiacemu matice priamo podľa vzťahu z definície, s časovou zložitosťou , má Strassenov algoritmus o niečo lepšiu asymptotickú časovú zložitosť , čo znamená, že pre veľké matice je Strassenov algoritmus rýchlejší, než štandardný algoritmus.

Strassenov algoritmus nie je asymptoticky optimálny. Najrýchlejší známy algoritmus násobenia matíc, tzv. Coppersmithov–Winogradov algoritmus, má časovú zložitosť približne , ale vzhľadom na veľmi veľký konštantný faktor sa táto výhoda prejaví len pre extrémne veľké matice.

Algoritmus[upraviť | upraviť zdroj]

Nech matice typu (v prípade, že matice nie sú typu , je možné doplniť chýbajúce riadky a stĺpce nulami) nad okruhom . Označme súčin týchto matíc. Potom platí

kde a sú matice typu , pričom z definície násobenia matíc vyplýva, že platí

Štandardný algoritmus možno ekvivalentne prepísať tak, aby násobil matice rekurzívne podľa uvedených vzťahov. Myšlienkou Strassenovho algoritmu je vypočítať hodnoty pomocou iných ekvivalentných vzťahov tak, aby bol počet rekurzívnych volaní násobenia matíc menší (v prípade štandardného algoritmu 8 volaní, v prípade Strassenovho algoritmu len 7 volaní). Pri Strassenovom algoritme sa teda hodnoty počítajú pomocou tzv. Strassenových vzorcov, ktoré obsahujú len 7 násobení matíc typu

kde

Správnosť týchto vzťahov možno overiť úpravou uvedených maticových výrazov.

Pseudokód[upraviť | upraviť zdroj]

Strassenov algoritmus možno zapísať pomocou pseudokódu nasledujúcim spôsobom:

function strassen(A,B,n,min)
    if n < min
       return standard_multiply(A,B)
    else
       m := n / 2
     
       A11 := A[1..m,1..m]
       A12 := A[1..m,m+1..2*m]
       A21 := A[m+1..2*m,1..m]
       A22 := A[m+1..2*m,m+1..2*m]
       B11 := B[1..m,1..m]
       B12 := B[1..m,m+1..2*m]
       B21 := B[m+1..2*m,1..m]
       B22 := B[m+1..2*m,m+1..2*m]
      
       M1 := strassen(A12 - A22,B21 + B22)
       M2 := strassen(A11 + A22,B11 + B22)
       M3 := strassen(A11 - A21,B11 + B12)
       M4 := strassen(A11 + A12,B22)
       M5 := strassen(A11,B12 - B22)
       M6 := strassen(A22,B21 - B11)
       M7 := strassen(A21 + A22,B11)
      
       C11 := M1 + M2 - M4 + M6
       C12 := M4 + M5
       C21 := M6 + M7
       C22 := M2 - M3 + M5 - M7 
      
       init(C)
       C[1..m,1..m] := C11
       C[1..m,m+1..2*m] := C12
       C[m+1..2*m,1..m] := C21
       C[m+1..2*m,m+1..2*m] := C22
     
       return C    
    end.

V uvedenom pseudokóde, A a B sú násobené matice, n je ich rozmer a min je minimálny rozmer matice, pre ktorý sa namiesto Strassenovho algoritmu použije štandardný algoritmus (potrebné na ošetrenie triviálnych prípadov, pri vhodnej voľbe min tiež možno podstatne zlepšiť čas výpočtu).

Časová zložitosť[upraviť | upraviť zdroj]

Nech je počet aritmetických operácií, ktoré vykoná Strassenov algoritmus počas násobenia matíc typu Keďže pre sa pri každom rekurzívnom volaní sa vyvolá presne 7 rekurzívnych volaní násobenia a 18 krát sa použije sčitovanie matíc, ktorého časová zložitosť je pre maticu typu rovná platí rekurentný vzťah

Pomocou základnej vety o rekurentných vzťahoch (Master theorem) možno vypočítať, že platí

To znamená, že asymptotická časová zložitosť je lepšia ako pri štandardnom algoritme. Výraz však pri Strassenovom algoritme obsahuje podstatne väčší konštantný faktor, preto v praxi dosahuje Strassenov algoritmus lepší čas ako štandardný algoritmus len pre veľké matice.

Sú známe aj asymptoticky rýchlejšie algoritmy násobenia matíc, ako je Strassenov algoritmus, napr. Coppersmithov–Winogradov algoritmus má časovú zložitosť približne . Konštantný faktor v je však pri takýchto algoritmoch extrémne veľký, čo znamená, že Strassenov algoritmus dosahuje v praxi takmer vždy lepší čas.

Na druhej strane, najlepší známy dolný odhad časovej zložitosti algoritmu na násobenie matíc je . Nie je však známy žiaden algoritmus, ktorý by násobil matice v tomto čase.

Literatúra[upraviť | upraviť zdroj]

  • Aho, A. V.; Hopcroft, J. E.; Ullman, J. D.: The Design and Analysis of Computer Algorithms. Addison-Wesley, 1974.
  • Cormen, T. H.; Leiserson, Ch. E.; Rivest, R. L.; Stein, C.: Introduction to Algorithms (2nd ed.). MIT Press and McGraw-Hill, 2001.
  • Golub, G.; van Loan, C.: Matrix computations (3rd ed.). London: The Johns Hopkins University Press, 1996.

Pozri aj[upraviť | upraviť zdroj]

Externé odkazy[upraviť | upraviť zdroj]