改进的激光方法与更快的矩阵乘法——论文阅读

举报
DuHz 发表于 2025/09/13 20:41:37 2025/09/13
【摘要】 改进的激光方法与更快的矩阵乘法Josh Alman and Virginia Vassilevska Williams. 2021. A refined laser method and faster matrix multiplication. In Proceedings of the Thirty-Second Annual ACM-SIAM Symposium on Discret...

改进的激光方法与更快的矩阵乘法

Josh Alman and Virginia Vassilevska Williams. 2021. A refined laser method and faster matrix multiplication. In Proceedings of the Thirty-Second Annual ACM-SIAM Symposium on Discrete Algorithms (SODA '21). Society for Industrial and Applied Mathematics, USA, 522–539.

Josh Alman 和 Virginia Vassilevska Williams 在这篇发表于2021年SIAM的论文中,通过对激光方法的精妙改进,成功将矩阵乘法指数ω\omega的上界从2.37287降低到2.37286。虽然改进幅度看似微小,但这代表了自1986年以来该领域采用的核心技术方法的一次重要突破。

第一章:引言与背景

1.1 矩阵乘法复杂度问题

矩阵乘法的算法复杂度是理论计算机科学中最引人入胜的开放问题之一。问题的核心在于确定指数ω\omega,它定义为:

ω:=inf{rR:n×n矩阵可以用O(nr)次域运算相乘}\omega := \inf\{r \in \mathbb{R} : n \times n \text{矩阵可以用} O(n^r) \text{次域运算相乘}\}

从定义可以看出,ω2\omega \geq 2(因为必须输出n2n^2个元素),而朴素算法给出ω3\omega \leq 3。自1969年Strassen证明ω<2.81\omega < 2.81以来,一长串研究工作发展出了强大的技术工具箱,最终在本文之前达到了ω<2.37287\omega < 2.37287的最佳界限。

矩阵乘法算法的发展历程可以概括为几个关键阶段。早期工作(1969-1986)主要关注于发现新的递归算法结构。从1986年开始,Strassen引入的激光方法成为主导技术,所有后续改进都基于这一框架。Coppersmith和Winograd在1990年引入的CW张量族成为分析的核心对象。

1.2 激光方法的原理

激光方法的核心思想可以通过以下步骤理解。考虑一个张量TT,其变量集被划分为X=X1XkXX = X_1 \cup \cdots \cup X_{k_X}Y=Y1YkYY = Y_1 \cup \cdots \cup Y_{k_Y}Z=Z1ZkZZ = Z_1 \cup \cdots \cup Z_{k_Z}。对于每个三元组(i,j,k)(i,j,k),定义子张量:

Tijk=xXiyYjzZkaxyzxyzT_{ijk} = \sum_{x \in X_i} \sum_{y \in Y_j} \sum_{z \in Z_k} a_{xyz} \cdot xyz

假设每个TijkT_{ijk}要么为0,要么是矩阵乘法张量。虽然TT是这些矩阵乘法张量的和,但通常不是直和。激光方法通过以下巧妙方式解决这个问题:

首先,在非零子张量上选择概率分布α\alpha,对TijkT_{ijk}赋予概率αijk\alpha_{ijk}。然后考虑大的Kronecker幂:

Tn=(T1,,Tn){Tijk}nT1TnT^{\otimes n} = \sum_{(T_1,\ldots,T_n) \in \{T_{ijk}\}^n} T_1 \otimes \cdots \otimes T_n

目标是零化TnT^{\otimes n}中的变量,使得剩余的是BB个不同子张量T1T2TnT_1 \otimes T_2 \otimes \cdots \otimes T_n的直和,这些子张量与α\alpha一致,即对每个(i,j,k)(i,j,k),有{[n]:T=Tijk}=αijkn|\{\ell \in [n] : T_\ell = T_{ijk}\}| = \alpha_{ijk} \cdot n

第二章:张量理论基础

2.1 张量运算的形式化定义

F\mathbb{F}为任意域,定义张量TT在变量集X={x1,,xX}X = \{x_1, \ldots, x_{|X|}\}Y={y1,,yY}Y = \{y_1, \ldots, y_{|Y|}\}Z={z1,,zZ}Z = \{z_1, \ldots, z_{|Z|}\}上为三线性形式:

T=i=1Xj=1Yk=1ZaijkxiyjzkT = \sum_{i=1}^{|X|} \sum_{j=1}^{|Y|} \sum_{k=1}^{|Z|} a_{ijk} \cdot x_i y_j z_k

两个张量的直和TTT \oplus T'定义在不相交并XXX \sqcup X'YYY \sqcup Y'ZZZ \sqcup Z'上。Kronecker积TTT \otimes T'定义在笛卡尔积X×XX \times X'Y×YY \times Y'Z×ZZ \times Z'上:

TT=i,j,k,i,j,kaijkbijk(xi,xi)(yj,yj)(zk,zk)T \otimes T' = \sum_{i,j,k,i',j',k'} a_{ijk}b_{i'j'k'} \cdot (x_i, x'_{i'})(y_j, y'_{j'})(z_k, z'_{k'})

2.2 矩阵乘法张量

a×b×ca \times b \times c矩阵乘法张量a,b,c\langle a,b,c \rangle定义为:

a,b,c=i[a]j[b]k[c]xijyjkzki\langle a,b,c \rangle = \sum_{i \in [a]} \sum_{j \in [b]} \sum_{k \in [c]} x_{ij}y_{jk}z_{ki}

这个张量编码了a×ba \times b矩阵与b×cb \times c矩阵相乘的三线性形式。关键性质包括:

a,b,cd,e,fad,be,cf\langle a,b,c \rangle \otimes \langle d,e,f \rangle \equiv \langle ad,be,cf \rangle

这对应于分块矩阵乘法的事实。

2.3 Schönhage渐近和不等式

Schönhage在1981年证明的一个关键结果表明,不仅单个矩阵乘法张量的秩可以给出ω\omega的界限,多个矩阵乘法张量的直和也可以:

定理 2.1 (Schönhage, 1981) 假设存在正整数r>mr > mai,bi,cia_i, b_i, c_ii[m]i \in [m]),使得张量

T=i=1mai,bi,ciT = \bigoplus_{i=1}^m \langle a_i, b_i, c_i \rangle

满足R~(T)r\tilde{R}(T) \leq r。则ω3τ\omega \leq 3\tau,其中τ[2/3,1]\tau \in [2/3, 1]是方程

i=1m(aibici)τ=r\sum_{i=1}^m (a_i \cdot b_i \cdot c_i)^\tau = r

的解。

第三章:Coppersmith-Winograd张量族

3.1 CW张量的定义与结构

对于非负整数qq,Coppersmith-Winograd张量CWqCW_q定义在变量集{x0,,xq+1}\{x_0, \ldots, x_{q+1}\}{y0,,yq+1}\{y_0, \ldots, y_{q+1}\}{z0,,zq+1}\{z_0, \ldots, z_{q+1}\}上:

CWq=x0y0zq+1+x0zq+1y0+xq+1y0z0+i=1q(x0yizi+xiy0zi+xiyiz0)CW_q = x_0y_0z_{q+1} + x_0z_{q+1}y_0 + x_{q+1}y_0z_0 + \sum_{i=1}^q (x_0y_iz_i + x_iy_0z_i + x_iy_iz_0)

这个张量可以分解为:

  • 三个"角项":x0y0zq+1x_0y_0z_{q+1}x0zq+1y0x_0z_{q+1}y_0xq+1y0z0x_{q+1}y_0z_0
  • 三个矩阵乘法张量:i=1qx0yizi1,1,q\sum_{i=1}^q x_0y_iz_i \equiv \langle 1,1,q \ranglei=1qxiy0ziq,1,1\sum_{i=1}^q x_iy_0z_i \equiv \langle q,1,1 \ranglei=1qxiyiz01,q,1\sum_{i=1}^q x_iy_iz_0 \equiv \langle 1,q,1 \rangle

3.2 CW张量的自然划分

CWqCW_q具有自然的变量划分:

  • X0={x0}X^0 = \{x_0\}X1={x1,,xq}X^1 = \{x_1, \ldots, x_q\}X2={xq+1}X^2 = \{x_{q+1}\}
  • Y0={y0}Y^0 = \{y_0\}Y1={y1,,yq}Y^1 = \{y_1, \ldots, y_q\}Y2={yq+1}Y^2 = \{y_{q+1}\}
  • Z0={z0}Z^0 = \{z_0\}Z1={z1,,zq}Z^1 = \{z_1, \ldots, z_q\}Z2={zq+1}Z^2 = \{z_{q+1}\}

非零子张量恰好是满足i+j+k=2i+j+k=2TijkT_{ijk},使得CWqCW_q成为2-划分张量。

第四章:改进的激光方法

4.1 主要定理

本文的核心贡献是以下改进的激光方法定理:

定理 4.1(改进的激光方法) 对于任何PP-划分张量TT,任何αD\alpha \in D,以及任何τ[2/3,1]\tau \in [2/3, 1],有:

Vτ(T)αVταBαNmaxβDαβNV_\tau(T) \geq \alpha_{V_\tau} \cdot \alpha_B \cdot \sqrt{\frac{\alpha_N}{\max_{\beta \in D_\alpha} \beta_N}}

其中:

  • αB=(i[kX]αXiαXi)1/3(j[kY]αYjαYj)1/3(k[kZ]αZkαZk)1/3\alpha_B = \left(\prod_{i \in [k_X]} \alpha_{X_i}^{-\alpha_{X_i}}\right)^{1/3} \left(\prod_{j \in [k_Y]} \alpha_{Y_j}^{-\alpha_{Y_j}}\right)^{1/3} \left(\prod_{k \in [k_Z]} \alpha_{Z_k}^{-\alpha_{Z_k}}\right)^{1/3}
  • αN=(i,j,k)Sαijkαijk\alpha_N = \prod_{(i,j,k) \in S} \alpha_{ijk}^{-\alpha_{ijk}}
  • αVτ=(i,j,k)SVτ(Tijk)αijk\alpha_{V_\tau} = \prod_{(i,j,k) \in S} V_\tau(T_{ijk})^{\alpha_{ijk}}
  • DαD_\alpha是与α\alpha具有相同边缘分布的概率分布集合

与之前的界限Vτ(T)αVταBαNmaxβDαβNV_\tau(T) \geq \alpha_{V_\tau} \cdot \alpha_B \cdot \frac{\alpha_N}{\max_{\beta \in D_\alpha} \beta_N}相比,新方法通过因子maxβDαβNαN\sqrt{\frac{\max_{\beta \in D_\alpha} \beta_N}{\alpha_N}}实现了改进。

4.2 证明策略

证明分为四个主要步骤。考虑大的正整数nn和张量T=TnTrnTrrn\mathcal{T} = T^{\otimes n} \otimes T^{r \otimes n} \otimes T^{rr \otimes n}。目标是证明T\mathcal{T}可以被零化为

αB3no(n)αN1.5no(n)maxβDαβN1.5no(n)\frac{\alpha_B^{3n-o(n)} \cdot \alpha_N^{1.5n-o(n)}}{\max_{\beta \in D_\alpha} \beta_N^{1.5n-o(n)}}

个不同张量的直和,每个具有值αV3n\alpha_V^{3n}

步骤1:移除与α\alpha不一致的块

定义XIX_II[kX]nI \in [k_X]^nα\alpha一致,如果对所有i[kX]i \in [k_X]

αXi=1n{[n]:I=i}\alpha_{X_i} = \frac{1}{n} \cdot |\{\ell \in [n] : I_\ell = i\}|

零化所有至少有一个分量与α\alpha不一致的XX-块、YY-块或ZZ-块。剩余块的数量为:

NB=(i[kX]αXiαXi)no(n)(j[kY]αYjαYj)no(n)(k[kZ]αZkαZk)no(n)=αB3no(n)N_B = \left(\prod_{i \in [k_X]} \alpha_{X_i}^{-\alpha_{X_i}}\right)^{n-o(n)} \cdot \left(\prod_{j \in [k_Y]} \alpha_{Y_j}^{-\alpha_{Y_j}}\right)^{n-o(n)} \cdot \left(\prod_{k \in [k_Z]} \alpha_{Z_k}^{-\alpha_{Z_k}}\right)^{n-o(n)} = \alpha_B^{3n-o(n)}

步骤2:计数非零块三元组

(β,β,β)(\beta, \beta', \beta'')一致的非零块三元组数量为:

(βNβNβN)no(n)(\beta_N \cdot \beta'_N \cdot \beta''_N)^{n-o(n)}

特别地,与(α,α,α)(\alpha, \alpha, \alpha)一致的块三元组数量为Nα=αN3no(n)N_\alpha = \alpha_N^{3n-o(n)}

步骤3:使用Salem-Spencer集合稀疏化

定义哈希函数hX,hY,hZh_X, h_Y, h_ZZM\mathbb{Z}_M,其中M[100R,200R]M \in [100R, 200R]是素数,R=Nα/NBR = N_\alpha/N_B。使用Salem-Spencer集合AZMA \subseteq \mathbb{Z}_M,满足AM1o(1)|A| \geq M^{1-o(1)},零化所有不哈希到AA中值的块。

步骤4:应用对角化定理

应用定理3.1将剩余张量转化为至少

L233C13/2C31/2αB3no(n)αN1.5no(n)maxβDαβN1.5no(n)L \geq \frac{2}{3\sqrt{3}} \cdot \frac{C_1'^{3/2}}{C_3^{1/2}} \geq \frac{\alpha_B^{3n-o(n)} \cdot \alpha_N^{1.5n-o(n)}}{\max_{\beta \in D_\alpha} \beta_N^{1.5n-o(n)}}

个与(α,α,α)(\alpha, \alpha, \alpha)一致的块三元组的直和。

第五章:优化算法与启发式方法

5.1 固定γ\gamma时的优化

对于固定的γD\gamma \in D,优化所有αDγ\alpha \in D_\gamma上的界限可以通过求解两个凸规划问题完成:

问题1: 最大化 αVταBαN\alpha_{V_\tau} \cdot \alpha_B \cdot \sqrt{\alpha_N},约束条件:αDγ\alpha \in D_\gamma

问题2: 最大化 βN\beta_N,约束条件:βDγ\beta \in D_\gamma

这两个问题都是在线性约束下最大化凹函数,可以高效求解。

5.2 选择γ\gamma的启发式方法

论文提出了四种启发式方法:

启发式1: 选择γ\gamma最大化γVτγB\gamma_{V_\tau} \cdot \gamma_B,满足γ=argmaxγDγγN\gamma = \arg\max_{\gamma' \in D_\gamma} \gamma_N

启发式2: 选择γ\gamma最大化γVτγB\gamma_{V_\tau} \cdot \gamma_B

启发式3: 选择γ\gamma最大化γVτγB+λ/γN\gamma_{V_\tau} \cdot \gamma_B + \lambda/\gamma_N,其中λ\lambda是可调参数

启发式4: 选择γ\gamma最大化γVτγBγN\gamma_{V_\tau} \cdot \gamma_B \cdot \sqrt{\gamma_N}

实验表明,启发式3在λ\lambda取0到10710^7之间的正值时通常给出最好的结果。

第六章:数值结果

6.1 对CWqtCW_q^{\otimes t}的分析

对于tt次幂的CW张量,定义映射κ:{0,1,,q+1}{0,1,2}\kappa: \{0,1,\ldots,q+1\} \to \{0,1,2\}

  • κ(0)=0\kappa(0) = 0
  • κ(i)=1\kappa(i) = 1 对于 i{1,,q}i \in \{1,\ldots,q\}
  • κ(q+1)=2\kappa(q+1) = 2

对于I{0,1,,2t}I \in \{0,1,\ldots,2t\},定义:

Lt,I={A{0,1,,q+1}t:=1tκ(A)=I}L_{t,I} = \{A \in \{0,1,\ldots,q+1\}^t : \sum_{\ell=1}^t \kappa(A_\ell) = I\}

6.2 子张量的合并现象

某些子张量可以通过"合并"获得更大的值。例如,T2202T^2_{220}可以合并为:

T2202i=0q+1xi,iyi,iz0,0q+2,1,1T^2_{220} \equiv \sum_{i=0}^{q+1} x_{i,i}y_{i,i}z_{0,0} \equiv \langle q+2, 1, 1 \rangle

因此Vτ(T2202)=(q+2)τV_\tau(T^2_{220}) = (q+2)^\tau,这比单独处理各部分得到的值更大。

6.3 最终界限

应用改进的激光方法到CW532CW_5^{\otimes 32},对于τ=2.3728596/3\tau = 2.3728596/3,得到:

Vτ(CW532)>732+9.19×1022V_\tau(CW_5^{\otimes 32}) > 7^{32 + 9.19 \times 10^{22}}

结合Schönhage不等式和R~(CW5)=7\tilde{R}(CW_5) = 7的事实,这给出:

ω<2.3728596\omega < 2.3728596

附录A:概率分析的技术细节

A.1 边缘分布的保持

引理 A.1 对于任何αD\alpha \in D和足够大的正整数nn,存在αD\alpha' \in D使得:

  • αijk\alpha'_{ijk}1/n1/n的整数倍
  • αijkαijk<1/n|\alpha_{ijk} - \alpha'_{ijk}| < 1/n

证明:SSS' \subseteq Sαijk\alpha_{ijk}不是1/n1/n整数倍的(i,j,k)(i,j,k)集合。对每个(i,j,k)SS(i,j,k) \in S \setminus S',令αijk=αijk\alpha'_{ijk} = \alpha_{ijk}。初始时,对每个(i,j,k)S(i,j,k) \in S',令αijk=nαijk/n\alpha'_{ijk} = \lfloor n \cdot \alpha_{ijk} \rfloor/n

因为(i,j,k)Sαijk=1\sum_{(i,j,k) \in S} \alpha_{ijk} = 1,设t=(i,j,k)Sαijkt = \sum_{(i,j,k) \in S} \alpha'_{ijk}。则:

1t=(i,j,k)S(αijkαijk)Sn1 - t = \sum_{(i,j,k) \in S'} (\alpha_{ijk} - \alpha'_{ijk}) \leq \frac{|S'|}{n}

存在非负整数KSK \leq |S'|使得t=1K/nt = 1 - K/n。选择SS'中任意KK个元素(i,j,k)(i,j,k),对其αijk\alpha'_{ijk}加上1/n1/n。现在αijk=1\sum \alpha'_{ijk} = 1,因此αD\alpha' \in D

A.2 舍入误差的影响

引理 A.2α,α\alpha, \alpha'如上。则:

12o(n)αNαN2o(n)\frac{1}{2^{o(n)}} \leq \frac{\alpha_N}{\alpha'_N} \leq 2^{o(n)}

证明: 因为αN=(i,j,k)Sαijkαijk\alpha_N = \prod_{(i,j,k) \in S} \alpha_{ijk}^{-\alpha_{ijk}},我们有:

αNαN=(i,j,k)S(αijkαijk)αijk(αijk)αijkαijk\frac{\alpha_N}{\alpha'_N} = \prod_{(i,j,k) \in S} \left(\frac{\alpha_{ijk}}{\alpha'_{ijk}}\right)^{-\alpha_{ijk}} \cdot \left(\alpha'_{ijk}\right)^{\alpha'_{ijk} - \alpha_{ijk}}

对于固定的(i,j,k)S(i,j,k) \in S,如果αijk\alpha_{ijk}1/n1/n的整数倍,则αijk=αijk\alpha'_{ijk} = \alpha_{ijk},比值为1。

否则,设δ=αijkαijk\delta = \alpha'_{ijk} - \alpha_{ijk},其中0<δ<1/n0 < |\delta| < 1/n。当δ>0\delta > 0时:

log(αijkαijkαijkαijk)=(αijk+δ)log(αijk+δ)αijklogαijk\log\left(\frac{\alpha_{ijk}^{-\alpha_{ijk}}}{\alpha_{ijk}'^{-\alpha'_{ijk}}}\right) = (\alpha_{ijk} + \delta)\log(\alpha_{ijk} + \delta) - \alpha_{ijk}\log\alpha_{ijk}

使用log(1+x)=xO(x2)\log(1+x) = x - O(x^2)x0+x \to 0^+

=αijklog(1+δαijk)+δlog(αijk+δ)O(1n)= \alpha_{ijk}\log\left(1 + \frac{\delta}{\alpha_{ijk}}\right) + \delta\log(\alpha_{ijk} + \delta) \leq O\left(\frac{1}{n}\right)

因此比值在2o(n)2^{-o(n)}2o(n)2^{o(n)}之间。

附录B:对角化定理的最优性

B.1 下界构造

定理 B.1 对于正整数nmn \geq mnn足够大,存在集合S{(i,j,k)[n]3:i,j,k互不相同}S \subseteq \{(i,j,k) \in [n]^3 : i,j,k \text{互不相同}\}S=mn|S| = mn,使得对任何大小I=nlogn/m|I| = n\sqrt{\log n}/m的子集I[n]I \subseteq [n],存在(i,j,k)S(i,j,k) \in S满足i,j,kIi,j,k \in I

证明:C\mathcal{C}为所有大小为nlogn/mn\sqrt{\log n}/m[n][n]子集的集合。因此:

C=(nnlogn/m)nnlogn/m|\mathcal{C}| = \binom{n}{n\sqrt{\log n}/m} \leq n^{n\sqrt{\log n}/m}

初始令S=S = \emptyset。重复添加元素(i,j,k)(i,j,k)SS,并移除所有包含i,j,ki,j,k的剩余ICI \in \mathcal{C},直到C\mathcal{C}变空。

在每步,贪心选择最大化{IC:i,j,kI}|\{I \in \mathcal{C} : i,j,k \in I\}|的互不相同的(i,j,k)[n]3(i,j,k) \in [n]^3。对于随机选择的三个互不相同的i,j,k[n]i,j,k \in [n],给定ICI \in \mathcal{C}i,j,kIi,j,k \in I的概率为:

InI1n1I2n2>(I2n2)3>12(lognm)3\frac{|I|}{n} \cdot \frac{|I|-1}{n-1} \cdot \frac{|I|-2}{n-2} > \left(\frac{|I|-2}{n-2}\right)^3 > \frac{1}{2}\left(\frac{\log n}{\sqrt{m}}\right)^3

重复mnmn次后,C|\mathcal{C}|的大小将小于:

nn/m(112(lognm)3)mn<nn/me12nlog3n/m<1n^{n/\sqrt{m}} \cdot \left(1 - \frac{1}{2}\left(\frac{\log n}{\sqrt{m}}\right)^3\right)^{mn} < n^{n/\sqrt{m}} \cdot e^{-\frac{1}{2}n\log^3 n/\sqrt{m}} < 1

对于足够大的nn。因此C=0|\mathcal{C}| = 0

B.2 自由张量的构造

定理 B.2 对于正整数nnmm,其中nn足够大且log2nmn/6\log^2 n \leq m \leq \sqrt{n/6},存在集合S([n]3)S \subseteq \binom{[n]}{3}SO(mn)|S| \leq O(mn),使得:

  1. 任意不同的{i,j,k},{i,j,k}S\{i,j,k\}, \{i',j',k'\} \in S满足{i,j,k}{i,j,k}1|\{i,j,k\} \cap \{i',j',k'\}| \leq 1
  2. 对任何大小I=nlog(n)/m|I| = n\log(n)/\sqrt{m}的子集I[n]I \subseteq [n],存在{i,j,k}S\{i,j,k\} \in S满足i,j,kIi,j,k \in I

这个构造证明了即使对于具有额外结构(自由性)的张量,m\sqrt{m}因子仍然是最优的。

附录C:Salem-Spencer集合的张量解释

C.1 构造与性质

对于奇素数MM,定义张量CMC_M

CM=i=0M1j=0M1xiyjz(i+j)/2modMC_M = \sum_{i=0}^{M-1} \sum_{j=0}^{M-1} x_i \cdot y_j \cdot z_{(i+j)/2 \bmod M}

使用Salem-Spencer集合AA,零化所有iAi \notin Axi,yi,zix_i, y_i, z_i,得到:

iAxiyizi\sum_{i \in A} x_i \cdot y_i \cdot z_i

这是AMeO(logM)|A| \geq M \cdot e^{-O(\sqrt{\log M})}项的直和。

C.2 在激光方法中的应用

在步骤3中,定义的哈希函数满足关键性质:

  • hX(I,J,K)+hY(J,K,I)=2hZ(K,I,J)(modM)h_X(I, J', K'') + h_Y(J, K', I'') = 2h_Z(K, I', J'') \pmod{M}
  • 三个哈希值在条件于其他两个之一时仍是均匀随机的
  • 哈希函数是成对独立的

这些性质确保了Salem-Spencer集合可以有效地用于稀疏化,同时保持足够多的与(α,α,α)(\alpha, \alpha, \alpha)一致的块三元组。

结论

本文通过引入m\sqrt{m}改进因子,成功地改进了激光方法并获得了矩阵乘法指数的新界限ω<2.3728596\omega < 2.3728596。虽然改进幅度看似微小,但这代表了该领域核心技术的一次重要突破。更重要的是,这种改进的激光方法是通用的,可能在算术复杂性的其他问题中有进一步应用。

已知的局限性结果表明,仅使用激光方法和Coppersmith-Winograd张量族无法证明ω=2\omega = 2。要实现矩阵乘法复杂度的重大突破,可能需要全新的方法或张量族。尽管如此,本文的工作为未来研究提供了新的技术工具,并展示了即使在高度优化的算法中仍有改进空间。

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。