U4 G7 T# B _, k P6. 结论与思考 8 Y& v# A3 i( }) K3 l: N$ m) R* Q3 D在深入研究顾险峰教授对Sora模型的分析后,我深受启发,同时也意识到在解读这一复杂议题时,每个观点都可能存在一定的局限性。顾教授的见解无疑是深刻且具有前瞻性的,他从数学和几何的角度出发,对Sora模型在模拟物理世界方面的潜力和挑战提出了独到的看法。然而,作为一个对这一领域充满好奇的探索者,我也试图提出一些个人的见解。 # h; x, z1 c* t+ ?' v0 w0 D, B. ?9 C& Y1 g
整体的大前提下,我认同顾教授关于Sora模型在处理物理悖谬和临界态方面的局限性的分析。确实,基于概率的模型在捕捉物理世界的连续性和精确性方面可能存在不足。然而,我也认为,随着AI技术的不断进步,尤其是深度学习和神经网络的发展,我们可能会发现新的方法来弥补这些缺陷。例如,通过结合物理定律的先验知识,我们或许能够设计出更加精确的生成模型,这些模型不仅能够处理离散数据,还能够在一定程度上模拟物理过程的连续性。 / m: M+ N/ v$ c0 |6 U' T1 @; R. Z4 h) N1 q+ h D8 v2 E) L/ T. Z) K
顾教授的论点主要是从分析几何的专业视角出发,探讨了基于数据点云的扩散模型在模拟真实世界物理模型时的局限性。他指出,尽管扩散模型(如Sora模型)在局部细节上可能表现出色,但它们在捕捉全局物理规律和临界态方面存在不足。这些模型通常基于概率统计,通过学习数据点云之间的连接概率来生成新的点云数据。而物理定律的精确描述通常需要偏微分方程,这些方程能够捕捉到物理现象中的连续性和动态变化。而扩散模型可能无法完全捕捉到这些连续性和变化,尤其是在处理物理过程中的突变和临界态时。这是因为扩散模型在生成过程中可能会平滑化数据流形的边界,导致关键的临界态数据样本被忽略,从而在模拟视频中出现物理上的荒谬。基于几何方法的最优传输理论框架可以克服这些局限性。 a$ \6 _1 w& i2 d7 D4 n2 `
+ O3 Y$ d' T8 o6 L+ _
最优传输理论提供了一种精确检测数据流形边界的方法,能够强调临界态事件的生成,避免不同稳恒态之间的横跳,从而更接近物理的真实。这种方法在处理点云数据时,可以更有效地模拟自然界的物理规律,尤其是在处理离散数据和预测未来状态时。所以,顾教授的论点实际上是强调了在AI和机器学习领域中,结合几何和拓扑工具的重要性,以提高模型在模拟复杂物理现象时的准确性和可靠性。 ) W8 G6 M6 n' Q" |8 Z7 J- O! K0 Z9 l2 \: a: z! T) z6 R3 `7 g
但是,最优传输理论(Optimal Transport Theory, OT)本质上仍是一种处理连续性数据的方法,它通过在概率分布之间寻找最优的转换路径来最小化某种成本或能量。这种方法在数学上通常涉及到连续的几何和拓扑概念,如流形、测度论和泛函分析。在处理点云数据或离散数据时,最优传输理论可以被用来构建一个连续的框架,即使数据本身是离散的。通过这种方式,OT能够考虑到数据的全局结构和分布特性,而不仅仅是局部的点与点之间的关系。这种方法适用于那些需要考虑全局最优解的问题,如点云配准、重采样和数据增强等。$ E) i% z; g+ w$ Y2 O' R
$ x. x$ Q# F- W7 ]5 O
跳出问题的本身,从哲学的角度来看,离散与连续是一对对立统一的概念。在哲学中,这种对立统一的思想可以追溯到古希腊哲学家赫拉克利特的“万物流变”和巴门尼德的“存在即不变”的辩论。在现代哲学中,这种对立统一的概念体现在对现实世界本质的探讨中,尤其是在科学哲学和数学哲学中。在数学中,离散数学研究的是离散结构,如整数、图论、组合数学等。而连续数学则关注实数、函数、微积分等领域,它们处理的是连续变化。数学家们发现,尽管离散和连续在直观上截然不同,但在某些情况下,它们可以通过极限、拓扑和代数结构等概念相互联系。在物理学中,量子力学揭示了自然界在微观层面上的离散性(如量子跃迁),而经典力学和相对论则描述了宏观层面上的连续性。临界态,如相变,是连续与离散相互作用的结果,体现了物质状态的突变。2 A2 o4 n' t1 r
u& j4 Y1 i! |* D' ]2 a# r
临界态作为离散与连续之间的过渡,体现了对立统一的哲学思想。在临界态中,系统的行为可能发生根本性的变化,这种变化往往涉及到从一种稳定状态到另一种稳定状态的跃迁。这种跃迁可能是由外部条件的微小变化触发的,但它揭示了系统内在的非线性和复杂性。 # N9 n; c" J1 E: L v7 x7 O3 A: z' Y$ B+ }8 p8 |4 _; J
所以说,在AI和机器学习领域,理解和模拟临界态对于创建能够处理复杂现实世界问题的智能系统至关重要。这要求我们在离散和连续的数学工具之间寻找平衡,以及在模型的构建中考虑到现实世界的连续性和离散性。那么最优传输理论是吗?这也许是一个很长一段时间之内都难以回答的问题。1 T4 `+ |$ S5 ?& v6 @9 z+ x5 B5 G& n
! W1 Q4 {4 H# s, b0 o8 i当然,顾教授的分析为我们提供了宝贵专家的视角,但AI模拟物理世界的研究仍然是一个多学科交叉的领域,需要物理学家、数学家、计算机科学家以及工程师的共同努力。在这个过程中,不同的方法和理论可能会相互补充,共同推动我们对物理世界的理解。顾老师的文章为我提供了一个宝贵的思考起点,我个人的解读则是在此基础上的一种尝试。作为一个数学学渣,也只能才疏学浅大胆假设,希望能够激发更多的讨论和思考。4 l7 ], K! F8 w" W2 Z9 v
1 U' f6 q' s% j2 h" c+ e, U3 k
其实其他的解决思路也有,我正在看复旦大学熊赟教授团队的新论文《DiffPoint: Single and Multi-view Point Cloud Reconstruction with ViT Based Diffusion Model》。这也是一个很好的点云数据重建思路,回头有时间的也写一个解读吧。+ W: r5 I3 h& v% Z! B
" M% o/ f) a* n( T7 |' s& g8 _0 ]1 u2 b% o参考链接3 J5 r5 N4 w$ z; d2 A, a h
参考资料如下: : Q- Z, Y2 I9 m- ^" ?4 x; M- I# k3 g$ F+ D D( H) U
“几何矿工”顾险峰:Sora物理悖谬的几何解释- R$ @: o5 p- o+ k+ n
6 j* F6 u( j; M7 v3 b( J. k* E5 C E
顾险峰老师关于最优传输理论和深度学习关系的问答 - 知乎 2 c1 r* A4 M3 k& [% w+ g' E0 z2 c& u+ M. _! E- x+ Q
高精度点云配准(最优传输角度下篇) - 知乎 8 P$ |8 r* W( s3 R$ z$ ]% Z h/ D/ \" A% `
高精度点云配准(最优传输角度上篇) - 知乎7 H$ O) I5 w/ p" F% ^
2 m% r- e: w. U ?, _7 N D
基于最优传输理论的高质量点云重采样方法 - ict.ac.cn9 i1 k/ t) b/ v& ]
$ d% I/ y$ u) g- q9 w w基于最优传输理论的点云配准算法研究 - 百度学术 " ~: g, p+ o U- d+ p) J 1 T3 M, p' L/ |* [9 q9 Y" K* ?9 |. j3 |& R" n# O+ [: v$ C4 Y* K5 i8 |
原文链接:0 A: `! Y0 z% w C) i https://mp.weixin.qq.com/s?__biz ... 8&lang=zh_CN#rd