TA的每日心情 | 开心 2020-4-8 10:45 |
---|
签到天数: 227 天 [LV.7]分神
|
晨枫 发表于 2025-3-19 13:30
9 C) h4 I9 P+ {* i0 E) g* X* j0 n# H不知道有没有必要弄到那么复杂的份上。5 a% R8 w' s, p5 U& f5 x, V, Q
* w5 C, \7 u2 `% H0 H4 F战斗机气动控制面只有那么些:襟翼、副翼、前缘襟翼、平尾、方向 ...
# I& e8 u% C% B6 }" c晨大好。% z N7 E8 z" |2 E) Q( W
2 X3 \6 t% w( i+ @5 {) X/ S我说把yolo换成基于多模态大模型的解决方案,其实是简化,而不是复杂化。
* Z# q7 M/ w& ]. K( I4 t8 i0 z, f) E9 _# R7 }
这个问题的关键是在于yolo自身的定位是传统的图像检测分类识别,这个是需要进行监督学习的。而多模态大模型在具备泛化能力的前提下,有推理和理解能力,这个可以在一定程度上采取强化学习甚至是无监督学习的模式。9 a) c$ ]& v, M+ l% y/ M
4 r( A t3 y7 Q" W6 ?4 n5 {不过这个论文本身应该是远远达不到南华早报说的那个功能强度的。 |
|