TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
晨枫 发表于 2025-3-19 13:30
1 i' M% s6 A. O不知道有没有必要弄到那么复杂的份上。
$ m' {8 H" e+ C. W+ a M3 W6 r+ j% K! D8 K' k) p
战斗机气动控制面只有那么些:襟翼、副翼、前缘襟翼、平尾、方向 ...
+ U7 O, @6 i6 B2 w/ R* W, f+ g' T晨大好。
: P2 J% A W, `4 @, _, L4 g+ e& g- o8 F9 }6 C) F8 `5 C( W' P" Z- F% u
我说把yolo换成基于多模态大模型的解决方案,其实是简化,而不是复杂化。
$ w6 P, ?/ e+ A" s, E- a8 J+ m* i! j3 v4 k
这个问题的关键是在于yolo自身的定位是传统的图像检测分类识别,这个是需要进行监督学习的。而多模态大模型在具备泛化能力的前提下,有推理和理解能力,这个可以在一定程度上采取强化学习甚至是无监督学习的模式。8 c3 G8 k! f+ y6 _, e# g1 v
) @; I$ I( O7 ]/ W# h. x( X
不过这个论文本身应该是远远达不到南华早报说的那个功能强度的。 |
|