数值分析 发表于 2022-9-24 23:045 {4 O }: Z, q1 s: ?( M% {3 L
拉下来?拉多少?
把代码贴上来看看?
风雨无阻 发表于 2022-9-24 23:33
Maybe Debug mode?
雷达 发表于 2022-9-24 23:54
void xcorr(comp* outcomp, comp* A, int lenA, comp* B, int lenB)
{
comp temp, xtimesy;
数值分析 发表于 2022-9-25 00:20( V8 N1 h/ D2 ]
这个不是这么比的吧。。。
2 E, ^+ |1 j- p1 Z) ]2 E8 J) Y$ j
您这个函数,不带内循环的话,汇编完总共操作也没几个(不到100个)。
雷达 发表于 2022-9-25 00:46
有道理。
所以存在内循环速度就上不去,把内循环取消,改成两个向量直接点乘再求和应该就会好得多,这大 ...
数值分析 发表于 2022-9-25 00:20
这个不是这么比的吧。。。+ k6 M( T; |0 L3 k5 J; i/ [
您这个函数,不带内循环的话,汇编完总共操作也没几个(不到100个)。
而加上内循环,光jmp和dec指令就至少多执行了6000个
沉宝 发表于 2022-9-25 01:48: k; a1 j0 t8 k( n! P/ N
现在的CPU,可以把判断、jmp和dec指令全部融合进一个µOp(微操作,CPU内部流水线上的执行单位)。如果 ...
沉宝 发表于 2022-9-25 01:27" R/ O' A) h( M% r
你两个试验之间就差了一个空循环, call 1000次按理不会有秒级差异,可能还是编译器优化的问题。举个例子 ...
雷达 发表于 2022-9-25 04:478 e. y1 Q9 e0 K3 G5 g- t
又写了个小实验,没有调用子函数,双层循环,外层6千次,内循环30万次空转,有或没有空转内循环,时间差 ...
雷达 发表于 2022-9-25 04:47
又写了个小实验,没有调用子函数,双层循环,外层6千次,内循环30万次空转,有或没有空转内循环,时间差 ...
数值分析 发表于 2022-9-25 14:584 N7 X2 @" E- u- a. W }' v2 k
能不能把这个也贴上来,看看和上一个有什么不同?
std::vector < float > vec1(N);
std::vector < float > vec2(N);
float* b1 = new float[N];
float* b2 = new float[N];" y4 y2 p, v& |) s+ L6 j
6 m4 F5 V- p# O" c& ^$ Q8 \
for (int j = 0; j < 6000; j++); ~+ q0 X/ J3 t0 B5 V. @
{1 K7 n) N' T% ^. K7 B7 b
std::generate(vec1.begin(), vec1.end(), []() {$ U$ I- r L3 ]0 z' X4 |4 m* l
return static_cast <float> (rand()) / (static_cast <float> (RAND_MAX / 23.23));;( A" C6 e9 o* V
});
0 J& R8 S) j6 a% e/ j0 m# h& _* p
std::generate(vec2.begin(), vec2.end(), []() {
return static_cast <float> (rand()) / (static_cast <float> (RAND_MAX / 24.31));;5 G j# z& ]6 m; h7 n2 u5 s
});
for (size_t jj = 0; jj < vec1.size(); jj++)+ {; b" }, _# j o5 a2 |: R' f/ j
{
b1[jj] = vec1[jj];
}* p* D0 X# k: r: c) _! h/ C
8 c& d7 _) U) C5 c
for (size_t jj = 0; jj < vec2.size(); jj++)* T9 W7 e$ h7 r+ H& f
{) B/ m2 U; P# A. i' U
b2[jj] = vec2[jj];$ K3 n y8 t+ \( A3 p% K% @
}- Q3 D1 }8 h, I4 ^4 W% M% [
//Method - 1 N=100000 247s 1 Q; S3 b0 ?0 n, C* S
//fresult = inner_product(vec1.begin(), vec1.end(), vec2.begin(), 0);
//Method - 2 N=100000 237s4 ]$ w0 j' E. {$ A2 `: R
/*9 G+ O5 a3 N) D4 Q6 p
for (int jj = 0; jj < N ; jj++)/ X( s2 a/ S! |" |% C3 Q$ h8 ]) O# i2 I
{8 r. u% ?( T7 v6 P( |5 q. D
fresult += vec1[jj] * vec2[jj];
}$ Q9 r* a w# e; C& e" w8 G
*/
9 }5 \ K9 N: O9 s5 X
//Method - 3 N=100000 204s7 H) [% ]: G. c( {/ {) w
/*
for (int jj = 0; jj < N; jj++)1 k/ k$ Y [# Z7 U
{
fresult += b1[jj] * b2[jj];/ H n* h2 U5 J& f7 p
}# w0 I& l: t2 x4 \
*/ k& h( M9 ~6 X/ w+ ~8 t& t
//Method - 4 202s
/*
for (int jj = 0; jj < N; jj++)
{+ m4 j) X0 j' _/ m2 _" a
}
*/) r5 o2 a/ R* y/ U. ~4 P
//comment out all methods, N=100000 202s 9 t* ~. k% o+ o9 ^# s1 l* _
}
) b( ^: K# t( a
delete []b1;, `4 }1 B% l# b% q6 D
delete []b2;
机器猫 发表于 2022-9-27 00:15
瞎猜一下啊。把第一个的那个j定义成register变量会不会有不同?
# D3 M4 ^0 c0 ?8 c# p) I3 y
你第二个试验里面的j在循环里面又重新定义 ...
雷达 发表于 2022-9-27 01:16' E! u3 m/ N' b o+ w
内循环里面的 j 实际是 i, 为了规避爱坛显示的冲突帖子里临时改成了j, 现在是 jj 了。好累 、LOL/ L% M6 q+ u: k+ s/ ?7 ~
- Z$ e% k8 Z9 h" \8 T+ c
不和它 ...
7 L8 W5 a: a, J5 o雷达 发表于 2022-9-24 23:54
void xcorr(comp* outcomp, comp* A, int lenA, comp* B, int lenB)( ?& R' K5 Y- x* l
{( f( M B+ K% M% H) }, e1 Z) |
comp temp, xtimesy;
雷达 发表于 2022-9-26 01:30
理了理思路,重新做了一个测试。
做了两个 vector 和 两个 float *, 都长 100000" ^8 }) [) O+ K" T6 L# h) j: m
外循环 6000,里面先做随 ...
雷声 发表于 2022-9-27 20:39
这个时间是从哪里开始算的?
我怀疑这个200多秒里面有200秒花在产生随机数上了,真正计算大概只用了2秒, ...
雷达 发表于 2022-9-24 23:54
void xcorr(comp* outcomp, comp* A, int lenA, comp* B, int lenB)
{! Z9 c' F" d/ q$ ^
comp temp, xtimesy;
opensrc 发表于 2022-9-28 00:29
我有些迷糊,这样的code,难道不就应该时间差很多吗?也做了个简单的实验,你看看我做的有错吗# T+ K( k; w; i8 T9 M- O( V
6 U! j% j" x9 }: t' |1 e. N
...
。

" @( C! Y/ E- \& u* P1 D| 欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/) | Powered by Discuz! X3.2 |