MacArthur 发表于 2013-10-6 16:172 f/ o- c; ~1 T4 a; c8 b4 e
这就是基因BLAST算法的标准定义嘛。。。
Google "Blast算法",一堆开源程序。
string1: TACGGCATGGCTATCGTAGCTAG
string2: GCTAT
要求在string1里找到string2的位置,如果存在多个的话,都要找出来。
如果两个字符串是这个样子
+ G* i" O% W7 o
string1: AAAAAATTTTCCCCCGGGTTTTAAAACCCCCCGG
string2: TTAAA
MacArthur 发表于 2013-10-6 16:172 q- \/ x% n/ ^9 O; s9 {
这就是基因BLAST算法的标准定义嘛。。。7 K: w7 j; v$ v# U+ \* Q$ i S- d- l% x
Google "Blast算法",一堆开源程序。
MacArthur 发表于 2013-10-6 21:358 [: k" b. G! a# N7 N
不明觉厉。。。 上Billion字节的操作,想想就头大。。。 这个规模是不是得上并行计算了?
...
喜欢喝冰茶 发表于 2013-10-7 10:35
当然要省很多时间,因为不需要对string1一个一个比了!!!# L$ \ d3 G. _4 d/ `
5 T# j# g- H" Z! j, u6 V
string1可以写成:

喜欢喝冰茶 发表于 2013-10-9 10:43# z- z2 x8 v- {3 r9 E1 E
这个帖子里的东西,看起来似乎是一个简单的计算问题,但是却很可能是一场改变人类健康革命的基础。正是由于 ...

chalet 发表于 2013-10-11 20:29
我可不是作生物计算的,是学临床医学出身的,而数学正是我的致命伤,哭啊~~~2 @1 t1 m1 Z- o j
那是上一轮生物技术泡沫的时 ...
喜欢喝冰茶 发表于 2013-10-12 15:10
兄弟原来是医生,幸会幸会,我的很多合作者都是MD。9 K* z/ T, c3 X; _9 Z
3 K# S4 ^) b' s. l
呵呵,03年太早了,HGP刚完成,那会儿还没看出个所 ...
chalet 发表于 2013-10-12 03:12- C! h4 S" v0 C. O. D; Y7 A/ M2 ?
非常赞同你说的。确实当年我去那家公司的时候,他们拿手的是cDNA表达谱芯片,后面的事实证明,这个层面的 ...
喜欢喝冰茶 发表于 2013-10-13 15:04; _5 y- `/ C8 B$ J1 c
cDNA算是经典的array了,该不会在程氏公司吧~_~。现在mRNA的expression,特别是经典的几十个癌症基因的 ...
一叶飞刀 发表于 2014-11-15 07:015 ~& v {; K+ \- B* i* q: n
关于字符串匹配,应当已经解决完毕了,大概不会有更高级的算法了。
% G+ ^ Z/ R( N, p0 W$ F" x
从S中找ss简单匹配算法为用ss的第一个 ...
| 欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/) | Powered by Discuz! X3.2 |