string1: TACGGCATGGCTATCGTAGCTAG
string2: GCTAT
要求在string1里找到string2的位置,如果存在多个的话,都要找出来。
如果两个字符串是这个样子
string1: AAAAAATTTTCCCCCGGGTTTTAAAACCCCCCGG
string2: TTAAA
MacArthur 发表于 2013-10-6 16:17( u) ^- a( D" p; N) y6 K" ?
这就是基因BLAST算法的标准定义嘛。。。* }7 g% o7 L% A+ d' I& Y5 M
Google "Blast算法",一堆开源程序。
MacArthur 发表于 2013-10-6 21:355 y# x3 V P$ A$ A- J$ F3 Q
不明觉厉。。。 上Billion字节的操作,想想就头大。。。 这个规模是不是得上并行计算了?9 O, ~& k2 N+ w- c1 v+ n& a
...
喜欢喝冰茶 发表于 2013-10-7 10:357 d2 }% n+ X# A+ U3 ^4 t8 C
当然要省很多时间,因为不需要对string1一个一个比了!!!
; }8 B9 j& l1 M" ^9 t; g
string1可以写成:
. a3 s$ f9 m0 b) o0 E1 B( G( S
/ ~- r O# Q$ }0 Mchalet 发表于 2013-10-10 22:067 D4 F9 M/ Q: s# h% y1 h0 m" g! U
欢迎欢迎。) T1 L6 I E- b0 d1 s* g6 y
如果说硬要分类,这个应该还是属于生物信息学领域吧,在科教学圃应该很对口啊。
喜欢喝冰茶 发表于 2013-10-11 23:06% U m' u& w. S2 c+ ]* S' ^
握握手,看起来也是生物计算的啊,现在在做什么?
! S5 }) J; }4 d' L2 p& k
还没想好怎么写,涉及的范围得控制一下,要不太大了, ...
chalet 发表于 2013-10-11 20:29
我可不是作生物计算的,是学临床医学出身的,而数学正是我的致命伤,哭啊~~~( R$ Q, \; h" }+ r5 Z) a
那是上一轮生物技术泡沫的时 ...
chalet 发表于 2013-10-12 03:120 d% |8 D$ u/ S+ @
非常赞同你说的。确实当年我去那家公司的时候,他们拿手的是cDNA表达谱芯片,后面的事实证明,这个层面的 ...
喜欢喝冰茶 发表于 2013-10-13 15:043 f8 f9 X( ]0 @1 |) o! I
cDNA算是经典的array了,该不会在程氏公司吧~_~。现在mRNA的expression,特别是经典的几十个癌症基因的 ...
chalet 发表于 2013-10-13 21:20h% q" Z6 p5 @" C6 t
我对当前这个领域的研究有2个观点:" b5 y6 R7 j. V
1. 当前这种研究思路,有点花大本钱做剥丝抽茧的小事的味道。一方面 ...
一叶飞刀 发表于 2014-11-15 07:017 N. }6 `0 b2 c: w! F/ G
关于字符串匹配,应当已经解决完毕了,大概不会有更高级的算法了。' f3 j" O; Q" ~5 _
2 T5 ]/ Q7 A. Z9 _+ x! C
从S中找ss简单匹配算法为用ss的第一个 ...
| 欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/) | Powered by Discuz! X3.2 |