设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
楼主: 喜欢喝冰茶
打印 上一主题 下一主题

[其他] 吐槽一把,都是钱闹的

[复制链接]
  • TA的每日心情
    开心
    2022-4-16 03:01
  • 签到天数: 192 天

    [LV.7]分神

    楼主
    发表于 2015-7-17 19:08:52 | 显示全部楼层
    一看就是算法问题。商业的云计算根本就不是干这个的。你们不知道也就罢了,你们头不知道就是个奇葩了。
  • TA的每日心情
    开心
    2022-4-16 03:01
  • 签到天数: 192 天

    [LV.7]分神

    沙发
    发表于 2015-7-18 03:03:04 | 显示全部楼层
    喜欢喝冰茶 发表于 2015-7-17 22:21
    商业云计算只是提供个平台而已,并不都是AWS模式。专用的云计算平台多了去了,而且都是针对性的。算法问 ...

    我当年跟人合作过,不过我们那个时候没有这么牛,做不到全基因组。就测了一条最短的染色体的长臂。
    我不是搞计算方面的,是测序部分的。具体的算法细节,我也不清楚。但算法问题也是吐糟了好久,到头也没解决掉。我们最后的法子是严重偷工减料版的。就是只检测已知的基因的编码序列,而且不是全部,只是已经报道过的那些点突变和缺失突变。这就把工作量减少了3-4个数量级,总算是能够让计算能够在一天内完成了。然后随机检测了十几个基因的全序列。也就应付过去了。反正最后发的文章好像还很不错。

    这个就跟您一说。这个策略肯定是能够解决您目前的问题的。但严重缩水。

    您在国内阿,也难怪了。呵呵。
  • TA的每日心情
    开心
    2022-4-16 03:01
  • 签到天数: 192 天

    [LV.7]分神

    板凳
    发表于 2015-7-18 10:18:48 | 显示全部楼层
    喜欢喝冰茶 发表于 2015-7-18 05:21
    不知道您当时用的什么方式,sanger?08年那会儿NGS是还不很完善,无论是实验还是计算部分。所以那会儿也 ...

    是自动测序仪,应该是sanger原理的。当时还没有上市的型号,我老板人头熟,公司送给我们免费试用的。当时chip才刚有文章出来。你测个基因没问题,但是要测染色体,那远远不够。
    看起来assemble的问题始终没有解决阿。但重复序列这个的确也难为你们了。当时人类基因组都99.9%了。剩下的重复序列就是对不上。那可是集中了全球最顶尖的科学家,几千号人。好久没有追踪这个了,不知道到了100%了没有。也不知道他们最后的算法是什么。
    我可没小瞧国内。他们当年把水稻基因组发表,我就知道国内已经至少在这方面赶上来了。据说最关键的assemble是用的北大生科院党委书记的策略。当时是眼镜碎了一地。没想到一个政工干部,还这么牛。

    我是偏生物功能这一派的。重复序列里面,除非大规模的片段插入或者缺失,包含的影响生物功能的变化很少。所以,当年我是力主简化的。为了这0.1%的可能突变,去占用了99.9%的计算资源,在我看来完全是浪费。不过时代不同了,我也早不干这个了,或许行业标准已经变了。
  • TA的每日心情
    开心
    2022-4-16 03:01
  • 签到天数: 192 天

    [LV.7]分神

    地板
    发表于 2015-7-18 10:19:02 | 显示全部楼层
    喜欢喝冰茶 发表于 2015-7-18 05:21
    不知道您当时用的什么方式,sanger?08年那会儿NGS是还不很完善,无论是实验还是计算部分。所以那会儿也 ...

    是自动测序仪,应该是sanger原理的。当时还没有上市的型号,我老板人头熟,公司送给我们免费试用的。当时chip才刚有文章出来。你测个基因没问题,但是要测染色体,那远远不够。
    看起来assemble的问题始终没有解决阿。但重复序列这个的确也难为你们了。当时人类基因组都99.9%了。剩下的重复序列就是对不上。那可是集中了全球最顶尖的科学家,几千号人。好久没有追踪这个了,不知道到了100%了没有。也不知道他们最后的算法是什么。
    我可没小瞧国内。他们当年把水稻基因组发表,我就知道国内已经至少在这方面赶上来了。据说最关键的assemble是用的北大生科院党委书记的策略。当时是眼镜碎了一地。没想到一个政工干部,还这么牛。

    我是偏生物功能这一派的。重复序列里面,除非大规模的片段插入或者缺失,包含的影响生物功能的变化很少。所以,当年我是力主简化的。为了这0.1%的可能突变,去占用了99.9%的计算资源,在我看来完全是浪费。不过时代不同了,我也早不干这个了,或许行业标准已经变了。
  • TA的每日心情
    开心
    2022-4-16 03:01
  • 签到天数: 192 天

    [LV.7]分神

    5#
    发表于 2015-7-20 04:07:08 | 显示全部楼层
    喜欢喝冰茶 发表于 2015-7-18 12:39
    严格意义上,第二代大规模以荧光为基础的测序仪都可以说是sanger原理的,问题是有多深,有多快,准确率如 ...

    你还真是干这行的老手了。
    我那篇文章是07年初发的,工作主要是05-06年做的。因为是合作,我过后就转做别的了。对于测序行业后来的发展就完全摸不着头脑了。

    但是我用基因测序方法检测病人突变的工作,做了很长时间。所以,你们的基本操作原理估计还是那套。一般说来,大家都是从已经发表过的有突变的基因开始找起,先看有没有插入或者缺失,有些时候单基因删除也会造成单基因功能性不足,从而引发问题。没有的话,就看编码序列,编码没有问题,就看剪切,尤其是选择性剪切的。再没有,看RNA前后的非编码序列。最后看该基因表达的水平。当年就是拿病理组织切块做northern。现在手段多了去了。这些都找过了,没有的话,就看同一信号传导链上的基因或者功能伙伴,然后是结合蛋白。基本上跟病理相关的这些别人都做过了。去找出来一一看过。最后什么都没发现的话,就打入另册。

    你们所做的,无非就是看到RNA的非编码序列。有可能连选择性剪切后各种异切体的丰度看一看,不知道你们能不能看表达,但是后面的步骤,不是测序就能够解决了的。必须要有生物学实验,最好是老鼠的动物模型,当然,一个小突变,如果很重要的话就是一篇不小的文章了。

    所以,我一直认为,纯粹的测序检测,只能看已经知道突变的基因。估计你们就是发现了相关的新基因,都不会报道的。因为这必须要有生物学证据才行。这么说起来,你们的全基因组测序,其实也就是测个几百个就足够了。人类的25000多基因,你们根本就是测了也是浪费。

    生物里面当然忽悠是很多,但要走下去,还是要靠真本事。当然忽悠也是本事的一部分。你是生物出身,好好干吧。我看好你阿。说不定啥时候,我们就有个合作了。

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2024-6-11 07:56 , Processed in 0.041481 second(s), 17 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表