设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
楼主: 晨枫
打印 上一主题 下一主题

[科技] 阿里的云数据库是如何打败Oracle的

  [复制链接]
  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    楼主
    发表于 2020-9-4 03:28:45 | 显示全部楼层
    红茶冰 发表于 2020-9-4 02:23
    两派涉及到这种极端环境下其实是有共同语言,常规的前后端IT工程师在面对订票系统这种即要求所有票务信息 ...

    这个是很牛的,关键美国没有这种需求。

    IBM中国最开始都是美国专家帮助,后来只能自己搞,美国银行没有那么大的交易量,专家也没遇到过中国的问题。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    沙发
    发表于 2020-9-4 05:16:49 | 显示全部楼层
    老兵帅客 发表于 2020-9-4 04:01
    没那么神奇,其实不过是尽量都搁在内存,然后死了命地玩cluster,再加上限制数据一致性以降低同步所带来 ...

    金融业务不可能放弃数据一致性的,OceanBase只是换了个方法去实现。

    OceanBase解决ACID问题的方法,主要是靠增加备份,将三套OceanBase绑定在一起运行,一个主库,两个备库。只有当至少一个备库也完成任务时,主库才会完成这个任务,这样,任何一个任务至少被保存在两台服务器上,极大降低了事故概率。


    传统数据库本身要保证一致性,每一步都要记录,出现错误要回滚到初始状态。这就造成了复杂的逻辑。

    我的理解是OceanBase不再考虑这些小概率的错误处理,假设没有问题往下执行,万一出了问题,从备库恢复。这是云计算的典型思路。对业务来说,数据一致性是不变的,变的只是内部实现方式。

    加拿大银行界的技术方案不了解,不过中国的业务量至少要大一个数量级,用的话也得魔改,这不就是OceanBase干的事儿吗?

    评分

    参与人数 1爱元 +8 收起 理由
    方恨少 + 8

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    板凳
    发表于 2020-9-4 06:27:17 | 显示全部楼层
    老兵帅客 发表于 2020-9-4 06:01
    oceanbase玩花活的地方就在于数据一致性,这也是它致命的地方。它的解决方案是分两步走,本地尽量搁在内 ...

    要做到的是将风险降低到可以忽略不计的水平,就是传统数据库也做不到完全根除风险。只要oceanbase能将风险降低到传统数据库相同的水平,甚至更低的水平,就是可以用的,可以替代传统数据库的。金融业对一致性的要求极高,这也是oceanbase初期推广人们顾虑的原因。如果一致性很糟糕,是不可能大规模部署的。

    风险无处不在,只要够低没人care。硬件也有很多风险。每个flip-flop都有metastability的问题,无法根除,物理决定的。我们的方案就是将概率降低到宇宙灭亡都不会发生一次的水平,然后整个chip那么多flip-flop,整体保持在几十年几百年发生一次的水平。金融行业对一致性要求高,但用传统数据库,事故也是不少的。IBM给工行升级的时候,误操作把几个小时的交易给丢了,幸好是晚上,交易不多,人工补录上去。

    加拿大的方案我不懂,看你说的和oceanbase有什么区别吗?1. 放内存提高性能,2. 同步到硬盘,3. 多个服务器提高可用性。咋在oceanbase就是致命之处,不被欧美认可,咋加拿大搞就啥问题都没了?不是数据库专家,更不了解加拿大的方案。有错误之处请指正。

    正如你所说的,现在数据量大了,很多业务传统数据库做不到了。oceanbase这种路子,海外搞得可能更早,只是国内的数据规模更大。AWS也在搞,Oracle的舒服日子越来越不好过了。

    点评

    给力: 5.0 涨姿势: 5.0
    给力: 5 涨姿势: 5
      发表于 2020-9-5 22:20

    评分

    参与人数 1爱元 +8 收起 理由
    方恨少 + 8

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    地板
    发表于 2020-9-4 06:54:55 | 显示全部楼层
    老兵帅客 发表于 2020-9-4 06:42
    这个就算了吧,OCEANBASE是基于mysql魔改的,而mysql根本就不是政府以及主要商业用户的数据库选择,这个 ...

    Oracle的数据库还是根据一篇paper改出来的呢。mysql和Oracle理论上有本质区别吗,没有,Oracle的好是工程优化的好。你也说了,oceanbase是mysql的魔改,mysql的一系列工程问题肯定解决了。否则支付宝也不敢用。事实是,支付宝去了IOE,并没有三天两头出问题,反而比银行系统更安全些。

    纯技术讨论。我对DB也仅仅了解皮毛。IT的理论突破越来越难,更多的是工程优化。最开始系统烂,优化得越来越好的情况比比皆是,比如vista/win7。不能轻易判人家死刑。毕竟都大规模商业应用了,我们能想到的问题,人家早都考虑过了。

    点评

    给力: 5.0 涨姿势: 5.0
    给力: 5 涨姿势: 5
      发表于 2020-9-5 22:20
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    5#
    发表于 2020-9-4 07:09:36 | 显示全部楼层
    老兵帅客 发表于 2020-9-4 07:00
    mysql与oracle的确没有理论上的本质区别,但是确实有价格上的绝大差距,你能否说因为没有理论上的本质区 ...

    我没说mysql和oracle没区别,我是说mysql和oceanbase也有区别,都魔改得爷爷不认了,不能用mysql的问题直接说oceanbase,对吧。

    能满足需求的技术就是好技术。很多IT公司,不管国内国外,都在去IOE。算起来还是Google开的头呢,AWS也是,这可不是小公司。IBM/Oracle守着传统的银行、金融、电信等业务,在新兴市场上几乎完败,日子越来越不好过,想想为什么吧。

    点评

    给力: 5.0 涨姿势: 5.0
    给力: 5 涨姿势: 5
      发表于 2020-9-5 22:21
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    6#
    发表于 2020-9-4 07:27:21 | 显示全部楼层
    老兵帅客 发表于 2020-9-4 07:18
    其实性能问题根本没必要像阿里这样做,多做应用服务器cluster+load balance,然后下面的数据库服务器分区 ...

    原文说了,Oracle满足不了需求了。Google确定是因为Oracle/IBM太贵,才开创的云计算。企业为了节省成本做技术创新,好笑吗?

    银行和政府不就是传统业务吗,都是不差钱+不想折腾的主儿,政府更是出了名的保守低效。从Google开始,FB,Uber,Airbnb。。。这些新兴IT企业,有多少用Oracle的,有多少不用Oracle的?

    点评

    给力: 5.0 涨姿势: 5.0
    给力: 5 涨姿势: 5
      发表于 2020-9-5 22:21
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    7#
    发表于 2020-9-4 07:42:24 | 显示全部楼层
    老兵帅客 发表于 2020-9-4 07:32
    企业为了节省成本而作创新,这个想法很好,但是确实省钱了吗?好好想想吧。

    我做那个SSO项目的时候,问 ...

    你去问问Google有没有省钱了啊。像你说的,人家傻啊?

    OceanBase解决了Oracle解决不了的问题,大规模商用了多年,抗住了除了中国少有的海量请求,铁的事实面前,还纠着mysql的问题,抱着不到中国一个省人口的加拿大的应用,硬说人家不行,我也是服了。

    再给你一个例子。我朋友国内创业,做江苏电网的智能应用。江苏电网有几千万的智能电表,每天光数据都2T多。之前的Oracle/IBM系统根本处理不过来,云计算的方法很好的解决了这个问题。

    时代不同了,新问题要新办法了。


    点评

    给力: 5.0 +1: 5.0
    这真是极好的: 5.0 不能同意更多: 5.0
    涨姿势: 5.0
    给力: 5 涨姿势: 5
      发表于 2020-9-5 22:21
    给力: 5 涨姿势: 5
      发表于 2020-9-4 09:32
    给力: 5 +1: 5 这真是极好的: 5 不能同意更多: 5
      发表于 2020-9-4 08:23

    评分

    参与人数 1爱元 +8 收起 理由
    方恨少 + 8

    查看全部评分

    回复 支持 2 反对 0

    使用道具 举报

  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    8#
    发表于 2020-9-4 09:16:23 | 显示全部楼层
    老兵帅客 发表于 2020-9-4 08:54
    几千万就玩不过来了?可能嘛,PC FINANCIAL一个加拿大的小银行,一个表就是上亿笔记录了,几十个表,几个 ...

    是几千万个设备,每15分钟发次数据,相当于每分钟有大几百万台设备连接你。人家是每天2T的数据,你那是总共几个T的数据,是同一个级别吗?加拿大银行要是每分钟几百万用户交易,每天几个T的交易记录,Oracle还能玩起来很轻松,那我承认Oracle&加拿大银行很牛逼。

    你可以耻笑我朋友太水了,但人家公司卖了几个亿早财富自由了。你可以说Oceanbase不行,但人家每天给几亿人服务着呢。Oracle的日子是越过越好,还是越来越难,自己知道罢了。

    是个人都知道数据量大了,分而治之,关键是怎么做。人家能做出来,稳定运行,我觉得挺牛逼的。Google云计算也是分布并行,我也觉得人家挺牛的啊。这么说芯片产业不就是把晶体管做得越来越小吗。

    点评

    给力: 5.0 涨姿势: 5.0
    给力: 5 涨姿势: 5
      发表于 2020-9-5 22:22
    给力: 5
      发表于 2020-9-4 09:35

    评分

    参与人数 1爱元 +8 收起 理由
    方恨少 + 8

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    9#
    发表于 2020-9-4 09:26:14 | 显示全部楼层
    老兵帅客 发表于 2020-9-4 09:19
    为什么电表要每15分钟发送一次数据,这个设计就不合理。国内的财务自由方法很多,俺很理解。 ...

    具体要问电力系统的专家,不是技术所限,人家还巴不得实时报告数据呢。发送的又不仅仅是用了多少电,还有电压、电流等n多数据呢。他们做的一个应用就是预测未来的用电情况,帮助电网保持均衡。这样,数据当然越及时越准确。

    另外,朋友国内的公司卖了,美国的没卖,PGE也是他们的客户。是不是有美国客户,看起来就不那么水了?

    点评

    给力: 5.0 涨姿势: 5.0
    油墨: 5.0 油菜: 5.0
    油墨: 5 油菜: 5 给力: 5 涨姿势: 5
      发表于 2020-9-24 18:05
    给力: 5 涨姿势: 5
      发表于 2020-9-5 22:22
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    10#
    发表于 2020-9-4 09:39:41 | 显示全部楼层
    老兵帅客 发表于 2020-9-4 09:29
    统计数据不需要这么详细的收集,可以在本地收集,每天报告一次即可。这种收集完全可以用单板机做,费用立 ...

    电网要你预测十分钟后的用电情况,你说,给我一天时间,等明天数据报告上来再给你预测啊。
    回复 支持 1 反对 0

    使用道具 举报

  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    11#
    发表于 2020-9-4 09:59:55 | 显示全部楼层
    老兵帅客 发表于 2020-9-4 09:47
    统计不会需要那么及时的数据,可以在本地采集,按天上传就够了。真要是发电机出了问题,导致供电不足,统 ...

    不仅仅是统计,还有对数据的处理,包括预测。不是说发电机出问题了,是用电量是变动的,有时候用电多,有时候用电少,发电厂的发电量要动态调整,否则电压会过低过高,严重情况电网会出故障。国内很多是火电,调峰机组启动、关闭都需要时间的。能更早预测出来,意义是十分重大的。

    需求在这里,你可以搞个更优的方案,说服客户用Oracle数据库,免得我朋友和PGE里应外合,挖资本主义墙角,顺便你也可以发个小财。

    点评

    给力: 5.0 涨姿势: 5.0
    给力: 5 涨姿势: 5
      发表于 2020-9-24 16:37
    给力: 5 涨姿势: 5
      发表于 2020-9-5 22:18

    评分

    参与人数 1爱元 +4 收起 理由
    老财迷 + 4

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    12#
    发表于 2020-9-6 14:58:33 | 显示全部楼层
    世界不是非黑即白的。国内有问题,也有成就,这两者并不冲突。不能因为成绩掩盖一切问题,也不能说因为问题就抹杀一切进步。我们做技术的,要尽量保持公正之心,探讨具体的技术问题。
    回复 支持 1 反对 0

    使用道具 举报

  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    13#
    发表于 2020-9-8 08:48:50 | 显示全部楼层
    老兵帅客 发表于 2020-9-7 19:22
    极高并发,超高时效的应用,北美一样有对应的实现,只不过没有像国内那样死命吹而已。 ...

    来,吹一个,加拿大有什么极高并发,超高时效的应用?Pornhub?

    点评

    涨姿势: 5.0
    涨姿势: 5
      发表于 2020-9-28 18:36
    回复 支持 3 反对 0

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2024-5-7 09:16 , Processed in 0.063332 second(s), 29 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表