爱吱声

标题: 谈谈大型网站架构的一些关键技术 [打印本页]

作者: 季侯    时间: 2012-1-17 10:11
标题: 谈谈大型网站架构的一些关键技术
想进黑虎帮,没积分啊,发点贴
: u9 r: J3 c% e- E2 l8 A1 r- B2 L7 |5 `

8 j- {0 Y) _, ^9 f7 h, `最近12306很火,无数人站出来为铁道部指点迷津,提出了无数个解决方案。虽然很多人没做过网站也没写过程序,,,,,
8 e9 w8 O# [* I5 ~- \0 e+ d) m) C% A' a: W
乘罗教主还没空,我也凑个热闹,说说网站架构的一些东东。当然了,纯技术的东东可能没人喜欢,所以我保留随时挖坑不填的权力。7 L) Q2 f5 l7 [: p$ C

" p& o( B5 C  V1 w$ _! a1 先说说cache% j: v0 R6 B' i6 o4 U: w
2 F! H& Y1 v! ~; D9 W3 p

6 J$ ]3 Z  |" J作为一个老军医,总有人问我,“xxx,帮我看看,为啥我这系统性能这么差?” 我的第一个反应就是,瓶颈在哪里,cache怎么做的。
$ S% a& `- i( Z6 U5 g7 @7 l( O6 H( O! @1 i- g
常有人说,木桶的容量是最短的那块木板决定的;那么如果把一个网站当作一个木桶,网站开发者这个桶匠绝对是个杯具。因为他拿到的木板太参差不齐了,有的长有上百米,有的才几公分。& W- w2 Z! ^1 w( ?1 `/ J

: U4 T$ X' |! ?- i这块最短的木板往往就是数据库了,以12306为例,常见的使用场景是:
$ j& }# `4 y* J- Y4 d& `: s
3 ?  s* t4 L2 T! m用户登录上来,根据出发地和目的地查询车次,然后选择 一个有票的车次买票,下订单,付款。
* @/ v5 E% J! K/ I
; A7 I5 n# O1 Y# k* F; U. y$ X不管是登录/查询车次/查询是否有票/下订单/付款都涉及数据库操作,是一个典型的读多写少的场景,数据库将会是瓶颈。那么为什么数据库会是瓶颈哪?2 b7 Y5 y) m( w* x6 O

7 ~: J: Y( d8 S1 数据库操作相对web层是一个非常耗时的操作,单次操作往往需要几毫秒,并发链接数也只有3000/4000;而nginx之类的静态服务器,每秒处理10万个请求,支持数万个并发链接无压力;所以只要稍微大一点的网站,数据库很容易成为瓶颈;9 S' N+ ~) e; D( s* c
+ `3 e. v% F8 i( K; q# l
2. 数据库链接是一个非常昂贵的资源,一般来说单台mysql服务器能够只能提供3000/4000的并发链接;一旦大量web请求到来,那么很有可能申请不到数据库链接,不得不排队;当队列中的请求累计到一定数量时,新的请求很容易超时,从而失败。
9 k9 r: Y! {6 ]$ ~4 q
" T8 ?  E2 J9 T! S3. 查询操作太多,基本上每买一张票都会查询很多次,而每次查询都会产生数据库查询操作。虽然可以通过建立合适的索引加快查询,通过读写分离/水平分库等手段降低单个数据库的负荷,但是只要数据库操作数量大到一定程度,那么唯一的办法就是减少数据库操作。
+ o: c! B* P& ?6 K* o# F6 u6 I, Z; C2 b/ g- t. @9 @, G1 r
将一些很少变化,但是频繁查询的数据缓存到memcached/redis等缓存服务器中是一种成熟有效的技术。以根据出发地/目的地查询为例,以往的查询需要从数据库的车次站点表中查询,现在可以把{出发地/目的地}-> [车次列表]的映射关系存到redis中,这样每次查询的时候直接从redis中就可以得到。4 N( C$ l6 f! ~5 b5 u9 a9 G

+ k  Z9 a0 |/ U: L这么做的好处是,从redis中查询比从数据库中查询要快的多,相差不止一个数量级,redis能支持的并发链接数也远远超过mysql;所以能够降低了数据库负荷,也避免了数据库链接资源的申请。. C3 B( @3 C/ f& ^3 o

# r: f' t+ Z. C# q/ r4 i1 G所以采用合理的cache技术,降低数据库负荷是大型网站架构的一个关键技术点。
( _: b% G- R/ G7 A
作者: 谜团    时间: 2012-1-17 10:23
把任务分散我觉得比较好: K6 ^7 u2 n  H3 p7 ]# Y4 r
分成100个桶
7 u* J: u7 }2 M" c- o1 i# s( P' f7 I每个桶里一定票
8 R4 x) |  q2 j4 A/ G% ?# {$ ^用户自行选择去哪个桶
作者: 大山猫    时间: 2012-11-18 16:38
谜团 发表于 2012-1-17 10:23 2 @' v, C' B# g3 W. E4 f4 C" h
把任务分散我觉得比较好3 N1 M& d7 ]" G& d
分成100个桶2 r- J0 H5 L0 Q9 S) j# c
每个桶里一定票

+ \* n6 F: @$ O- x9 l这肯定不行,会有人编程序同时选这一百个桶




欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/) Powered by Discuz! X3.2