作者name2name2 (yang~hi)
看板Google
标题[情报] Google云服务爆重大网路连线事故,18小
时间Sat Sep 2 11:06:19 2017
1. 情报or新闻 连结:
http://www.ithome.com.tw/news/116559
2017-08-31发表
2. 内文:
Google云服务爆重大网路连线事故,18小时无解只能回复旧设定,影响遍及美、欧及亚部
分用户
昨日下午,Google Cloud云端服务的网路连线出现大灾情,事故1小时後Google才找到原
因,原来是负载平衡设备连线出错,但一直找不出解决办法,直到18小时後,Google祭出
最後手段,将设定恢复到前一版,才将问题排除,但已影响到美国、欧洲和亚洲多个地区
用户使用。
Google Cloud云端网路连线出现异常,发生在昨天下午3点52分(美国时间0时52分),
Google随後也马上派人展开调查,从Google Cloud Status Dashboard网站页面上也记录
下整起网路连线灾情事件的经过。直到事故发生的1小时後,Google才找到问题原因,是
因为云端网路负载平衡设备连线设定出错,而造成应用程式与後端系统连线出现异常,导
致用户无法正常连线使用。
Google工程人员虽然紧急马上展开修补作业,但再事件爆发後的5小时还是修不好,而影
响所及的区域已经包含Google在us-east1, us-central1, europe-west1,
asia-northeast1 以及 asia-east1等多个服务地区,直到18小时後,Google发现问题解
决不了,才采取进一步紧急措施,改将负载平衡设定恢复到前一版本配置,才逐步将所有
有网路连线问题的区域排除。一直到今天早上11:18分,事件爆发快一天後,Google
Cloud服务的网路连线才全面恢复正常。
从Google Cloud Status Dashboard网站页面上也记录下整起网路连线灾情事件的经过,
从台湾时间8/30下午4点一直到8/31早上11点这段期间,Google Cloud Networking的网路
连线就一直出现异常情况。
Google没有解释原因,不过前不久Google才因为要降低网路延迟,而将可以大幅增加网速
的新演算法运用在自家的Google云端平台,希望藉此来加快网路速度。
前一周,Google也才因为不小心网路设定错误,误发了错误的BGP(Border Gateway
Protocol)路由资讯,让有效网站IP的流量,导向不负责转发的Google伺服器,等同将这
些网站的流量导向黑洞,这也造成日本两大电信业者NTT和KDDI行动用户短暂无法正常上
网,甚至不少网路服务也大受影响,被迫暂时停止服务。
这次事件也反应出了全球性的大型网路服务公司,如Google等,在网路架构设计上已经具
备有全球性规模,若是一个不小心,网路设定配置不当,不只会对自家云端服务造成冲击
,甚至也可能连带影响到全球网路的稳定,严重更可能造成全球性大规模的网路灾情,这
也凸显出,当网路被掌握到少数像Google具全球规模的网路公司手中潜藏的新风险。
3.心得:
(记得附上至少15字心得唷,或是底下推文至少15字亦可)
之前听过不少次FB内部设定错误影响服务的消息,
这次看到google的,
心得觉得就算是知名云端,在这种意外错误的可能性下也不完全稳当
--
~
Sent from my
PCMan Combo ~
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.42.75.168
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Google/M.1504321585.A.D22.html
※ 编辑: name2name2 (114.42.75.168), 09/02/2017 11:08:28
1F:推 CP64: 只有听到前几天日本那边的灾情 这个倒是没注意到 09/02 12:14
2F:→ smiling: 战斗女子学园官网FB上,8/30日到是有公告『由於Google伺 09/02 14:55
3F:→ smiling: 伺服器发生问题,无法豋入游戏。』 09/02 14:56
5F:→ bailan: 日本那不是有说可能是google造成? 09/02 15:22
6F:推 coffeemilk: 还是要用知名的啊!不知名的连那时突然暂停营运搞不好 09/04 14:40
7F:→ coffeemilk: 都不知道 09/04 14:40