Microsoft의 12 월 3 일 Office 365 중단 : 무엇이 잘못 되었습니까?

2 주 전 만해도 유럽의 Office 365 고객 중 몇 시간 동안 정전으로 타격을 입었습니다.

Microsoft는 호주의 Azure 호스팅 지역을 시작했으며, 국방 거물은 Patriot Act의 두려움을 인용하여 Microsoft의 구름을 파고 들었습니다. 예, 미국 당국은 EU 클라우드 데이터를 감시 할 수 있습니다. 방법은 다음과 같습니다.

Microsoft 관계자는 최근 Office 365 대시 보드에서 제공되는 인시던트 보고서를 통해 무엇이 잘못되었는지에 대한 세부적인 내용을 공유했습니다. Windows IT Pro의 Tony Redmond 블로그 게시물 덕분에 PIR IS3496 보고서를 처음 발견했습니다. 대지. (어떤 이유에서든 필자 자신의 Office 365 대시 보드에서 사건 보고서를 찾을 수 없었지만 그 전체 사본을 보았습니다.)

이 보고서에 따르면 12 월 3 일 Office 365 가동 중단은 대략 오전 9 시부 터 시작하여 약 4 시간 지속되었습니다. 이 보고서는 “유럽 지역에서 많은 고객들이이 문제의 영향을 받았다”고 인정했다. 유럽을 통해 인증 된 다른 지역의 고객 중 일부도 문제를 경험했을 수 있습니다.

OOTW (Outlook on the Web) 요청의 약 1 %와 35 %가 영향을 받았다 “고 지적했다.

영향을받은 사용자는 Office 365 포털에 로그인 할 수 없었고 일부 사용자는 SharePoint Online 서비스, Power BI, Microsoft Intune, Yammer 및 Exchange Online을 포함하여 Office 365 서비스에 액세스 할 수 없었습니다. 웹 (OOTW) 사용자가 가장 많은 영향을 받았지만 Outlook 및 Exchange ActiveSync (EAS) 모바일 장치에 미치는 영향은 미미했습니다.

또한 서비스 상태 대시 보드에 대한 액세스도 발생했습니다. Microsoft에서 백업용 “긴급 방송 시스템”(EBS)을 사용하고 있지만 유럽 지역의 고객은 EBS 오류로 인해이 페이지에 대한 업데이트를 볼 수 없었습니다.

그 뿌리에서 12 월 3 일 정전은 로그인 / 식별 문제였습니다. 그 원인은 2 배 였고,

1. 최근 업데이트에서는 프로덕션 및 사전 프로덕션 인증 인프라 사이의 구성 문제가있었습니다. 이로 인해 일부 요청이 잘못 라우팅되어 AAD (Azure Active Directory) 프런트 엔드에서 인증 요청 백 로그가 생성되었습니다.

2. AAD의 잘못된 요청 요청 잔량에는 시스템 리소스 사용률이 높아져서 유럽 지역 정상 영업 시간 동안 트래픽이 증가하면서 문제가 더욱 복잡 해지는 계단식 효과가있었습니다. 이로 인해 유럽 데이터 센터에서 간헐적 인 인증 요청이 실패하고 AAD 인증 서비스가 실패하여 Office 365 서비스에 영향을주었습니다.

엔터프라이즈 소프트웨어, 달콤한 수세! 클라우드, 인텔, 에릭슨, 미디어 업계에 초점을 맞춘 파트너십 강화, 클라우드,? Xero, 맥쿼리 은행과 BPAY 결제 제휴 체결

비슷한 문제가 앞으로 진행되는 것을 막기 위해 Microsoft가 다음에 무엇을 할 수 있습니까?

이 회사는 테스트 절차를 개선하기 위해 결함 주입 기술을 추가 할 예정이며 이전 버전의 인증 서비스를 사용할 수있는 추가 대체 메커니즘도 추가 할 계획이다.

Microsoft는 높은 CPU 사용으로 인한 잘못된 라우팅 요청의 가능성을 막기 위해 과부하 감지 및 복구 메커니즘을 추가하고 계단식 오류를 방지하기 위해 서비스 끝점 간의 격리를 향상시킬 계획이라고 보고서는 덧붙였다.

잘못된 콘텐츠 배달 네트워크 (CDN) 링크로 인해 사용자가 http://status.office.com에서 업데이트를 볼 수 없으므로 Microsoft는 Office 365 포털에 대한 액세스가 영향을받는 경우 스위치 오버 옵션을 검토 할 계획입니다.

Microsoft의 보고서에는 다음 단계의 완료 날짜가 “2015 년 12 월”으로 나열되어 있습니다.

나는 Microsoft 공무원에게 12 월 3 일 정전으로 영향을받는 사용자가 어떤 방식 으로든 보상을받을 것이고 회사에 아무런 언급이 없다고 말했는지 물어 봤습니다.

Microsoft가 Office 365 및 Azure 중단의 이전 사례에서와 같이이 부검을 공개적으로 마주하는 블로그 게시물이 아닌 대시 보드 보고서로 제공 한 이유가 궁금합니다. 다시 말하지만, 회사의 의견도 없습니다.

달콤한 수세! HPE 자체가 Linux 배포판을 방해합니다.

Twilio, 민첩성을 약속 한 새로운 엔터프라이즈 계획 발표

인텔, 에릭슨, 미디어 산업에 중점을 둔 파트너십 확대

? Xero, BPAY 지급을 위해 Macquarie Bank와 파트너십 체결