Ημερομηνία περιστατικού: 17 Νοεμβρίου 2022‌

Περίληψη

Στις 17 Νοεμβρίου 2022, η υπηρεσία Autodesk Identity Authorization αντιμετώπισε μια διακοπή της υπηρεσίας που μπορεί να επηρέασε την ικανότητα των πελατών να συνδέονται σε προϊόντα cloud της Autodesk και να χρησιμοποιούν ροές εργασίας που συνδέονται με το cloud από τα προϊόντα επιτραπέζιου υπολογιστή μας μεταξύ 5:14 π.μ. PST έως 12:01 μ.μ. PST.

Υπηρεσίες που επηρεάζονται

  • Επηρεάστηκαν τα προϊόντα και οι υπηρεσίες cloud της Autodesk, καθώς και οι εφαρμογές επιτραπέζιου υπολογιστή με λειτουργίες που βασίζονται σε σύννεφο.
  • Οι πελάτες αντιμετώπισαν περιοδικά προβλήματα όπου δεν μπόρεσαν να συνδεθούν ή δεν μπορούσαν να παραμείνουν συνδεδεμένοι σε επηρεαζόμενα προϊόντα και υπηρεσίες.

Βασική αιτία

  • Ως μέρος μιας προγραμματισμένης αναβάθμισης για την υπηρεσία Autodesk Identity Authorization, ενημερώσαμε ένα στοιχείο βάσης δεδομένων τρίτου προμηθευτή και προσθέσαμε έναν νέο στόχο αναπαραγωγής σε μια υπάρχουσα αναπαραγωγή του συμπλέγματος βάσης δεδομένων υπηρεσίας εξουσιοδότησης. Δυστυχώς, αυτό οδήγησε σε μια απροσδόκητη διαμάχη βάσης δεδομένων και προκάλεσε αιχμές καθυστέρησης για τα ερωτήματα της βάσης δεδομένων.
  • Οι καθυστερήσεις της βάσης δεδομένων οδήγησαν σε χρονικά όρια σύνδεσης και εξουσιοδότησης σε επηρεαζόμενα προϊόντα και υπηρεσίες της Autodesk. Τα χρονικά όρια ενεργοποίησαν τα επηρεαζόμενα προϊόντα και υπηρεσίες να εκτελέσουν συμπεριφορά «επανάληψης», με αποτέλεσμα σημαντική αύξηση της επισκεψιμότητας στο σύστημα, γεγονός που προκάλεσε διακοπή της υπηρεσίας.
  • Για να επιλύσουμε αυτό το ζήτημα και να υποστηρίξουμε τον αυξημένο φόρτο, παρουσιάσαμε πολλαπλά νέα συμπλέγματα διακομιστών και διαχείριση επισκεψιμότητας διακομιστή. Με τη νέα, κλιμακωτή υποδομή, ξεκινήσαμε την αποκατάσταση της υπηρεσίας στις 8:17 π.μ. PST. Αποκαταστήσαμε την υπηρεσία σταδιακά, φτάνοντας το 100% της αποκατάστασης στις 12:01 μ.μ. PST.‌

Ενέργειες Autodesk

Η Autodesk διεξήγαγε μια ανάλυση μετά το περιστατικό του συμβάντος και εντόπισε ενέργειες που σκοπεύουμε να κάνουμε για να αποτρέψουμε την επανάληψη αυτού του ζητήματος. Μερικές από αυτές τις ενέργειες περιλαμβάνουν:

  • Συνεργασία με τον τρίτο προμηθευτή μας για την αποκατάσταση του ζητήματος λανθάνοντος χρόνου της βάσης δεδομένων.
  • Παρουσίαση βελτιωμένης υποδομής υψηλής διαθεσιμότητας και ανάκτησης καταστροφών, κλιμάκωσης όγκου και πολιτικών για τις υποστηρικτικές υπηρεσίες σύνδεσης και εξουσιοδότησης. Αυτές οι αλλαγές θα βελτιώσουν το συνολικό προφίλ ανθεκτικότητας των υπηρεσιών σύνδεσης και εξουσιοδότησης, με υψηλότερη αξιοπιστία αποτυχίας και ανάκτησης.
  • Επέκταση των δυνατοτήτων παρακολούθησης και παρατηρησιμότητας των υπηρεσιών μας για τη βελτίωση της ικανότητάς μας για έγκαιρη ανίχνευση, καθώς και για την υποστήριξη ταχύτερης διαλογής και ανάκτησης.
  • Βελτίωση της δρομολόγησης της κυκλοφορίας εφαρμογών για τη διαχείριση της υποδομής και του φόρτου του διακομιστή. Αυτό θα βελτιώσει τη συνολική κλίμακα και τη διαθεσιμότητα των υπηρεσιών μας όταν σημειωθεί εκθετική αύξηση της επισκεψιμότητας.
  • Εισαγωγή νέων πρακτικών προσομοίωσης κυκλοφορίας φορτίου και παραγωγής που θα επικυρώσουν και θα ενισχύσουν περαιτέρω τα μέτρα ανθεκτικότητας και ανάκτησης.

Η Autodesk αναγνωρίζει την ευθύνη μας να διασφαλίσουμε τη μέγιστη αξιοπιστία και τον πλεονασμό των προϊόντων και των υπηρεσιών μας και παραμένουμε δεσμευμένοι να παρέχουμε με συνέπεια αξιόπιστες και παγκοσμίου επιπέδου εμπειρίες για τους πελάτες μας. Σας ευχαριστούμε για την υπομονή και την κατανόησή σας καθώς εργαζόμαστε για την επίλυση αυτού του ζητήματος.