Coinbase objavio izveštaj o prekidu rada od 7. maja koji je zaustavio trgovanje i transakcije 

Coinbase je objavio detaljan izveštaj o velikom prekidu rada koji se dogodio 7. maja 2026. godine. Problem je trajao više sati i uticao je na ključne funkcije platforme, uključujući trgovanje, depozite, povlačenja sredstava, slanje i primanje kriptovaluta, kao i druge osnovne usluge koje korisnici svakodnevno koriste.
Prema objavljenom objašnjenju, uzrok incidenta bio je kombinacija problema u infrastrukturi Amazon Web Services-a i dodatnih poteškoća povezanih sa Kafka sistemima. Coinbase je naveo da je kvar počeo nakon što su otkazale rashladne jedinice u jednom AWS data centru u okviru regiona us-east-1. Zbog problema sa hlađenjem, aktiviran je bezbednosni sistem koji je isključio deo infrastrukture, uključujući EC2 instance i EBS volumene.
Ovaj tehnički problem imao je ozbiljne posledice po rad Coinbase platforme. Trgovanje je postalo nedostupno, a korisnici nisu mogli normalno da kupuju, prodaju, šalju, primaju, uplaćuju ili povlače sredstva. Problemi nisu pogodili samo obične korisnike, već i Coinbase Prime klijente, kod kojih je došlo do narušenog usmeravanja naloga.
Jedan od najvažnijih delova koji je bio pogođen jeste matching engine, odnosno sistem koji spaja kupovne i prodajne naloge na tržištu. Taj sistem je posebno osetljiv jer mora da radi brzo, stabilno i uz veoma malu latenciju. Kod velikih kripto berzi, i kratak prekid ovakvog sistema može izazvati ozbiljne probleme, posebno ako se dogodi u periodu pojačane tržišne aktivnosti.
Coinbase je naveo da je matching engine bio postavljen u jednom AWS objektu, gde je korišćen klaster dizajniran za nisku latenciju. Problem je nastao zato što je deo tog klastera izgubio dovoljan broj čvorova za normalan rad. Kada sistem zasnovan na takvom modelu izgubi potreban kvorum, ne može automatski da nastavi sa radom bez dodatne intervencije.
Zbog toga oporavak nije bio jednostavan. Timovi nisu mogli samo da prebace sistem na drugu zonu i nastave rad. Bilo je potrebno ručno menjati kod i napraviti novu grupu čvorova kako bi se ponovo uspostavila stabilnost. Kvorum je obnovljen nešto posle ponoći po istočnom američkom vremenu, ali tržišta nisu odmah otvorena jer su postojali dodatni problemi u pozadinskim servisima.
Drugi veliki tehnički problem bio je povezan sa AWS Managed Streaming for Apache Kafka, odnosno MSK servisom. Kafka se koristi za obradu tokova događaja i komunikaciju između različitih sistema u pozadini. Kada takav sistem ne radi pravilno, posledice se mogu proširiti na veliki broj usluga koje zavise od događaja, podataka i sinhronizacije.
Prema izveštaju, problem u MSK kontrolnom sloju sprečio je automatski izbor novog lidera za određene particije kada je jedna zona otkazala. Zbog toga su pojedini klasteri bili blokirani, a tokovi događaja nisu mogli pravilno da se obrađuju. To je uticalo na sisteme povezane sa naknadama, cenama, knjigovodstvenim evidencijama, plaćanjima i podacima.
Situaciju je dodatno otežalo to što je jedan od klastera bio podešen kroz konfiguraciju sa dve availability zone, što je smanjilo otpornost sistema na ovakvu vrstu kvara. Na kraju su, uz pomoć AWS inženjera, ručno premeštene particije i postepeno je omogućen oporavak zavisnih sistema.
Coinbase je saopštio da je matching engine prvo vraćen u režimu u kojem je korisnicima bilo omogućeno samo otkazivanje naloga. To je česta mera opreza kod oporavka trgovačkih sistema, jer platforma prvo želi da korisnicima omogući smanjenje rizika, bez potpunog otvaranja tržišta dok svi sistemi nisu stabilni. Potpuno trgovanje je zatim obnovljeno na svim order book tržištima.
Usluge namenjene običnim korisnicima vraćale su se postepeno. Neki delovi sistema su proradili ranije, dok su pojedini zaostali tokovi događaja očišćeni tek kasnije tokom dana. To pokazuje da problem nije bio samo kratko gašenje jednog servisa, već složen incident koji je zahvatio više delova infrastrukture.
Coinbase je u izveštaju priznao da ovakav nivo prekida nije ispunio očekivanja kompanije u pogledu pouzdanosti. Kompanija je navela da je njena infrastruktura trebalo da bude dovoljno otporna da izdrži kvar jedne availability zone u okviru cloud infrastrukture. Drugim rečima, sistem je morao bolje da reaguje na izolovani problem u jednom delu AWS okruženja.
Ovo priznanje je važno jer pokazuje da čak i velike kripto berze, koje koriste naprednu cloud infrastrukturu, mogu imati ozbiljne slabosti ako određeni ključni sistemi nisu dovoljno raspoređeni i automatizovani za brzo prebacivanje u slučaju kvara. Kod platformi koje rade sa novcem i digitalnom imovinom, pouzdanost nije samo tehničko pitanje, već direktno utiče na poverenje korisnika.
Incident takođe pokazuje koliko je kripto tržište zavisno od stabilne infrastrukture trećih strana. Iako Coinbase upravlja svojom platformom, veliki deo tehničke osnove oslanja se na cloud provajdere kao što je AWS. Kada dođe do kvara u data centru, hlađenju, mreži ili upravljanim servisima, posledice mogu pogoditi krajnje korisnike koji možda ni ne znaju da platforma zavisi od takve infrastrukture.
Sa druge strane, odgovornost platforme je da projektuje sistem tako da može da izdrži ovakve probleme bez višesatnog prekida. Upravo zbog toga je post-mortem analiza važna: ona ne služi samo da objasni šta se dogodilo, već i da pokaže gde sistem nije bio dovoljno otporan i šta treba poboljšati.
Za korisnike, ovakav prekid može biti posebno frustrirajući jer se kripto tržište kreće neprekidno, 24 sata dnevno. Ako korisnik ne može da zatvori poziciju, prebaci sredstva ili reaguje na naglu promenu cene, posledice mogu biti finansijski značajne. Zato se od velikih berzi očekuje visok nivo dostupnosti, naročito u periodima povećane volatilnosti.
Prekid rada Coinbase-a od 7. maja naglašava i širi problem u industriji: kripto platforme moraju da spoje dva sveta. Sa jedne strane, kripto tržište zahteva stalnu dostupnost bez pauze. Sa druge strane, infrastruktura, cloud servisi i kompleksni backend sistemi i dalje imaju tačke mogućeg kvara. Kada se te slabosti pojave, oporavak može zahtevati ručne intervencije i pomoć više timova.
Coinbase je zahvalio AWS inženjerima i svojim internim timovima na radu tokom incidenta. Ipak, sama činjenica da je oporavak trajao satima pokazuje da postoje lekcije koje platforma mora da primeni. To se posebno odnosi na automatizaciju prebacivanja sistema, otpornost Kafka klastera, raspored kritične infrastrukture i uklanjanje zavisnosti od jedne fizičke lokacije.
Za industriju digitalne imovine, ovaj slučaj je podsetnik da reputacija velikih berzi ne zavisi samo od broja korisnika, regulatornih licenci ili obima trgovanja. Ona zavisi i od sposobnosti da sistem ostane dostupan kada dođe do tehničkih problema. U svetu u kojem se milijarde dolara mogu pomeriti za nekoliko minuta, dostupnost platforme postaje jedan od ključnih elemenata poverenja.
Sve u svemu, Coinbase-ov izveštaj o prekidu rada od 7. maja pokazuje da je incident nastao zbog kombinacije AWS infrastrukturnog kvara i problema u Kafka sistemima koji su usporili oporavak. Trgovanje, depoziti, povlačenja i druge usluge bile su poremećene više sati, dok je potpuni oporavak zahtevao ručne intervencije i koordinaciju sa AWS timovima. Kompanija je priznala da sistem nije ispunio očekivani nivo otpornosti, što ovaj događaj čini važnom lekcijom za Coinbase, ali i za širu kripto industriju.




