Lentidão - Carga
Incident Report for TiFlux
Postmortem

Ontem tivemos uma correção no envio de notificações de chat quando era enviado um anexo. Aconteceu de que todas as mensagens recebidas após qualquer anexo, travavam o serviço fazendo as mensagens ficarem pendentes. Através de nosso monitoramento identificamos este problema no dia de hoje (28/01) por volta das 09:10. Após a resolução do bug, aconteceu uma carga fora do comum em nosso banco de dados.
Esta carga fez com que o banco de dados ocupasse todo o I/O, gerando lentidão para todas as requisições subsequentes. Devido à nossa alta carga de trabalho acabou ocorrendo um efeito “cascata” de cargas, tivemos que administrar a carga ao longo do dia, o que infelizmente gerou muita instabilidade e lentidão em alguns momentos em nosso sistema.
Já haviamos previsto que algo do gênero poderia acontecer e estávamos trabalhando para que este dia não chegasse, infelizmente, este dia chegou antes de entregarmos o que evitaria isso.
Estamos muito chateados com a situação e entendemos que provavelmente nossos clientes também, mas em momento nenhum medimos esforços para conseguir entregar o nosso melhor.
Temos um pacote de entregas que gostaríamos de estar comemorando junto à nossos clientes hoje, porém, vamos focar em reestabelecer nossos serviços em 100% e fazer testes para garantir que amanhã estaremos a todo vapor ajudando nossos clientes a entregarem excelência.

Atenciosamente,
Fábio Miguel Mello
CTO

Posted Jan 28, 2021 - 17:56 GMT-03:00

Resolved
This incident has been resolved.
Posted Jan 28, 2021 - 17:47 GMT-03:00
Update
O último serviço que faltava (serviços em background e notificações) foi reestabelecido agora.
Posted Jan 28, 2021 - 17:46 GMT-03:00
Update
Os serviços voltaram, ao longo da noite estaremos fazendo a revisão e colocando um relatório detalhado de tudo que ocorreu para transparencia com todos os nossos clientes, obrigado.
Posted Jan 28, 2021 - 17:16 GMT-03:00
Update
Continuamos monitorando
Posted Jan 28, 2021 - 16:10 GMT-03:00
Update
Serviços de notificações e envios de e-mail serão reestabelecidos somente fim da tarde.
Posted Jan 28, 2021 - 14:05 GMT-03:00
Update
Reiniciando uma das instancias de banco
Posted Jan 28, 2021 - 13:33 GMT-03:00
Update
Nova lentidão começou após as 13:15.
Estamos verificando a carga de banco.
Posted Jan 28, 2021 - 13:27 GMT-03:00
Update
O sistema já está acessível, porém os chats ainda estão sofrendo grande quantidade de atualizações. O que pode resultar em lentidão ao utilizar o chat
Posted Jan 28, 2021 - 12:48 GMT-03:00
Update
Carga de banco está diminuindo de forma gradual.
Novo horário: 12:50
Posted Jan 28, 2021 - 12:00 GMT-03:00
Update
Previsão para reestabelecer 100% - Meio dia (12:00)
Posted Jan 28, 2021 - 10:45 GMT-03:00
Update
Requisições estão baixando o tempo de resposta
Posted Jan 28, 2021 - 10:04 GMT-03:00
Monitoring
A fix has been implemented and we are monitoring the results.
Posted Jan 28, 2021 - 10:04 GMT-03:00
Investigating
Estamos sofrendo uma lentidão devido a carga que ocorreu por uma correção, enviando informações que não estavam sendo enviadas de notificações e chats.
Posted Jan 28, 2021 - 09:57 GMT-03:00
This incident affected: Web Portal, API, Remote Access VNC, and WhatsApp Web Integration.