Foi apenas há alguns anos que um tempo de resposta de 2 segundos era considerado grande. O mundo altamente competitivo da Internet (e, possivelmente, a alta frequência de negociação em Wall Street) mudou tudo isso. O piscar de um olho normalmente leva 300-400 milissegundos. Os seres humanos podem facilmente perceber o tempo de um par de cem milissegundos. Google diz que usuários vão visitar um site menos frequentemente se é 250 ms (1/4 de segundo) mais lentos do que seu concorrente.
Então, a nova meta de tempo de resposta do usuário final para atirar é 250 ms no mundo da Internet de rápida mudança e dinâmico de e-commerce e publicidade. Não acredito que o mundo corporativo mudou na mesma direção para o tempo de resposta para suas aplicações internas - 2 segundos de tempo de resposta ainda pode ser bom o suficiente; caso contrário indústria APM de repente explodiria na receita!
O interessante é que esta ordem de altura nas expectativas do usuário é realizada para o Smartphone e rede móvel mundial também. Se nós temos que entender onde o tempo é gasto em uma transação de aplicação temos que examinar o caminho físico de uma transação.
1. O PC, laptop, tablet ou um Smartphone (dizem em Nova York)
2. Rede de área Local ou Wi-Fi ou rede móvel
3. ISP rede ou uma rede corporativa privada
4. Principais servidor complexo (digamos, em San Francisco)
5. Adicionais servidores (tais como servidores de anúncio para uma página da web)
Vamos supor que temos o mais recente e o maior dispositivo cliente e ignorar o atraso do item #1.
As latências de ida e volta para o item #2 - em um ambiente de LAN com fio (levemente carregado) são da ordem de alguns milissegundos consistentemente. Em uma rede de Wi-Fi uncongested, dependendo da faixa de freqüência (2,4 GHZ ou 5 GHZ) as latências de ida e volta estão na faixa de 1-10 ms.
As latências de ida e volta para as redes móveis são fortemente dependentes da geração e a tecnologia subjacente usado - então depende de qual rede você em casa na (2G, 2.5 g, 3G, LTE, etc.). AT&T define as latências de ida e volta de 40-50 ms para LTE. Mas para as mais velhas tecnologias HSPA e HSPA + os intervalos são 100-200 ms e ms 150-400, respectivamente. Para as mais velhas redes EDGE e GPRS é 600-750 ms.
Item de #3 depende da localização relativa o dispositivo do cliente e o servidor complexo - neste exemplo, a latência de ida e volta seria 42 ms. se o servidor complexo é Londres, Bombaim, ou Sydney as latências de ida e volta será maiores - 56, ms, ms 126 e 160 ms respectivamente.
O que tudo isso significa que é de um Smartphone mais recente, um único roundtrip de NY para SF, através de uma rede LTE custaria cerca de 100 ms. a maioria dos aplicativos precisa primeiro configurar uma conexão de TCP/IP antes de solicitar quaisquer dados do servidor. Isto implica que, para uma interação única de solicitação-resposta, passaríamos pelo menos 200 ms. assim, mesmo para esta aplicação ideal e onde todos os outros fatores de desempenho são perfeitos, que já estamos nos aproximando deste limite desejável de 250 ms.
Há quase qualquer aplicação que tenha um par de solicitação-resposta única - o que nós chamamos a loquacidade do aplicativo como o número de pares de solicitação-resposta pode ser em dezenas ou mesmo centenas. Se um Smartphone App tem 10 ida e volta que não é usual, nós já estamos olhando para um tempo de resposta de um segundo!
Neste artigo, nós examinamos como a barra sobre o tempo de resposta do usuário final aumentou para piscar de um olho e como é um desafio para alcançar a esta ordem de altura mesmo em uma situação ideal. Estamos voltados para problemas de latência, como é a limitação do fator - não consideramos mesmo servidor, banco de dados, largura de banda e aplicação de codificação de aspectos que poderiam ser ainda mais adversos. Mas existem inovadoras APM melhores práticas e técnicas para resolver todos esses problemas e abordagem a este objetivo desafiador (que poderia ser o tema de muitos artigos futuros).