Cotidianamente, hay muchas situaciones en las que lamentablemente se tiene que perder el tiempo haciendo cola para poder ser atendido. Situaciones tales como hacer cola en un peaje para efectuar el pago correspondiente, hacer cola en un supermercado para cancelar en caja por los productos deseados; en una computadora, un programa tiene que esperar para efectuar su labor, porque el procesador está atendiendo otras tareas; en internet, no se puede acceder a una página web, porque el servidor está atendiendo peticiones de otros usuarios, y entonces hay que esperar hasta que se reduzca la cantidad de peticiones; en un negocio de lavado de carros, la carga de trabajo y la cantidad de recursos atendiendo, determinan en cuánto tiempo te podrán atender. La pregunta es ¿por qué ocurren las colas? Ocurren porque la demanda del servicio supera la capacidad de atención de quienes brindan dicho servicio (para decirlo de modo simple, por ahora). Se dice que en promedio las personas pasan cinco años de sus vidas haciendo colas.
El hecho de hacer colas no ha aparecido de súbito en los tiempos modernos debido a la conglomeración de personas en las ciudades, para nada. Toda la vida han existido colas; frente a esto, cada civilización le buscó soluciones empíricas y medianamente efectivas para atenuar la problemática que afrontaban. De hecho, inclusive se puede afirmar que las personas están casi acostumbradas a hacer cola para recibir atención. Felizmente han surgido estudiosos decididos a enfrentar este problema de manera científica.
La teoría de colas o, como se conoció en un principio, Teletráfico en ingeniería de Telecomunicaciones (A.K. Erlang, 1909), lanza su primera publicación llamada La teoría de probabilidades y las conversaciones Telefónicas. Erlang, por aquel entonces era empleado de una compañía telefónica y tenía asignada la tarea de recomendar el número de líneas de atención, tomando en cuenta la frecuencia y duración de las llamadas. Si bien es cierto que éste fue el comienzo del estudio de la teoría de colas, no fue sino hasta los años 50 que empezaron a difundirse gran cantidad de trabajos relacionados a Teoría de colas en diversos campos.
La teoría de colas, a través de modelos, permite representar comportamientos en los cuales el factor común es el tráfico que se genera, y presenta los aspectos que originan que se generen estas colas y la manera de afrontarlas. Hay características que cumplen todos los sistemas de colas, empezando con (a) El patrón de llegada, el cual en la vida real es aleatoria, es decir, a la cola no llegan clientes cada x tiempo exacto, a veces llegan solos, a veces en grupo, hay que tomar en cuenta también que algunos clientes se cansarán de esperar en la cola y terminarán retirándose, lo cual añade más variables a tener en cuenta al realizar el cálculo de servidores. (b) El número de personas en la cola, para este caso se toma en cuenta el estilo con el cual se ordenan las colas: en la mayoría de casos la atención se realizará tomando en cuenta el orden de llegada, es decir, se atiende a quien llega primero, en otros casos, se formarán varias colas dando preferencia a ciertos clientes, basándose en criterios tomados en cuenta. (c) El número de personas que están siendo atendidas. (d) El tiempo que se invierte esperando en la cola. (e) El tiempo que se invierte siendo atendidos. (f) La capacidad del sistema, toma en cuenta la posibilidad de desbordamiento de las colas por exceso de clientes aglomerados esperando su turno de ser atendidos. (g) El número de servidores, la capacidad de múltiples servidores ante una única cola es una característica importante, éstos tienen demostrado mejor rendimiento antes que aquellos sistemas donde se hacen múltiples colas, cada uno con su propio servidor, lo cual da la posibilidad de tiempos flojos de algunos servidores, mientras que colapsos en otros.
Independientemente de lo optimizado y bien elaborado que pueda estar, un sistema de colas puede ser tan complejo como lo requiera el servicio, puede funcionar mediante una sola etapa o puede ser multietapas, es decir, puede necesitar pasar por varias colas para completar el servicio. El pago de peaje es un sistema de una etapa: se hace la cola para pagar, no hay más. Caso diferente es el servicio de lavado de autos: es un sistema de múltiples etapas: se hace una cola inicial para pagar por adelantado el servicio, luego viene la cola para el aspirado del carro, luego la cola para el ansiado lavado del carro, finalmente hay que dirigirse a otra cola para el secado.
¿Cómo sabemos si en un negocio los clientes están siendo bien atendidos? ¿Cómo se mide el rendimiento de un sistema? Básicamente se deben establecer métricas para detectar la calidad del sistema o, en todo caso, diseñar un nuevo sistema que cumpla los requisitos para ser óptimo. El costo de implantar un nuevo sistema debería permitir la recuperación de dicha inversión, mediante el servicio que se brinda. Para lograr esto, es necesario que se analicen fuertemente y se obtenga información de tres tipos principalmente: ¿Cuánto es el tiempo de espera de los clientes? ¿Cuál es la cantidad de clientes esperando? ¿Cuál es el tiempo ocioso de quienes atienden?
Para responder estas preguntas, es necesario recopilar información. La forma de recopilar esta información es importante, antes que registrar información cada cierto período de tiempo, es recomendable capturarla mediante eventos que se suscitan en el momento, es decir, se registra la información cada vez que ocurre. Por ejemplo, registrar cada cuánto tiempo llega un cliente y cuánto tiempo tardan en atender a este cliente. La mayoría de modelos aceptan que el tiempo entre llegada de clientes sigue el flujo de una distribución de Poisson. También se acepta que el flujo de atención de los clientes, cuando quienes atienden están ocupados, sigue una distribución de Poisson y el tiempo que dura la atención, sigue una distribución exponencial.
Sin embargo, debemos precisar que no siempre se solucionan los procesos con distribuciones de Poisson o exponenciales, algunos procesos funcionan mejor con otras distribuciones. Para trabajar con la distribución adecuada, es requisito conocer a plenitud cada una de ellas, lo cual nos abre un abanico de oportunidades y de aprovechamiento; asimismo, igual de importante es conocer el procedimiento para determinar cuál es la distribución que se ajusta a cada situación.
Empecemos conociendo la notación de Kendall, que permite reconocer características de un modelo simplemente analizando las letras que la conforman. La estructura general es la siguiente: A/B/X/Y/Z/V; donde A representa la distribución de llegadas y puede tomar los valores: M, para distribuciones exponenciales; D, para distribuciones determinísticas y G, para llegadas generales; B refiere a la distribución de servicio, y puede tener las mismas distribuciones que A; X representa la cantidad de servidores; Y representa el número máximo de clientes que puede soportar el sistema, si es infinita no es necesario mencionarla; Z es la disciplina, de igual forma se omitirá si es FIFO.
A continuación se hará un repaso por los diferentes modelos de colas simples: (a) El modelo de cola simple, también conocido como M/M/1, este esquema trabaja bajo un único servidor y tanto la tasa de llegada como la de servicio siguen la distribución de Poisson. (b) El modelo de colas en paralelo o M/M/C, es el esquema bajo el cual más de un servidor atiende a los clientes con la misma calidad. (c) Modelo de cola con servidores en paralelo y límite de capacidad o M/M/c/K, útil para los casos en los que no se puede atender a todos los clientes. En la nomenclatura, el límite de atención es representado por K. (d) El modelo de Erlang o M/M/C/C, esta distribución atiende casos en los que la cola de clientes debe coincidir con el número de servidores, en otras palabras: nunca debe existir cola en la atención. Funciona independientemente de la distribución usada en el servicio. (e) Modelo de cola sin límite de servidores o M/M/∞, especialmente útil para situaciones en las que el número de servidores no tenga que tener un límite, por ejemplo en los casos en que los clientes acceden a internet. (f) Modelo de colas con límite en la fuente, para casos en los que la cola tiene un número finito de clientes. (g) Modelo de colas con impaciencia, para los casos en los cuales los clientes se integran a la cola sólo si ésta no está saturada, o si les alcanza el tiempo para esperar. (h) Colas que no siguen el modelo de Poisson o Exponencial o G/G/c, para casos por ejemplo del modelo M/G/1, donde los clientes aún llegan con una distribución de Poisson, pero son atendidos mediante un proceso más general.
Finalmente, se han analizado modelos para representar cualquier situación que involucre hacer cola. Con estos modelos, es posible determinar la capacidad de servicio que necesita un sistema para atender eficazmente a sus clientes. Como es de esperarse, no es una tarea fácil, pero es más barato simular un sistema que hacer cambios en el sistema sin saber si solucionará los problemas. Los resultados que brinda la teoría de colas se aplican en todos los ámbitos, sea transportes, telecomunicaciones, negocios de diversas índoles, comercio, industria, etc. Por ejemplo en el trabajo final se demostró la utilidad de aplicar la teoría de colas a un negocio de lavado de carros, el cual inicialmente, al poseer sólo 6 servidores en la sección de secado de carros, originaba que se congestione el negocio, y los tiempos de atención rápidos que se ganaban en las primeras etapas, se pierdan por el retraso en el secado.
Al incrementar en tres servidores más se demuestra la eficiencia que esto arroja, al lograr una utilización de mano de obra superior de 89.16%, lo cual antes era de 73.04%, lográndose una mejor atención y un mejor aprovechamiento de los recursos que participaban en el proceso de lavado de carros.
