martes, 24 de diciembre de 2013

El Rey ha muerto... que viva el Rey!!

Se suele afirmar que en cuanto a la determinación de la mejor estrategia durante un concurso la tasa (rate) de contactos es la que debe mandar; “rate is King” (la tasa manda!!) se dice.
En realidad no me cabe ninguna duda que los concurseros expertos si saben cual es la mejor estrategia en cada momento; cuando deben sostenerse haciendo run (contactos a la mayor velocidad posible) y cuando salir a buscar multiplicadores (hace contactos priorizando que tengan el mayor puntaje posible); y por cierto que lo hacen bien.
Lo que no está tan claro es porque, y sobre todo cuando, lo hacen.
En general uno de los aspectos mas obscuros con que se tropieza cuando se trata de abordar competitivamente la actividad concursera es, justamente, como desarrollar una estrategia que sea adecuada a lo que sea que se persiga como objetivo en el concurso.
La bibliografía sobre el tema es virtualmente inexistente; se avizoran en los relatos de otros concurseros que hay criterios en juego, solo que no se elicitan sus limites y detalles. No creo que sea por un intento de ocultar “secretos del oficio” a otros concurseros (aunque puede haber algún caso, no hay actividad que esté totalmente exenta de esas actitudes). Pero en general hay una genuina imposibilidad de explicitar los detalles, los concurseros solo “se dieron cuenta” que estaban bajos de multiplicadores, que “era el momento justo” para hacer run o que las “condiciones estaban para mas”; pero poca o ninguna traza de que elementos tuvieron en cuenta para darse cuenta. Son expertos, se dieron cuenta.
“Rate is King” es una forma de avizorar un atributo que empuja una estrategia, tratar de mantener siempre un rate alto como estrategia. Pero aún en los mas acérrimos defensores de ese plan de juego en algún momento salen a buscar multiplicadores porque el rate es “demasiado bajo”; los expertos saben cuando un rate bajo es “demasiado bajo” pero les cuesta manejar un criterio objetivo; probablemente sea una combinación tan compleja de factores que no les sea fácil comprender cuales son.
Este tema es similar a muchas otras disciplinas profesionales o amateur donde se involucra el juicio de un experto para tomar una decisión.
El experto aplica un mecanismo cognitivo complejo, quizás demasiado complejo para explicarse, pero que de alguna forma presenta un dado contexto comparándolo con situaciones anteriores para encontrar a cual es mas similar; y una vez que eso ocurre abrazar cuales son las opciones que han sido ganadoras en el pasado y evitar las que han sido perdedoras. 
No es casualidad que, después de todo, un experto se forma con experiencia; las suficientes como para tener una mochila repleta de buenas y malas decisiones. Un autor, Nassim Nicholas Taleb, insiste en su reciente libro “Antifragilidad” la noción que los sistemas se perfeccionan al exponerse a resultados adversos aleatoriamente, noción fascinante aunque quizás un poco amplia para profundizar en esta nota.
Aun asi cada experto racionaliza su propia experiencia en encontrar cuales son los atributos relevantes de un contexto para tomar su decisión y buscar en su constelación de historia pasada; no hay dos entonces que sea razonable esperar que utilicen el mismo criterio.
Daría la impresión entonces que solo queda como alternativa para desarrollar una buena estrategia concursera desarrollar suficientes experiencias buenas y malas para llenar la historia.
Hay potentes razones para no poner excesivas expectativas en un juicio de experto; el mismo mecanismo con que obtienen sus conclusiones es frágil e incompleto; es muy fácil que su “historia” simplemente no contenga ejemplos suficientes de algún elemento relevante del contexto presente como para tomar buenas decisiones, o quizás enfrenta una combinación de factores sin correlato en su experiencia y eso lo hace tomar decisiones equivocadas; el experto siempre genera sesgos y estos le hacen tomar malas decisiones. La buena noticia es que las malas decisiones luego, incorporadas a la historia, mejoran la performance futura.
En mi actividad concursera el grueso de mis participaciones hasta el año pasado fueron en modo QRP, mientras que este año he comenzado mi transito a participar mayoritariamente en modo LP. No debería ser sorprendente que las estrategias óptimas parece ser bien diferentes. En otra entrada profundizaré en esas diferencias pero claramente están relacionadas con la proporción de Run vs. S&P que parece ser óptima en cada caso. Participando en QRP era común que tuviera una cantidad de multiplicadores similar o superior en ocasiones a competidores LP o incluso HP en la misma categoría de bandas, con un número de contactos muchísimo menor; sin embargo al pasar a LP encuentro que tengo sesiones de run mucho mas elevadas, incluso comparables a los primeros puestos, pero un número muy menguado de multiplicadores comparado con ellos. Es evidente que mis habilidades competitivas han podido adaptarse bien a las tasas mas altas encontradas en LP pero a expensas de prestar menos atención a los multiplicadores que lo que parecía darle en modos QRP, interesante sin le pasara a otro, pero a mi me redujo los puntajes respecto de lo esperado.
En al menos dos concursos ya me ha pasado (CQ WW CW y mas recientemente ARRL 10) donde si bien alcancé los objetivos que me había propuesto me quedó la sensación que podría haber alcanzado mejores resultados de haber obtenido a tiempo mas multiplicadores. Si había multiplicadores disponibles o no solo puedo asumirlo, pues al no haberlos buscado no estoy seguro que los hubiera encontrado, el punto es que me ha quedado la sensación que debería haberlos buscado y no los busqué.
¿Como se sale de esta situación?¿Quizás, participando la suficiente cantidad de veces para que mi “historia” tenga los suficientes casos de éxito/fracaso para sacar conclusiones de alguna relevancia?
Muchos concurseros seguramente dirán, “claro, es un juego!” y no prestarán mucha mas atención al asunto; quizás hasta tengan razón, el aprendizaje involucrado no deja de ser una poderosa fuente de diversión y quizás es hasta mal buscar formas de aprender mas rápido y limitarla.
A mi no me convence ese enfoque, a veces me gusta desentrañar los problemas conceptualmente mas que vivencialmente.
Entonces una tarde que no tenía nada mejor que hacer mientras esperaba mi conexión en algún aeropuerto me encontré garabateando matemáticamente cual es la fórmula que determina el puntaje en la mayoría de los concursos.

Existen infinitas variantes, pero la estructura mas común es que el puntaje está determinado por la cantidad de contactos (Q), la cantidad de multiplicadores (M) y un coeficiente de peso por contacto (K) que en general trata de premiar, incluso imperfectamente, cuestiones de desafío geográfico (diferentes continentes normalmente).
El puntaje final será normalmente la multiplicación de esos tres factores (primera ecuación).
Se participa en los concursos para obtener el mejor puntaje posible en un dado contexto, lo que se tiene que optimizar es el todo y no una parte (los contactos). Debemos entonces reformular la estrategia para reemplazar el “rate is King” por “score is King” (el puntaje manda).
Hay concursos donde la cantidad de multiplicadores es tanta que simplemente “parado” en una frecuencia el flujo normal de la tasa ya traerá los multiplicadores en una proporción razonable; son casos donde nunca estamos “cortos” de multiplicadores; el CQ WPX es quizás un buen ejemplo.
Hay otros concursos donde quizás muchos multiplicadores “difíciles” se corresponden con estaciones de alta performance que quizás se procuran ellas mismas trabajarnos como multiplicador, después de todo somos razonablemente atractivos comparados con otras geografías.
Pero debería haber un enfoque que tenga en cuenta que esas condiciones son parte del contexto y tenidas en cuenta para saber si es necesario salir a la pesca de multiplicadores o quedarse haciendo run (o viceversa, buscar algún hueco para tratar de levantar la tasa).
Recurriendo a algo de matemática puedo identificar cual es el score marginal o score para el siguiente contacto, es la derivada parcial de la fórmula de puntaje respecto a los contactos Q (segunda ecuación).
También cual es el score marginal o score para el siguiente multiplicador, es la derivada parcial de la formula del puntaje respecto a los multiplicadores M (tercera ecuación).
Con el mismo criterio podría obtener el score marginal según el puntaje por contacto (K) pero por ahora asumiré que eso no es determinante en la estrategia pues depende de la oferta de estaciones y es mas o menos trivial decidir que siguiente contacto/multiplicador me conviene mas o me conviene primero, obviamente el que esté mas lejos. 
En “run” no puedo controlar este factor, excepto en el caso trivial que me contesten dos estaciones una distante y otra local, en el cual la estrategia es clara pues siempre actúo racionalmente y maximizo el puntaje. 
En “S&P” si estoy operando bajo un modo asistido puedo seleccionar primero los multiplicadores que me dén mas puntaje y luego las que menos. Pero en ninguno de los dos casos el puntaje marginal por contacto define, por si mismo, si me mantengo haciendo run y debo pasar a S&P o viceversa.
Una decisión racional consistirá en hacer siempre lo que mas puntaje me dé, entonces si el puntaje marginal de hacer un multiplicador supera en un dado momento al de hacer un contacto debería saltar a hacer multiplicadores, y en algún momento luego de suficientes multiplicadores el puntaje marginal de hacer un contacto adicional aunque no sea multiplicador  comenzará a hacer aconsejable volver a tratar de hacer la mayor cantidad de contactos posibles aunque no sean multiplicadores. Dicho matemáticamente las dos derivadas parciales deberían dictar cuando debo hacer una cosa o la otra dependiendo de cual sea mayor.
Hay, sin embargo, un efecto dinámico a tener en cuenta. Cuando suspendo un run para hacer un multiplicador hay un tiempo involucrado (Δt). Debo buscar el multiplicador (el tiempo de búsqueda será menor seguramente si estoy en modo asistido o tengo un sistema SO2R), trabajar el multiplicador lo que puede implicar participar en su propio pileup, tener en cuenta que quizás pueda no ser exitoso el intento o lleve demasiado tiempo, retornar a la frecuencia de run y volver a retomar el run.
Hay muchas formas complejas de determinar este tiempo; por el momento apelaré a la simplificación que es un promedio mas o menos estable dependiendo del concurso, el modo en que participo y la configuración de la estación (número de antenas, SO2R, etc), no estoy seguro que sea la mejor solución pero ahondar en esa dirección quizás me lleve a complicar aún mas el criterio que estoy tratando de conseguir.
Entonces al atractivo de detener todo para hacer multiplicadores debo restarle el puntaje que hubiera obtenido de haberme quedado haciendo contactos a la tasa que venía teniendo; un multiplicador puede equivaler a 10 contactos normales en un momento dado, pero si tardo 10 minutos en hacerlo dependiendo de la tasa puede que haga mas de 10 contactos normales en el tiempo que me implica el multiplicador. Puede arguirse un sentido de “oportunidad” de ciertos multiplicadores estando en un momento pero no luego en otro que sea mas propicio; pero necesariamente al modelar apelo a la simplificación que ser racional es tomar la decisión que en cada momento maximiza el puntaje.
En el mismo sentido puede debatirse cual es la tasa a utilizar (ρ) Por otra parte hay que tener en cuenta que cuando se está operando a una tasa alta se cometen errores, o sea que una proporción de los contactos hechos si me quedo haciendo run serán de todas formas inválidos y terminaré no obteniendo el puntaje. Puedo considerar esto considerando el porcentaje de UBN (μ) Finalmente, y dependiendo del concurso, en la misma actividad de run tengo un cierto flujo de multiplicadores “que vienen solos”; que proporción de multiplicadores me vienen (σ). Uniendo todos estos factores la condición de la frontera es cuando el “premio” del siguiente multiplicador sea mayor al premio de quedarse haciendo run, es decir el tercer término de la ecuación presentada.
Reordenando, cuarta ecuación, y pasando ambos términos del mismo lado puedo establecer un criterio (I) de forma que cuando el valor sea negativo (premio de multiplicador menor al premio de quedarse en run) implica que prosigo haciendo run y cuando sea positivo debo considerar el ir a intentar levantar el número de multiplicadores.
Este modelo, simplificado, tiene en cuenta entonces como viene la mezcla de contactos y multiplicadores, la tasa en un momento dado, el tiempo que me cuesta hacer un multiplicador, la relación entre multiplicadores y contactos.
El término izquierdo representa la "bondad" de ir a buscar multiplicadores y tiene en cuenta el puntaje marginal (premio) que cada nuevo multiplicador me dará si lo hago; pero al mismo tiempo es desalentado por el puntaje que tendré de multiplicadores que me vendrán de todas formas si me quedo haciendo run. El termino derecho representa el puntaje que obtengo si me quedo haciendo run "amplificado" por todos los puntos que me obtendré por los contactos hechos durante el tiempo que tarde en ir a hacer el multiplicador y volver (en promedio).
Obviamente cuando el respectivo número de multiplicadores (M) o contactos (Q) crece en forma desbalanceada el algoritmo empieza a identificar la ventaja de re-establecer el balance; si la tasa es alta tenderá a favorecer quedarse haciendo run y si el tiempo de cambio aumenta también convendrá quedarse haciendo run. Por otra parte si el flujo de contactos que son multiplicadores es alto entonces no convendrá salir a buscarlos.
El modelo parece reaccionar a los elementos que lo componen en la dirección correcta, importante primer validación.

¿Que pasará en un concurso real?

Tomo la performance en ARRL 10 donde participé en SO LP CW, por un total de 27 horas. El gráfico muestra la evolución de tres variables; la tasa de contactos (r ), la tasa de multiplicadores (rM) y la “deseabilidad” (I(x)/N) de hacer multiplicadores en un momento dado, este último normalizado al máximo valor por una cuestión de proporción gráfica.
Puede verse claramente que al comienzo del concurso la tasa “natural” de multiplicadores fue suficientemente alta para que en ningún momento sea aconsejable ir a buscarlos; el criterio que parece sugerir este modelo empiezan a notarse cuando el concurso está promediando donde coincidentemente con la baja de las tasas empieza a recomendar buscar multiplicadores (horas 16 a 24) y muestra claramente que no busqué con suficiente empeño estos en estas ocasiones excepto en la hora 16 donde la tasa de multiplicadores subió significativamente.
Esto parece sugerir que me quedé demasiado quieto durante ese período y que podría haber mejorado posiblemente mi puntaje en forma significativa de haber buscado multiplicadores en forma mas activa.
 No se puede procesar este modelo “mentalmente”, quizás los expertos lo hacen intuitivamente pero sin tanta complejidad matemática; pero ciertamente esto dá “letra” a una aplicación simple de soporte que continuamente esté pulsando los datos del concurso (Q,M,tasa,K, etc) y sugerirnos si deberíamos mantenernos haciendo Q o salir a buscar mas M.

Cada simplificación adoptada, seguramente, puede dar lugar a hacer mas ajustado el modelo. Por ejemplo determinar algun calculo dinámico del tiempo de interrumpir el run en un dado concurso o calcular con mas precisión cuantos M nos vienen “solos” respecto a los que salimos a buscar; seguramente están en el log los datos para hacerlo (por ejemplo observando la frecuencia de operación en casos donde esté disponible via CAT). También mejorar el pronóstico de cuantos multiplicadores trabajo “al hilo” cuando me propongo hacerlo (que puede ser mas de uno), he asumido implícitamente que hago un multiplicador y vuelvo a tratar de establecer el run, quizás puedo ir y hacer mas de uno lo que hará conveniente salir “antes” a buscarlo (o quizás no).

El modelo no es mas que una aproximación “simple” (o “simplificada”) a entender la dinámica bien compleja que la maravillosa mente humana es capaz de resolver sin esfuerzo aparente en el caso de un experto que, por mecanismos que ni el es consciente como, que es lo correcto para hacer.
Lo que si está claro es que el rate no es King, el puntaje lo es.
El rey ha muerto, que viva el Rey!

No hay comentarios:

Publicar un comentario

Buscar este blog

Vistas de página en total