🇪🇸 Compartir la recompensa Blockchain - una sistematización comparativa de primeros principios

:es: Traducción al español de “Blockchain reward sharing - a comparative systematization from first principles

Publicado por Prof Aggelos Kiayias en el blog de IOHK el 29 de Noviembre de 2020


Navegando por el diverso paisaje de los esquemas de recompensa y las elecciones que hemos hecho en el diseño del esquema de recompensa de Cardano

En el artículo anterior, identificamos los objetivos del plan de recompensas en Cardano, y dimos las directrices generales en cuanto a la participación en el sistema.

Tomando una visión de más alto nivel, examinaremos desde primeros principios, el problema general del reparto de recompensas en los sistemas blockchain. Para recordar, los dos objetivos generales de cualquier sistema de consenso basado en recursos es incentivar lo siguiente.

Alto compromiso. Los protocolos de consenso basados en recursos son más seguros cuanto más recursos se dedican al mantenimiento de los protocolos. El problema, por supuesto, es que los recursos subyacentes también son útiles para una amplia variedad de otras cosas (por ejemplo, la electricidad y la potencia de cálculo en el caso de la prueba de trabajo, o la participación en aplicaciones descentralizadas en el caso de la prueba de participación), por lo que se debe incentivar a los titulares de recursos a que comprometan recursos para el mantenimiento de los protocolos.

Baja influencia: la influencia está relacionada con la descentralización. Tomemos un grupo de 10 personas; si hay un líder y el grupo sigue los deseos del líder todo el tiempo, la influencia del líder es de 10 mientras que la de todos los demás es cero. Si, por el contrario, la opinión de todos importa lo mismo, la influencia de todos es 1. Estos son dos extremos, pero debería ser bastante obvio qué tipos de influencia se alinean mejor con la descentralización. Sin embargo, desde el punto de vista económico, una “dictadura benévola” es siempre más eficaz; por consiguiente, la descentralización tendrá un costo (exactamente como la democracia), y por lo tanto tiene que ser también debidamente incentivada.

Habida cuenta de los objetivos mencionados, examinemos ahora algunos enfoques que se han considerado en los sistemas de consenso y sistematicémoslos en función de la forma en que abordan los objetivos mencionados. Una primera categorización importante que introduciremos es entre los sistemas de recompensa unimodales y multimodales.

Unimodal

En un esquema unimodal, sólo hay una forma de participar en el protocolo de consenso con sus recursos. Examinamos dos subcategorías de esquemas unimodales.

  1. Unimodal lineal

Este es el enfoque más simple y es seguido por muchos sistemas, en particular Bitcoin; el original basado en la prueba de trabajo Ethereum, así como Algorand. La idea es simple: si una entidad manda un x% de recursos, entonces el sistema intentará proporcionar un x% de las recompensas - al menos en la expectativa. Esto puede parecer justo, hasta que uno observa las serias desventajas que vienen con ello.

En primer lugar, considere que alguien tiene el x% de los recursos y que el x% de las recompensas esperadas están por debajo de su costo individual para operar como un nodo. Entonces, o bien no se comprometerán (reduciendo la tasa de compromiso del sistema), o bien, lo más probable, buscarán activamente a otros para combinar los recursos y crear un nodo. Incluso si hay dos poseedores de recursos con un x% de recursos cada uno y un costo individual viable c cuando funcionan como nodos separados, les irá mejor combinando recursos en un único nodo de recursos del 2x% porque el costo resultante será típicamente inferior a 2c. Esto puede dar lugar a una fuerte tendencia a la centralización y a un elevado apalancamiento, ya que el conjunto combinado de recursos será (típicamente) gestionado por una entidad.

En la práctica, es poco probable que surja un único nodo operado por un dictador. Ello se debe a diversas razones, como las fricciones en la coordinación entre las partes, el temor a la posible caída del tipo de cambio del token subyacente del sistema si la tendencia a la centralización se hace patente, así como el uso ocasional de protocolos complejos para gestionar conjuntamente los pools. Aun así, es evidente que las recompensas lineales unimodales pueden perjudicar la descentralización.

No es necesario ir mucho más allá de examinar Bitcoin y su actual, bastante centralizada, alineación de pools mineros. Cabe señalar que si se utiliza como recurso la participación (en lugar del poder de hash), la presión de la centralización será menor, ya que el gasto para hacer funcionar un nodo es menor. Pero, en principio, se aplican los mismos problemas.

Una desventaja adicional de la situación anterior es que la consiguiente puesta en común de recursos “fuera de la cadena” que se produce será completamente opaca desde la perspectiva del libro mayor y, por lo tanto, más difícil de supervisar y de reaccionar para la comunidad. En resumen, el enfoque unimodal lineal tiene la ventaja de ser sencillo, pero es precario, tanto en lo que respecta al aumento de la participación como al mantenimiento del apalancamiento en un nivel bajo.

  1. Unimodal lineal cuantificado

Este enfoque es el mismo que el de las recompensas lineales, pero cuantifica el recurso subyacente. Es decir, si sus recursos están por debajo de un determinado umbral, puede ser completamente incapaz de participar; sólo puede participar en cantidades fijas. En particular, este enfoque se adopta en ETH2.0, en el que se deben comprometer 32 Ether para adquirir una identidad validadora. Debe quedar claro que este enfoque cuantificado comparte los mismos problemas que el enfoque lineal unimodal en cuanto a la participación y el apalancamiento. A pesar de ello, se ha considerado por dos razones principales. En primer lugar, la utilización del enfoque cuantificado permite adaptar los elementos de diseño de los protocolos tradicionales de estilo BFT (por ejemplo, que requieren el recuento de identidades) en un entorno de consenso basado en los recursos. El sistema resultante es menos elegante que el verdadero consenso basado en los recursos, pero esto es inevitable, ya que los protocolos tradicionales del estilo BFT no funcionan muy bien cuando hay más de unos pocos cientos de nodos involucrados. La segunda razón, específica del entorno de prueba de participación, es el intento de imponer sanciones a los participantes como medio de asegurar el cumplimiento del protocolo. La imposición de garantías prendarias cuantificadas hace que las sanciones por infracciones del protocolo sean más sustanciales y dolorosas.

Multimodal

A continuación pasamos a los esquemas multimodales. Esta amplia categoría incluye a Cosmos, Tezos, Polkadot y EOS. También incluye a Cardano. En un esquema multimodal, un poseedor de recursos puede tomar diferentes roles en el protocolo; ser un nodo completamente activo en el protocolo de consenso es sólo una de las opciones. La ventaja de un esquema multimodal es que al ofrecer múltiples formas de participación (con las correspondientes tasas de rendimiento diferentes) dentro del propio protocolo se puede dar cabida a una mayor participación, así como limitar la puesta en común de recursos fuera de cadena. Por ejemplo, si las posibles recompensas que recibe una persona cuando se compromete con todos sus recursos son inferiores a su costo operacional de funcionamiento de un nodo, puede seguir optando por comprometerse por un modo diferente en el protocolo. De este modo, se facilita la tendencia a combinar recursos fuera de cadena y el sistema -si se diseña adecuadamente- puede traducir este mayor compromiso en una mayor capacidad de recuperación.

Distinguiremos entre varios esquemas multimodales diferentes.

  • Bimodal representativo sin control de apalancamiento. El enfoque representativo se inspira en la democracia representativa: el sistema es dirigido por un número de operadores elegidos. El enfoque es bimodal ya que permite a las partes (1) anunciarse como operadores en el libro contable y/o (2) “votar” por los operadores con sus recursos. El conjunto de operadores representativos tiene un tamaño fijo y se actualiza de forma continua, normalmente con plazos fijos, utilizando alguna función electoral que selecciona a los representantes en función de los votos que han recibido. Las recompensas se distribuyen uniformemente entre los representantes, posiblemente teniendo en cuenta los datos de rendimiento y ajustándose en consecuencia. Si se permite que las recompensas fluyan hacia los votantes mediante un contrato inteligente, se puede incentivar una mayor participación en la votación, ya que a los titulares de recursos se les paga por votar a buenos representantes (obsérvese que no todos los planes de esta categoría siguen necesariamente este criterio). La desventaja de este enfoque es la falta de control del apalancamiento, más allá, posiblemente, de la existencia de un límite superior muy grande, lo que sugiere que el sistema puede terminar con un conjunto de operadores muy apalancados. Este es el enfoque que siguen ampliamente Cosmos, EOS y Polkadot.

Un enfoque diferente del enfoque representativo es el enfoque delegativo. En general, este enfoque está más cerca de la democracia directa, ya que permite a los titulares de los recursos la opción de participar directamente en el protocolo con los recursos que tienen. Sin embargo, también son libres de delegar sus recursos a otros como en la democracia líquida (o delegativa) (de donde deriva el término delegativo). Esto da lugar a una configuración de operador seleccionada por la comunidad que no tiene un número predeterminado de representantes. Al igual que en el enfoque representativo, la participación de los usuarios es bimodal. Los titulares de recursos pueden anunciarse como operadores y/o delegar sus recursos a operadores existentes. Las recompensas proporcionadas son proporcionales a la cantidad de recursos delegados y los delegados pueden ser pagados a través de un contrato inteligente en cadena, tal vez con diferentes tarifas. Dentro del enfoque de la delegación distinguiremos además dos subcategorías.

  • Bimodal delegativo con recompensas de tope basadas en compromiso. Lo que caracteriza este enfoque delegativo particular es que las recompensas del pool tienen un límite que se determina por la cantidad de compromiso que su operador compromete al fondo. De esta manera, el apalancamiento total de un operador puede ser controlado y fijado a una constante. Lamentablemente, esta característica de control del apalancamiento tiene el efecto secundario negativo de imponer implícitamente el mismo límite a todos los titulares de recursos, pequeños y grandes. Así pues, por un lado, en una población de pequeños poseedores de recursos, el compromiso se verá limitado por el pequeño compromiso que los operadores son capaces de hacer. Por otra parte, unos pocos grandes poseedores de recursos balleneros pueden acabar influyendo de manera muy significativa en el protocolo de consenso, posiblemente incluso más allá de su límite de seguridad. En términos de control de la influencia, debe quedar claro que una talla no sirve para todos. A partir de los sistemas existentes, este es el enfoque que (en esencia) sigue Tezos.

Cabe señalar que todos los enfoques específicos que hemos visto hasta ahora tienen sus inconvenientes, ya sea en términos de maximizar el compromiso, controlar la influencia o ambos. Teniendo esto en cuenta, encajemos ahora en nuestra sistematización, el enfoque del esquema de reparto de recompensas que estamos usando en Cardano.

  • Bimodal delegativo con recompensas limitadas y compromiso incentivado. En este sistema delegativo (introducido en nuestro documento de esquema de recompensas), las recompensas que se proporcionan a cada pool siguen una función de acuerdo con el tamaño del pool. La función es inicialmente monótona y luego se vuelve constante a un cierto nivel de “tope” que es un parámetro de sistema configurable (en Cardano esto está determinado por el parámetro k). Este tope limita los incentivos para el crecimiento de los pools de recursos individuales. Al mismo tiempo, el compromiso de recursos a un pool se incentiva y los pools más comprometidos reciben más recompensas. Como resultado, la reducción del apalancamiento se convierte en un incentivo: los pools de recursos tienen un tamaño limitado y los operadores tienen un incentivo para comprometer todos los recursos que puedan permitirse en el menor número posible de pools. En particular, se incentiva a los poseedores de recursos balleneros para que mantengan su apalancamiento bajo. El beneficio del enfoque es que se refuerza el compromiso elevado, mientras que la influencia se mantiene bajo control al incentivar a la comunidad a (i) comprometer lo máximo posible, (ii) utilizar todos los recursos restantes no comprometidos como parte de un mecanismo de filtrado de origen colectivo. Esto traduce el interés en el poder de voto y apoya exactamente a los operadores que más contribuyen materialmente a los objetivos del sistema.

La sistematización anterior pone en perspectiva las elecciones que hemos hecho en el diseño del esquema de reparto de recompensas utilizado en Cardano frente a otros sistemas. En resumen, lo que el sistema de recompensas Cardano logra es promover materialmente con incentivos y votaciones basadas en la participación de la comunidad el mejor resultado posible: bajo apalancamiento y alto compromiso. Y esto se logra, al tiempo que se permite un grado muy alto de heterogeneidad en cuanto al comportamiento de las partes interesadas.

Como punto final, es importante subrayar que, aunque se han hecho considerables progresos desde la introducción de la blockchain Bitcoin, la investigación sobre el reparto de recompensas por proyectos de colaboración sigue siendo un dominio extremadamente activo y en crecimiento. Nuestro equipo evalúa continuamente varios aspectos de los esquemas de reparto de recompensas y explora activamente todo el espacio de diseño de una manera de primeros principios. De esta manera, podemos asegurar que cualquier avance en la investigación será difundido ampliamente para el beneficio de toda la comunidad.

Agradezco a Christian Badertscher, Sandro Coretti-Drayton, Matthias Fitzi, y Peter Gaži, por su ayuda en la revisión de otros sistemas y su colocación en la sistematización de este artículo.

1 Like