🇪🇸 ¿Por qué Cardano no necesita el slashing?

:cuba: :es: Traducción de Why Cardano does not need slashing artículo publicado por el operador de pooles, Cardanians - CRDNS

La red principal de Cardano (era Shelley) se lanzó a mediados del año 2020 y hasta el momento funciona de manera confiable y sin problemas, ya que hay bastante trabajo científico detrás del consenso PoS Ouroboros, y la práctica demuestra que las teorías asumidas son correctas. Las personas se preguntan, ¿por qué Ouroboros no necesita penalizar a los participantes deshonestos?. Intentaremos responder dicha pregunta.

o.ba62cbe48d01bf3c98e5182dd75235fd

Construir un consenso de red distribuida es difícil

La descentralización y la seguridad de cualquier consenso de red son requerimientos claves para construir una criptomoneda. El consenso de la red es un proceso digital con muchos participantes,los cuales viven en el mundo físico y se pueden comportar de forma racional o irracional con respecto a los mejores intereses del protocolo. El protocolo puede incentivar la conducta racional de los participantes pero no puede evitar por completo, la conducta irracional. Los participantes son recompensados económicamente por comportarse de forma racional pero la pregunta es, ¿se hace necesario castigar a los participantes por comportarse de forma irracional?

El comportamiento irracional representa una amenaza potencial para el protocolo ya que puede enfrentar dificultades para lograr el consenso de la red. Podemos dividir a los participantes en racionales e irracionales (honestos y deshonestos). Los participantes deben tener un poder de consenso que se distribuya de manera desigual. En las redes PoS, los participantes deben comprar tokens en el mercado abierto, y cuanto mayor sea el número de monedas que tiene un participante, mayor poder de consenso tiene a su disposición.

El protocolo estará en las manos de los participantes racionales cuando ellos tengan un stake mayor, en cuyo caso un mayor nivel de seguridad es garantizado. Se puede decir que los participantes racionales e irracionales combaten por tener un mayor stake. Una vez que un solo participante irracional (o grupo de ellos) tenga un stake mayor que los participantes racionales entonces se convierte en un dictador con poder absoluto con respecto al consenso de la red.

Al momento de escribir esto, aproximadamente el 71% de las monedas ADA que están en circulación están delegadas, lo cual supone aproximadamente 23 billones de ADA. Un participante irracional necesitaría tener más de 11,500,000,000 ADA para dominar el consenso de la red

Hasta el momento hemos hablado principalmente sobre la seguridad del consenso de la red a corto plazo, pero ese no es el único aspecto que debe considerarse. El protocolo debe permanecer seguro a largo plazo, y esto significa que el presupuesto de seguridad debe considerarse desde una perspectiva a largo plazo para garantizar que el protocolo tendrá suficiente recursos para recompensar a los participantes racionales durante las próximas décadas. Además, no solo la seguridad, sino un alto nivel de descentralización debe ser garantizado.

En teoría, el protocolo puede garantizar un alto nivel de seguridad incluso en el caso de que haya un solo dictador. Sin embargo, solo es cierto en el caso de que el dictador actúe racionalmente, y esto no se puede garantizar en el mundo físico y, por lo tanto, queremos evitar esta situación. Un número bajo de participantes también es una situación no deseada, ya que podrían ponerse de acuerdo y comenzar a actuar de manera deshonesta. Por lo tanto, solo un alto nivel de descentralización puede garantizar un alto nivel de seguridad. En otras palabras, el protocolo debe ser resistente a los ataques externos (un participante rico), pero también a los internos (confabulación).

¿Es necesario penalizar a los participantes maliciosos?

Es un término amplio responder la pregunta sobre si es necesario penalizar a los participantes irracionales, ya que depende de muchos factores. No es solamente una pregunta sobre seguridad sino que es sobre el nivel de descentralización también y la sostenibilidad a largo plazo de ambas cualidades, y es difícil lograr eso.

Los equipos tienen que realizar decisiones de diseño difíciles al considerar un consenso PoW o PoS. El consenso PoS debe lidiar con ataques bien descritos, por ejemplo, sin nada en stake o ataques contundentes. Es poco costoso crear nuevos bloques en la red PoS, y por tanto es fácil crear bloques regularmente. Por lo tanto, más versiones deben existir en el mismo momento y el protocolo debe tener reglas definidas para la selección de la cadena. En muchas implementaciones PoS, la historia de la blockchain puede ser usada como fuente de aleatoriedad durante el proceso de elegir el nodo que obtendrá el derecho de producir un nuevo bloque, y el protocolo debe evitar que los participantes deshonestos manipulen este mecanismo de aleatoriedad, sino ellos podría engañar el proceso de elección de forma tal que siempre serán ellos los elegidos.

De forma opuesta al consenso dominante de PoW, en Pos hay más conceptos que deben lidiar con estos problemas de forma diferente. Algunos equipos creen que ellos necesitan introducir un mecanismo de castigo y penalizar a los participantes deshonestos cuando actúan en contra del protocolo. Algunos protocolos congelan las monedas delegadas de los participantes durante un período definido. En otros cuando un comportamiento malicioso es observado por los nodos, entonces el nodo malicioso es penalizado y se le sustraen cierta cantidad de sus propias monedas. A este proceso se le denomina “slashing”.

El slashing es un mecanismo que fuerza a los participantes racionales a seguir las reglas del protocolo, y los participantes irracionales están conscientes de que un comportamiento malicioso es penalizado y por tanto no tienen motivación alguna en actuar así. Desde la perspectiva del protocolo, parece inteligente decrementar el poder de consenso de los participantes maliciosos mediante el slashing ya que se puede asegurar que dichos participantes irracionales que actúan intencionalmente en contra del protocolo serán drenados económicamente.

En el caso de Bitcoin, la práctica precedió a la teoría formal y al modelamiento, pero el equipo de IOHK decidió hacerlo al revés. Ellos prefirieron realizar una investigación académica en el campo teórico y formal antes de empezar a implementar el protocolo. Un modelo de incentivo fue considerado y un esquema compartido de recompensas fue propuesto. El esquema de recompensas compartidas promueve la formación justa de Stake Pools y da la bienvenida a tantos participantes como sea posible en la red PoS. El equipo de IOHK probó matemáticamente que todas las suposiciones con respecto a la seguridad son correctas y usaron los resultados de la investigación antes de que el protocolo fuese implementado y desplegado en la red principal. Uno de los resultados de la investigación es el hecho de que la penalización de los participantes maliciosos es innecesaria bajo la condición de que el número deseable de pools llegue a materializarse y estén en el equilibrio Nash. Demos un vistazo rápido a la teoría del equilibrio de Nash antes de continuar.

Equilibro de Nash

Los modelos de incentivos son construidos sobre la base de la teoría de juegos. La teoría de juegos se trata de estudiar las interacciones estratégicas entre las personas que deben tomar una decisión estratégica. Las interacciones se pueden modelar y analizar matemáticamente. La teoría de juegos es aplicable en muchos campos como las ciencias sociales, los sistemas lógicos, la informática, etc.

El equilibrio de Nash es usado para el modelamiento y para definir la solución en un juego donde los participantes no cooperan entre ellos. El juego involucra dos o más jugadores, y en el equilibrio de Nash, se asume que cada jugador conoce las estrategias de equilibrio de los otros jugadores y ningún jugador tiene algo que ganar si cambia solo su propia estrategia.

Cada jugador necesita elegir una estrategia y un plan de acción. Se basa mayormente en eventos que han ocurrido hasta el momento en el juego. El punto es que ningún jugador puede incrementar su propia ganancia al cambiar su estrategia y mientras los otros jugadores mantienen su estrategia igual. El conjunto de estrategias de los otros jugadores constituye el equilibrio de Nash. En otras palabras, es económicamente racional mantener la estrategia ganadora y no desviarse mucho, ya que una desviación significativa podría considerarse como un comportamiento irracional independientemente de si fue intencional o no.

Imaginen que tenemos dos participantes, Alice y Bob, y cada uno necesita una estrategia. Alice elige la estrategia A y Bob elige la estrategia B. El equilibrio de Nash se alcanza cuando Alice no tiene una estrategia disponible mejor que A para maximizar su ganancias como respuesta a la estrategia B elegida por Bob. Y Bob también necesita elegir una estrategia ganadora y por lo tanto eligió B. Finalmente Bob tampoco tiene una estrategia disponible mejor que B para maximizar sus ganancias como respuesta a la estrategia elegida por Alice. Así, mantener el equilibrio es la mejor estrategia para ambos participantes en cuanto a las ganancias.

Funciona de la misma manera cuando hay más participantes. Si Carol y Dan se unen al juego con sus estrategias C y D entonces el equilibrio de Nash se alcanza cuando la estrategia A es la mejor elección de Alice para responder a las estrategias B, C y D. El mismo principio puede ser analógicamente aplicado a todos los participantes.

La teoría de juegos es muy adecuada para modelar el comportamiento de los participantes que operan nodos en una red descentralizada. En el caso de Cardano, los teóricos de los juegos usaron el equilibrio de Nash para analizar el resultado de la interacción estratégica de muchos operadores de pools y sus miembros. El resultado de la decisión de cada cual depende de las decisiones de los demás. Cardano es una red descentralizada global, por lo tanto, los operadores de pools y los miembros de pools no pueden predecir el comportamiento de los demás. Cada decisión se toma sobre un conjunto limitado de información, si Alice es operadora de un pool, entonces puede predecir qué decisión tomará Bob. Sin embargo, Alice no puede estar segura, ya que puede pensar sobre las decisiones de otros participantes y puede tomar algunas acciones racionales con respecto a su estrategia. Alice puede esperar que todos los demás operadores de pools se comporten de manera racional, y lo mismo puede decirse de los delegantes. Es inteligente esperar un comportamiento racional ya que los participantes se esfuerzan por maximizar sus ganancias. Por lo tanto, es fácil para Alice tomar una decisión, ya que sabe lo que los demás pueden tomar en consideración y entonces ella puede predecir su comportamiento.

Esquema de recompensas compartidas

El protocolo Ouroboros PoS puede interactuar con las personas que viven en el mundo físico sólo mediante los incentivos. El protocolo sabe que es de su mayor interés en cuanto a seguridad y descentralización. Las personas saben que es de su mayor interés en cuanto a las recompensas. Por tanto, los intereses del protocolo y los participantes pueden ser alineados.

Cardano usa un esquema de recompensas compartidas que promueve la distribución justa de recompensas en un entorno con un gran números de delegantes con diferentes roles. En la red Cardano, los pools son los responsables de la producción de bloques. Otro tipo de delegantes, se unen a estos pools. Un pool puede ser percibido como una de muchas pequeñas compañías. El operador del pool es el administrador y los delegantes son los empleados. El poder de consenso de un pool consiste usualmente en el stake del operador del pool y el stake de muchos empleados.

El mecanismo de incentivos puede ser parametrizado para alcanzar el número deseado de pools. La idea base es que cuando los participantes son incentivados apropiadamente entonces el equilibrio de Nash se alcanzará en base al comportamiento honesto y racional de dichos participantes. El objetivo del mecanismo de incentivos es lograr un alto nivel de descentralización y seguridad. Se deben mitigar una serie de ataques, por ejemplo, la censura de transacciones, los ataques Sybil, y el dominio de un solo participante. Estas cualidades deben lograrse al mismo tiempo que la alta eficiencia del protocolo.

El esquema de recompensas repartidas de Cardano funciona de manera tal que recompensa tanto a los operadores de pools como a los delegantes. El protocolo hace capturas periódicas de los participantes y esto sirve como entrada para recompensar. El protocolo proporciona primeramente una mayor recompensa a los operadores de pools por su servicio, luego en segundo lugar, todos los delegantes también son recompensados. El ecosistema de Cardano es muy inclusivo. Los pools pequeños pueden recibir recompensas proporcionales similares a los pools grandes. Al mismo tiempo, existe un límite superior que limita el tamaño de los pools, cuando un pool alcanza el límite superior, se recortan las recompensas. Por lo tanto, una entidad con una gran stake se ve obligada a crear más pools en lugar de tener solo uno, y así los nuevos pools pequeños competirán con otros pools pequeños. Los delegantes pueden decidir si apoyarán un nuevo pool pequeño, de un operador que posea más pools, o si apoyarán un pool pequeño que sea propiedad de otra persona. Esto es algo en lo que el operador del pool no puede influir directamente.

Recompensar a todos los usuarios que realizan stake es de hecho muy inteligente ya que hay más individuos haciendo sus propias decisiones. Cuando el operador de un pool (administrador de una compañía) no se comporta para mejor interés del protocolo entonces los delegantes delegarán en otro pool (los empleados se marchan de la compañía), ya que pueden hacerlo cuando quieran. Por tanto, un operador malicioso puede perder poder relativamente rápido. El protocolo realiza una nueva captura de la red cada 5 días y esa nueva captura se usa con un epoch de retraso. Asumamos que el operador de un pool comienza a comportarse de forma maliciosa y comienza hacerlo al final de cada epoch. Entonces, los delegantes tendrán 5 días para responder a ello y redelegar su stake en algún otro lugar, así en 10 días el pool puede perder una cantidad significativa de stake y por tanto poder de consenso, y al mismo tiempo otros pools obtendrán mayor stake.

Una mayor descentralización puede ser lograda cuando es fácil unirse. Tanto la delegación como la creación de un nuevo pool debe ser relativamente barato. En el caso ideal, la mayoría de las monedas en circulación deberían usarse para el staking. En el ecosistema de Cardano, necesitas solo unas pocas ADA para participar en el staking. La delegación no es fija para un período de tiempo y los delegantes pueden siempre redelegar de forma poco costosa su stake.

Una alternativa a este enfoque es congelar las monedas por un período de tiempo determinado y su deducción en caso de mal comportamiento, y esto tiene algunas consecuencias negativas. En primer lugar, las criptomonedas están aquí para ser gastables, cuando las monedas están bloqueadas, se impide su naturaleza básica. Cuando un usuario no tiene suficientes monedas para crear su propio pool o nodo de validación, entonces puede usar monedas para hacer stake. Cuando se puede realizar slashing a las monedas, los delegantes arriesgan sus monedas si el operador del pool comienza a actuar mal. Por tanto, muchos usuarios pequeños que quieran delegar probablemente no querrán arriesgarse a eso. Parece ser que el bloqueo y el slashing de monedas no es la mejor opción con respecto a la descentralización. El entorno en el que se requiere un número mínimo de monedas para crear un nodo de validación también es bastante exclusivo ya que las criptomonedas son volátiles y puede ser casi imposible crear un nuevo nodo cuando el precio de las monedas alcanza un nuevo récord de precio cada pocos años. La única solución es disminuir el número requerido de monedas.

En algunos proyectos DPoS, podemos ver que los votantes pueden decidir sobre un número de productores de bloques que tengan poder igual. Los productores de bloques son seleccionados por una serie de candidatos y los incentivos para los votantes no son tomados frecuentemente en cuenta. Como resultado, podemos observar la baja participación de los votantes. Por lo tanto, solo un pequeño número de monedas puede decidir sobre los productores de bloques, y ya que solo los productores son recompensados entonces solo ellos se vuelven más ricos, además de que ellos se pueden votar entre si. Esto significa que Alice, como productora de bloques puede votar por Bob, que también es un productor de bloques y Bob como agradecimiento vota por Alice. Una red con un conjunto limitado de productores de bloques con la misma potencia cada uno puede ser muy eficiente en cuanto a escalabilidad, pero se sacrifica la descentralización. Además, puede resultar relativamente barato ser elegido y comportarse de forma maliciosa después…

El esquema de recompensas compartidas de Cardano proporciona dichas recompensas de forma proporcional a todos los usuarios que realizan stake por su participación, y son recompensados cada 5 días. La delegación de las monedas ADA en un pool puede ser considerada de cierto modo como una forma de votación. Los delegantes deciden compartir las recompensas con un pool determinado y el pool recibe las recompensas sólo por los servicios que estén alineados con el mayor interés del protocolo. Los delegantes se comportan racionalmente y seleccionan pools que les generen recompensas. Los operadores de pools dependen de los delegantes y el tamaño de sus recompensas depende del stake total de sus pools. Por lo tanto, los operadores de pools también están incentivados a comportarse de manera racional. Existe una hermosa simbiosis entre el protocolo, los operadores de pools y los delegantes.

Conclusión

Ponlo simple, Cardano no necesita slashing ya que tiene un esquema de recompensas compartidas único que apoya un alto nivel de descentralización en el entorno donde todos los usuarios que realizan stake son económicamente incentivados a que se comporten racionalmente. El protocolo incentiva económicamente la existencia del número deseado de pools. El equilibrio de Nash representa una prescripción de la estrategia de cada participante racional, con la propiedad de que si otros participantes la siguen, entonces no tiene sentido para un participante racional desviarse de ella. Adicionalmente, el ecosistema Cardano es altamente inclusivo y los delegantes tienen control sobre sus monedas y pueden cambiar su decisión sobre dónde delegar sin incurrir en grandes gastos. Además, la delegación es un proceso libre de riesgo, y en cuyo entorno es irracional comportarse de forma maliciosa, y puede esperarse que los participantes irracionales formen solo un grupo marginal. Cuando la mayoría de las monedas ADA están en manos de participantes racionales, los irracionales tienen poco poder. La seguridad de Cardano crece con la distribución de monedas ADA.

En el caso de que los participantes maliciosos estuvieran dispuestos a perder dinero, el slashing probablemente no ayudaría mucho. Tener el poder de consenso necesario para causar daño a una red descentralizada siempre se trata de tener la cantidad necesaria de recursos y la voluntad de perder dinero, y por ende este tipo de ataques es imposible evitarlos. Es posible alcanzar un estado en el que una red sobrevive al ataque y el atacante se agotará económicamente. Sería relativamente fácil implementar el slashing en el protocolo Cardano. Pero por el momento, parece que no es necesario y la red principal funciona perfectamente sin eso.

4 Likes