La victoria de ciencia ficción de Lee Sedol

Hoy no daba crédito a lo que veían mis ojos. Lee Sedol, llevando blancas, estaba jugando con un estilo que no era el suyo. Estaba jugando de una manera “antinatural”, se había reinventado a si mismo para ganar a la máquina.

Lee SedolNuestro mejor humano solo ha necesitado 3 partidas para encontrar una contra-estrategia para vencer a una máquina que necesita miles de partidas para avanzar. Lee Sedol ha jugado de nuevo a un meta-juego y ha ganado contra una máquina invencible. Por un momento he recordado memorables novelas de ciencia ficción. Pero esto no era ficción, era realidad.

Cierto es que la máquina ya ha ganado el reto. Pero el increíble Lee Sedol se ha ganado su lugar en la historia, y no solo del Go.

En Corea hoy a AlphaGo lo llamaban Al-sonseng(선생, maestro de escuela, o literalmente “por delante en la vida”). Pero al ganador lo llamaban, God-Sedol, el dios Sedol. Se ganó el honor y el profundo respeto de todos. Hoy en Seúl se celebra la victoria de la humanidad.


LA ESTRATEGIA
De AlphaGo sabíamos que le gusta tener y mantener un porcentaje de victoria alto. En todas las partidas ha sido así, y por ello evitaba jugadas caóticas (como hacer ko) y jugaba solidificándose. Miedo al caos. Así que la pregunta que quedaba es: ¿cómo jugará si cree que va perdiendo? ¿Hará como los humanos, que se complican en luchas para tratar de sacar beneficio?

La manera moderna de jugar a Go se basa en balancear territorio e influencia. El primero da puntos pero el segundo da fuerza para poder luchar y quizás acabar ganando más puntos. Pero esto no funciona con AlphaGo, que desde el principio juega para obtener una superioridad global, incluso haciendo jugadas claramente malas. Así que Lee Sedol tenía que inventarse algo nuevo.

Lee Sedol (blanco) empezó jugando puramente territorial. Además, al jugar segundo, recibe una compensación llamada komi, en este caso de 7.5 puntos. Esto es, con el tablero vacío Lee gana de 7.5 puntos. La máquina (negro) empezó a bloquear el centro mientras el humano hacía puntos. Pero el problema es que AlphaGo dejaba en sus paredes numerosos puntos débiles.

Más tarde el plan de Lee Sedol era tratar de recuperar algunas piedras semi-muertas del centro, usando todas esas debilidades.


EL MOVIMIENTO DE DIOS
La máquina recibía una tremenda presión y no contestaba con defensas perfectas, pero aun así nada parecía funcionar para el humano. Hasta que llegó la magia.

el movimiento de Lee SedolLee Sedol coloca el movimiento 78 (el mostrado en el diagrama). “Una jugada de dios”, como la ha tildado su legendario rival, el chino Gu Li 9p. Una jugada magnífica como resultado de toda la estrategia que la precedía.

Esta jugada combina  los ataques a los muros negros de ambos lados. Si negro defiende un lado, pierde el otro. Es una jugada inesperada porque localmente es absurda, pues a izquierda y derecha hay piedras negras que la rodean. Y quizás por eso AlphaGo no la preveía, pues su red neuronal de predicción de la siguiente jugada probablemente la desechó. Para colmo, su respuesta es aun peor, aunque la máquina no se percata hasta más tarde, según dice su creador.

Y por fin vemos que hace AlphaGo cuando va perdiendo. Pero la sorpresa es tremenda: no complica las cosas, sino que hace jugadas absurdas que hasta un aficionado puede contestar correctamente. Juega a ver si el oponente se equivoca. Jugadas con una respuesta obvia que remata, y miles de respuestas que darían la vuelta al tablero de nuevo. No hay software sin bugs. Además, AlphaGo se equivoca inexplicablemente en el cálculo de secuencias largas y acaba perdiendo.

La jugada 78 pasará a la historia. Es comparable a la de “las orejas enrojecidas” de 1846. El mejor jugador del S.XIX, Shusaku, jugaba una partida contra Gennan Inseki, maestro de la más notable escuelas de Go de Japón. Todos los estudiantes que miraban la partida tenían claro que su maestro ganaba, pero un médico que también miraba comentó que no. Le preguntaron por su razonamiento. “Yo no sé mucho del juego, pero cuando Shusaku hizo la jugada 127, las orejas del maestro se enrojecieron enormemente“. La jugada combinaba ataque y defensa, reducía la influencia del oponente y ayudaba a sus propias piedras. Una jugada perfecta.


EL FUTURO
Lee SedolEl martes Lee Sedol se enfrentará con AlphaGo por última vez. Empezará con negras, y habrá que ver que estrategia usará. Sin importar el resultado, la partida nuevamente será de infarto, con magníficas jugadas.

Si Lee Sedol gana, quizás será la última vez que un humano vence a una máquina. Pero esto no es el fin, sino el principio de un nuevo mundo.

Las máquinas nos ayudarán a mejorar nuestro entendimiento del juego, de modos insospechados. Por ejemplo, ya no será necesario volar a Corea y entrar en una escuela de profesionales para estudiar Go seriamente, pues un niño prodigio nacido en un lugar recóndito del planeta tendrá acceso a una máquina superior que lo ayudará a mejorar (como se comenta en este fabuloso artículo en inglés).

La aparición de AlphaGo no solo ha demostrado la enorme profundidad del juego del Go. Además, que los humanos somos capaces de adaptarnos como ninguna máquina es capaz, como ha mostrado Lee Sedol variando sus estrategias. De hecho, estoy totalmente con este artículo (en inglés) del profesional chino Li Zhe 6p: “Nadie podía haber hecho un trabajo mejor que Lee Sedol“.

El Go es quizás el único juego que conozco cuyas estrategias pueden aprenderse y luego aplicarse a otros juegos, incluyendo el que empezamos cuando nacemos y acaba al morir. La clave no es ganar, es esforzarse cada momento.

Mi enhorabuena a Lee Sedol, un jugador nacido hace 33 años en una pequeña isla al oeste de la península coreana, que pasó penurias para poder llegar a entrar en una escuela, hasta poder mudarse a Seúl, donde se convirtió en jugador profesional a los 12 años. Un jugador que ama tanto el juego, que sigue pensando en la partida aun tras acabarse. Un jugador feliz por la victoria más increíble de su vida:

이세돌 화이팅!

(;FF[4]GM[1]SZ[19]ST[2]CA[UTF-8]RO[4]PB[Alphago]PW[Lee Sedol]WR[9p]KM[7.5]DT[2016-03-13]RE[W+R]RU[Chinese];B[pd];W[dp];B[cd];W[qp];B[op];W[oq];B[nq];W[pq];B[cn];W[fq];B[mp];W[po];B[iq];W[ec];B[hd];W[cg];B[ed];W[cj];B[dc];W[bp];B[nc];W[qi];B[ep];W[eo];B[dk];W[fp];B[ck];W[dj];B[ej];W[ei];B[fi];W[eh];B[fh];W[bj];B[fk];W[fg];B[gg];W[ff];B[gf];W[mc];B[md];W[lc];B[nb];W[id];B[hc];W[jg];B[pj];W[pi];B[oj];W[oi];B[ni];W[nh];B[mh];W[ng];B[mg];W[mi];B[nj];W[mf];B[li];W[ne];B[nd];W[mj];B[lf];W[mk];B[me];W[nf];B[lh];W[qj];B[kk];W[ik];B[ji];W[gh];B[hj];W[ge];B[he];W[fd];B[fc];W[ki];B[jj];W[lj];B[kh];W[jh];B[ml];W[nk];B[ol];W[ok];B[pk];W[pl];B[qk];W[nl];B[kj];W[ii];B[rk];W[om];B[pg];W[ql];B[cp];W[co];B[oe];W[rl];B[sk];W[rj];B[hg];W[ij];B[km];W[gi];B[fj];W[jl];B[kl];W[gl];B[fl];W[gm];B[ch];W[ee];B[eb];W[bg];B[dg];W[eg];B[en];W[fo];B[df];W[dh];B[im];W[hk];B[bn];W[if];B[gd];W[fe];B[hf];W[ih];B[bh];W[ci];B[ho];W[go];B[or];W[rg];B[dn];W[cq];B[pr];W[qr];B[rf];W[qg];B[qf];W[jc];B[gr];W[sf];B[se];W[sg];B[rd];W[bl];B[bk];W[ak];B[cl];W[hn];B[in];W[hp];B[fr];W[er];B[es];W[ds];B[ah];W[ai];B[kd];W[ie];B[kc];W[kb];B[gk];W[ib];B[qh];W[rh];B[qs];W[rs];B[oh];W[sl];B[of];W[sj];B[ni];W[nj];B[oo];W[jp])
Esta entrada fue publicada en Comentario de partida, En Corea, Estrategia, Jugadores profesionales, Torneos de profesionales. Permalink.

14 respuestas a La victoria de ciencia ficción de Lee Sedol

  1. Javier dijo:

    Julio, te has olvidado de poner la partida. O a caso, ¿Estás preparando un nuevo artículo con el análisis?

  2. Emilio dijo:

    Esta victoria es muy importante, tanto para Lee Sedol como para el equipo de Deepmind como para la comunidad de jugadores de Go.
    Para Lee Sedol le quita la losa de ir a la quinta partida con la posibilidad de llevarse un 5-0, lo cual habría sido durísimo.
    Para el equipo de Deepmind, por mucho prestigio que les hubiera dado un 5-0, la información más valiosa que pueden conseguir es la que saquen de las derrotas de AlphaGo.
    Para la comunidad del Go, en especial los profesionales, independientemente del resultado de la quinta partida, esta victoria muestra que, al menos a día de hoy, AlphaGo es batible. Si se hubiera porducido un 5-0 es probable que organizar nuevos matches fuera una tarea enormemente difícil.

    • julio dijo:

      Exacto. De hecho yo espero que se produzcan otros encuentros, e incluso que publiquen el código. Pero lo primero es la partida del martes. Y lo segundo, que deepmind publique unos análisis de lo que pensaba la máquina en las partidas contra Lee Sedol… porque si no la competencia se les adelantará.

  3. Ruben dijo:

    Aún tengo que mirar toda la partida, pero realmente, 87 es impresionante, totalmente inesperado localmente. Cómo crees que le hubiera ido a LCH, en sus buenos tiempos, contra AlphaGo, por cierto?

    • julio dijo:

      Lee Changho tiene de hecho un estilo muy tranquilo, así que quizás no es el candidato ideal para luchar contra la máquina. Desde luego, si hay que buscar nuevas estrategias para contrarrestar AlphaGo, no hay nadie mejor que Lee Sedol.

  4. Víctor dijo:

    Ante todo, gracias por el esfuerzo y por compartirlo.
    Me quedan algunas dudas: Es posible que, tras las primeras impresiones ya haya análisis un poco más detallados de las primeras partidas. ¿Realmente Lee tenía en su mano una victoria fácil en la 1ª? ¿La 2ª se mantuvo equilibrada hasta el último error en el byo-yomi? (las evaluaciones de darkforest, p.ej., dicen otra cosa, aunque puede que no afine al nivel de juego de un superclase como Lee)
    También he oído que, en la 4ª realmente fue una celada y que, visto objetivamente, Lee estaría perdido ¿Es así o simplemente estaba aplicando otro estilo de juego perfectamente válido?
    Por cierto, me llama la atención que se suponga que un ordenador pueda ser más débil a ritmo rápido. Desde luego, en ajedrez, el maestro humano conservaría alguna opción sólo en los ritmos lentos y aplicando un juego puramente estratégico, evitando toda complicación táctica.
    Gracias anticipadas.
    Víctor

    • julio dijo:

      Realmente la máquina juega tan distinto que es difícil evaluar al detalle las partidas. Supongo que en las próximas semanas se analizarán al detalles, posiblemente con información de la gente de DeepMind.

      En la 1ª, Lee no tenía ni de lejos una victoria fácil. En la 2ª no hubo tanto equilibrio, pues dicen que la jugada 70 de blanco, aun correcta, ya empezaba a dejar al humano atrás. En la 4ª no fue una “celada”, pues este es un término ajedrecístico que indica ofrecer al adversario una pieza para lograr una posición mejor, y en realidad en Go hay celadas casi continuamente; la jugada clave más bien era una doble amenaza totalmente inesperada. Sin ella, es posible que hubiera perdido.

      El Go, al tener un gran componente de intuición (desarrollada tras años de práctica) permite justamente que partidas rápidas contra la máquina puedan ser más exitosas, porque el componente de cálculo de ramas se mengua.

  5. Víctor dijo:

    Gracias Julio.
    Realmente no me he expresado bien. Como celada no me refería a la jugada 78 (impresionante), sino al juego anterior. Entiendo por tender una celada ofrecer algo (sea material o permitir un ataque que sabemos fracasará, p.ej.) que, si el rival no acepta, no obtenemos nada y puede hasta comprometer nuestra posición. Lo decía porque había leído que el juego de apertura de Lee era una trampa y le hubiese dejado perdido de haber jugado correctamente Alpha Go.

    • julio dijo:

      Realmente (como ex-jugador de ajedrez) no puedo aplicar el concepto de “celada” aquí. En la partida 3ª simplemente Lee creo una zona propia abierta, esperando que la máquina entrara. Esto en Go no es tan “trampa para osos” como pudiera sonar, sino simplemente una estrategia mas: si abarcas demasiado, el otro vendrá a invadirte y tendrás superioridad posicional para atacarle, aunque muy probablemente perderás parte de lo abarcado originalmente.

      El tema es que fue una estrategia que no le sirvió a Lee, pues la máquina invadió fantásticamente y de pronto el contraataque de esta fue muy duro.

  6. José dijo:

    Dejo enlace a la partida, ya que el SGF incrustado parece no funcionar: https://online-go.com/demo/119122