Tecnología

Cómo AlphaZero ha reescrito lo que sabíamos del ajedrez y del Go

Published

25 febrero, 2019

Cómo AlphaZero ha reescrito lo que sabíamos del ajedrez y del Go 143

Silver trabaja para DeepMind, una empresa británica de Inteligencia Artificial, subsidiaria de Google. Él fue el líder de AlphaGo, un programa de computadora que aprendió a jugar al Go, un juego de mesa con más de 3000 años de antigüedad, en donde aprendió por sí mismo, las técnicas para jugar como un maestro solamente jugando millones de partidas contra el mismo programa y sacando conclusiones.

La última creación de Silver es AlphaZero, que aprende a jugar el ajedrez chino: Shogi, el ajedrez tradicional y el Go, solamente practicando contra sí mismo. Después de millones de partidos de práctica, AlphaZero ha sido capaz de descubrir las estrategias que a los seres humanos les ha llevado siglos entender.

La máquina reina en el ajedrez. AlphaZero aprende a través de complejos algoritmos que se basan en el denominado aprendizaje por refuerzo, común en el aprendizaje humano y de otros seres vivos https://t.co/BhjcNUdGui

— EL PAÍS Tecnología (@elpais_tec) January 24, 2019

Silver habla de las posibilidades de que la IA pueda resolver problemas que nos superan a los seres humanos. Por ejemplo, en una famosa partida de Go contra posiblemente el mejor jugador del mundo, AlphaGo hizo un movimiento brillante, que los observadores pensaron que había sido un error. ¿Fue acaso la máquina creativa por esta vez?

El “movimiento 37” como se le conoce, sorprendió a todos, incluso a la comunidad de Go y a nosotros, dice Silver. Fue algo inesperado para los seres humanos que juegan Go y que han hallado estrategias que tienen miles de años de ser conocidas. “para mí, esto es un ejemplo de algo que está siendo creativo”, comenta Silver.

En el caso de AlphaZero, que es un programa mucho más general porque puede jugar Go, Ajedrez o Shogi, como no aprende de los humanos ¿deberíamos pensar que es incluso más creativo? Porque cuando uno aprende algo por sí mismo, y uno va construyendo su propio conocimiento desde cedro, es casi hablar de la esencia de la creatividad ¿o no?

En el caos de AlphaZero, el software tuvo que darse cuenta de todo por sí mismo. Cada paso dado es un brinco creativo, y esto es así, porque la máquina nunca recibió el consejo humano. Y estos brincos continuaron más allá de nuestras habilidades y tienen el potencial de asombrarnos a todos.

AlphaZero jugó una serie de partidas contra StockFish, uno de los programas de ajedrez más fuertes del mundo. ¿Qué se aprendió de esta experiencia? StockFish es un motor de ajedrez muy sofisticado, pro en el corazón del mismo está escrito de alguna manera que, “de acuerdo a los humanos, esta es una buena o mala posición”, por lo que estamos en un bucle infinito. Es bueno porque juega como nosotros pensamos que debe jugarse o hace jugadas porque le hemos dicho que son buenas.

AlphaZero aprendió a entender las posiciones por sí mismas. Y hay un juego hermoso en donde AlphaZero entrega 4 peones uno tras otro, e incluso, quiere entregar un quinto peón. StockFish piensa que está fantásticamente ganado pero AlphaZero está feliz. Encontró una manera de entender la posición que es impensable de acuerdo a las normas del ajedrez. Entiende que es mejor la posición que tiene que los cuatro peones de desventaja.

Pero más allá de sorprender al mundo del ajedrez, ¿cuál es la utilidad de AlphaZero en la innovación científica? El aprendizaje de máquinas ha sido el enfoque dominante, en particular una modalidad llamada aprendizaje supervisado, lo que significa que los programas aprenden lo que los srs humanos entienden y tratan de hacer lo mismo en el software. Pero también puede usarse el aprendizaje reforzado, que es como tener un millón de mini- descubrimientos, uno tras otro, que son los que construyen la esencia de la manera de pensar creativamente. Y esto es lo que buscamos, un poder inmenso, una habilidad inmensa para resolver problemas y que -esperamos- lleven a nuevos paradigmas y retos en la ciencia.

Con esta postura, ¿habrá aspectos de la creatividad humana que no pudiesen ser automatizados? Silver piensa que las capacidades de la mente humana, estamos muy lejos de lograr esto. Podemos resolver problemas en dominios muy específicos como pueden ser el Ajedrez o el Go, , al que le damos una cantidad masiva de poder de cómputo para así resolver una tarea. Pero la mente humana es capaz de generalizar algo diferente. Se pueden cambiar las reglas del juego y la máquina no necesitará de otros 2000 años para decir cómo debe jugarse.

“Yo diría”, afirma Silvers, “que estamos en la frontera de la IA en este momento, y que queremos ir a un lugar en donde podamos incrementar su rango y flexibilidad de nuestros algoritmos para cubrir una gama más amplia de lo que los seres humanos saben hacer. Pero hay un largo camino para ello”.

¿Y cómo llegar a ello? Silver dice que le gusta esto de preservar esta idea de que el sistema sea libre para crear, sin tener que estar limitado por el conocimiento humano. “Un bebé no está preocupado por una carrera universitaria, por tener hijos o por trabajar. Juega con sus juguetes y aprende habilidades para manipular cosas. Hay mucho que aprender del mundo en la ausencia de una meta final. Lo mismo pensamos que debería ser cierto para nuestros sistemas”.

La entrada Cómo AlphaZero ha reescrito lo que sabíamos del ajedrez y del Go se publicó primero en unocero.

In this article:

Click to comment

ComentaCancelar respuesta

Mazatlán

Ataque a Balazos en Mazatlán deja dos personas sin vida sobre la Francisco Solís

Trágico Ataque en Mazatlán: Joven de 21 Años Muere a Tiros 😢🔫 #Mazatlán #Violencia

Benjamín Velasco6 horas ago

Automóvil negro con grafitis en protesta contra la agencia MG de Reynosa.

Business

Camioneta MG Reynosa: Doctora Denuncia Fallas Mecánicas y Lidera Protesta Social

🚗🔥 Camioneta defectuosa y maltrato: Alejandra enfrenta a MG Reynosa 💪 #Justicia #Profeco

Manuel González8 horas ago

Escuinapa

Enfrentamiento a Balazos en Escuinapa: Militares y Civiles Heridos y Detenido

Violento enfrentamiento en Escuinapa deja un muerto y varios heridos 💥👮‍♂️🚑 #Seguridad #Escuinapa

Manuel González11 horas ago

Mano sosteniendo un teléfono móvil con el logotipo de TikTok en la pantalla, sobre un fondo con sombras suaves.

Actualización

TikTok Restablece Servicio en Estados Unidos tras Compromiso de Trump

🔥 TikTok reabre en EE.UU. con el respaldo de Trump, defendiendo la libertad de expresión 🇺🇸📱 #TikTokUSA #LibertadDigital

Víctor Márquez15 horas ago

Camión volcado en la avenida Gabriel Leyva, rodeado de vegetación y cinta de seguridad, con personas observando.

Mazatlán

Accidente de tráiler en Mazatlán: Salida del paso superior en avenida Gabriel Leyva cerca de hogares

🚛 Trailer pierde control en Mazatlán y roza hogares! 😱🌳 #Mazatlan #Accidente

Víctor Márquez15 horas ago

Grupo de personas con máscaras y bandas verdes en una manifestación, con un vehículo en el centro y alguien sobre su techo.

Actualización

Rehenes Israelíes Liberados: Familias Celebran y Exigen Libertad para los 91 Aún en Gaza

Gracias a todos: Dos rehenes libres hoy, 91 aún esperan su libertad 🙏🇮🇱 #Solidaridad #Esperanza

Víctor Márquez15 horas ago

Tendencia

Cinta amarilla de 'PROHIBIDO EL PASO' en escena de crimen en Mazatlán

El Habal

Mazatlán Sinaloa: Joven Asesinado en Restaurante de Mariscos en Real del Valle

Trágico tiroteo en Mazatlán: Asesinan a joven en restaurante de Real del Valle 😢🔫 #Mazatlán #Seguridad

Paola Padilla2 días ago

Culiacán

Violencia en Parque Constitución de Culiacán: Armados levantan y balean a sujetos

🚔 Levantan y balean a sujetos a bordo de un jetta en Parque Constitución, Culiacán 🌳 Menores huyen asustados 🏃‍♂️ #Culiacán #Seguridad

Paola Padilla1 día ago

Mapa del Complejo Ecoturístico San Francisco Paradise con pin rojo y carretera 510.

Mazatlán

Operativo Aéreo en Mazatlán esta Mañana tras Enfrentamiento Armado en el Sur

🚁 Fuerzas Armadas Despliegan Operativo Aéreo en Mazatlán tras Enfrentamiento Armado 💥🔒 #Seguridad #Mazatlán

Víctor Márquez2 días ago

Fotografías de Juan Carlos Félix Gastélum, alias 'El Chavo Félix', con texto solicitando información para su arresto.

Culiacán

Registro Nacional de Detenciones: Arrestan a Juan Carlos Félix Gastelum en Culiacán, Sinaloa

🚨 Guardia Nacional detiene a Juan Carlos Félix Gastelún por delincuencia organizada 👮‍♂️🔒 #Culiacán #Justicia

Benjamín Velasco2 días ago

Grupo de motociclistas en evento festivo en Mazatlán, Semana Internacional de la Moto 2025

Deportes

Semana Internacional de la Moto Mazatlán 2025 Vuelve en Semana de Pascua con Más de 30 Mil Motociclistas

¡Regresa la Semana Internacional de la Moto Mazatlán 2025 en Pascua con 30k motociclistas! 🏍️🎉 #MotoMazatlán #SIMM2025

Paola Padilla2 días ago

Operativo de inmigración en Chicago bajo la administración Trump

Internacionales

Redada Migrante en Chicago: Administración de Trump Inicia Deportaciones Masivas la Próxima Semana

🚨 Administración Trump lanza redada masiva en Chicago para deportar migrantes 🚔 #Migración #Chicago

Benjamín Velasco2 días ago

Juan Carlos Félix Gastélum, conocido como 'El Chavo Félix', detenido en Sinaloa

Actualización

Primeras Fotos de El Chavo Félix Detenido en Sinaloa

🚨 #Actualización Primeras imágenes de "El Chavo Félix", yerno de "El Mayo" Zambada🔒 #Seguridad #Sinaloa

Paola Padilla1 día ago

Termómetro de madera en paisaje nevado con árboles cubiertos de nieve, mostrando temperaturas en Celsius y Fahrenheit.

Ahome

Bajas temperaturas en Sinaloa este fin de semana: Pronóstico detallado y consejos para prepararse

¡Alerta de frío en Sinaloa! ❄️🌬️ La Niña y corriente polar causarán bajas temperaturas este fin de semana #ClimaSinaloa #AlertaFría

Víctor Márquez2 días ago

Sinaloahoy

Tecnología