Connect with us

Hi, what are you looking for?

Tecnología

Cómo AlphaZero ha reescrito lo que sabíamos del ajedrez y del Go

Silver trabaja para DeepMind, una empresa británica de Inteligencia Artificial, subsidiaria de Google. Él fue el líder de AlphaGo, un programa de computadora que aprendió a jugar al Go, un juego de mesa con más de 3000 años de antigüedad, en donde aprendió por sí mismo, las técnicas para jugar como un maestro solamente jugando millones de partidas contra el mismo programa y sacando conclusiones.

¿Cuánto costaría el Galaxy Fold en México?

La última creación de Silver es AlphaZero, que aprende a jugar el ajedrez chino: Shogi, el ajedrez tradicional y el Go, solamente practicando contra sí mismo. Después de millones de partidos de práctica, AlphaZero ha sido capaz de descubrir las estrategias que a los seres humanos les ha llevado siglos entender.

Silver habla de las posibilidades de que la IA pueda resolver problemas que nos superan a los seres humanos. Por ejemplo, en una famosa partida de Go contra posiblemente el mejor jugador del mundo, AlphaGo hizo un movimiento brillante, que los observadores pensaron que había sido un error. ¿Fue acaso la máquina creativa por esta vez?

El “movimiento 37” como se le conoce, sorprendió a todos, incluso a la comunidad de Go y a nosotros, dice Silver. Fue algo inesperado para los seres humanos que juegan Go y que han hallado estrategias que tienen miles de años de ser conocidas. “para mí, esto es un ejemplo de algo que está siendo creativo”, comenta Silver.

En el caso de AlphaZero, que es un programa mucho más general porque puede jugar Go, Ajedrez o Shogi, como no aprende de los humanos ¿deberíamos pensar que es incluso más creativo? Porque cuando uno aprende algo por sí mismo, y uno va construyendo su propio conocimiento desde cedro, es casi hablar de la esencia de la creatividad ¿o no?

En el caos de AlphaZero, el software tuvo que darse cuenta de todo por sí mismo. Cada paso dado es un brinco creativo, y esto es así, porque la máquina nunca recibió el consejo humano. Y estos brincos continuaron más allá de nuestras habilidades y tienen el potencial de asombrarnos a todos.

AlphaZero jugó una serie de partidas contra StockFish, uno de los programas de ajedrez más fuertes del mundo. ¿Qué se aprendió de esta experiencia? StockFish es un motor de ajedrez muy sofisticado, pro en el corazón del mismo está escrito de alguna manera que, “de acuerdo a los humanos, esta es una buena o mala posición”, por lo que estamos en un bucle infinito. Es bueno porque juega como nosotros pensamos que debe jugarse o hace jugadas porque le hemos dicho que son buenas.

AlphaZero aprendió a entender las posiciones por sí mismas. Y hay un juego hermoso en donde AlphaZero entrega 4 peones uno tras otro, e incluso, quiere entregar un quinto peón. StockFish piensa que está fantásticamente ganado pero AlphaZero está feliz. Encontró una manera de entender la posición que es impensable de acuerdo a las normas del ajedrez. Entiende que es mejor la posición que tiene que los cuatro peones de desventaja.

Pero más allá de sorprender al mundo del ajedrez, ¿cuál es la utilidad de AlphaZero en la innovación científica? El aprendizaje de máquinas ha sido el enfoque dominante, en particular una modalidad llamada aprendizaje supervisado, lo que significa que los programas aprenden lo que los srs humanos entienden y tratan de hacer lo mismo en el software. Pero también puede usarse el aprendizaje reforzado, que es como tener un millón de mini- descubrimientos, uno tras otro, que son los que construyen la esencia de la manera de pensar creativamente. Y esto es lo que buscamos, un poder inmenso, una habilidad inmensa para resolver problemas y que -esperamos- lleven a nuevos paradigmas y retos en la ciencia.

Con esta postura, ¿habrá aspectos de la creatividad humana que no pudiesen ser automatizados? Silver piensa que las capacidades de la mente humana, estamos muy lejos de lograr esto. Podemos resolver problemas en dominios muy específicos como pueden ser el Ajedrez o el Go, , al que le damos una cantidad masiva de poder de cómputo para así resolver una tarea. Pero la mente humana es capaz de generalizar algo diferente. Se pueden cambiar las reglas del juego y la máquina no necesitará de otros 2000 años para decir cómo debe jugarse.

“Yo diría”, afirma Silvers, “que estamos en la frontera de la IA en este momento, y que queremos ir a un lugar en donde podamos incrementar su rango y flexibilidad de nuestros algoritmos para cubrir una gama más amplia de lo que los seres humanos saben hacer. Pero hay un largo camino para ello”.

¿Y cómo llegar a ello? Silver dice que le gusta esto de preservar esta idea de que el sistema sea libre para crear, sin tener que estar limitado por el conocimiento humano. “Un bebé no está preocupado por una carrera universitaria, por tener hijos o por trabajar. Juega con sus juguetes y aprende habilidades para manipular cosas. Hay mucho que aprender del mundo en la ausencia de una meta final. Lo mismo pensamos que debería ser cierto para nuestros sistemas”.

La entrada Cómo AlphaZero ha reescrito lo que sabíamos del ajedrez y del Go se publicó primero en unocero.

Click to comment

Comenta

Últimas noticias

Vehículos de policía con luces de emergencia en Mazatlán durante la noche.

Mazatlán

Trágico Ataque en Mazatlán: Joven de 21 Años Muere a Tiros 😢🔫 #Mazatlán #Violencia

Automóvil negro con grafitis en protesta contra la agencia MG de Reynosa. Automóvil negro con grafitis en protesta contra la agencia MG de Reynosa.

Business

🚗🔥 Camioneta defectuosa y maltrato: Alejandra enfrenta a MG Reynosa 💪 #Justicia #Profeco

Imagen de un vehículo militar en una carretera rural, simbolizando el enfrentamiento en Escuinapa. Imagen de un vehículo militar en una carretera rural, simbolizando el enfrentamiento en Escuinapa.

Escuinapa

Violento enfrentamiento en Escuinapa deja un muerto y varios heridos 💥👮‍♂️🚑 #Seguridad #Escuinapa

Mano sosteniendo un teléfono móvil con el logotipo de TikTok en la pantalla, sobre un fondo con sombras suaves. Mano sosteniendo un teléfono móvil con el logotipo de TikTok en la pantalla, sobre un fondo con sombras suaves.

Actualización

🔥 TikTok reabre en EE.UU. con el respaldo de Trump, defendiendo la libertad de expresión 🇺🇸📱 #TikTokUSA #LibertadDigital

Camión volcado en la avenida Gabriel Leyva, rodeado de vegetación y cinta de seguridad, con personas observando. Camión volcado en la avenida Gabriel Leyva, rodeado de vegetación y cinta de seguridad, con personas observando.

Mazatlán

🚛 Trailer pierde control en Mazatlán y roza hogares! 😱🌳 #Mazatlan #Accidente

Grupo de personas con máscaras y bandas verdes en una manifestación, con un vehículo en el centro y alguien sobre su techo. Grupo de personas con máscaras y bandas verdes en una manifestación, con un vehículo en el centro y alguien sobre su techo.

Actualización

Gracias a todos: Dos rehenes libres hoy, 91 aún esperan su libertad 🙏🇮🇱 #Solidaridad #Esperanza

Suscríbete y recibe noticias

Tendencia

El Habal

Trágico tiroteo en Mazatlán: Asesinan a joven en restaurante de Real del Valle 😢🔫 #Mazatlán #Seguridad

Culiacán

🚔 Levantan y balean a sujetos a bordo de un jetta en Parque Constitución, Culiacán 🌳 Menores huyen asustados 🏃‍♂️ #Culiacán #Seguridad

Mazatlán

🚁 Fuerzas Armadas Despliegan Operativo Aéreo en Mazatlán tras Enfrentamiento Armado 💥🔒 #Seguridad #Mazatlán

Culiacán

🚨 Guardia Nacional detiene a Juan Carlos Félix Gastelún por delincuencia organizada 👮‍♂️🔒 #Culiacán #Justicia

Deportes

¡Regresa la Semana Internacional de la Moto Mazatlán 2025 en Pascua con 30k motociclistas! 🏍️🎉 #MotoMazatlán #SIMM2025

Internacionales

🚨 Administración Trump lanza redada masiva en Chicago para deportar migrantes 🚔 #Migración #Chicago

Actualización

🚨 #Actualización Primeras imágenes de "El Chavo Félix", yerno de "El Mayo" Zambada🔒 #Seguridad #Sinaloa

Ahome

¡Alerta de frío en Sinaloa! ❄️🌬️ La Niña y corriente polar causarán bajas temperaturas este fin de semana #ClimaSinaloa #AlertaFría