Forum pubblico/privato: Pubblico
Permessi di scrittura: Utenti registrati
Giorno: 05/01/2022, 10:37:18
Finalmente avremo la verita' sul piu' forte
Buon Anno a tutti !

Stockfish e Lc0 alla resa dei conti finale in un'appassionante sfida testa a testa di 50 partite in modalita' Fischer Random

https://tcec-chess.com/

Questo match assume particolare significato in quanto si capirà chi e' il piu' forte senza libro.

Abbiamo visto troppe ultime edizioni del TCEC condizionate da libri di aperture assurdi e sbilanciati a favore della tattica a scapito della strategia.

Sarebbe irreprensibile considerare come miglior giocatore a scacchi, colui che - uomo o computer - senza libri sa giocare veramente bene a scacchi. Ne e' un esempio il vecchio Kasparov, finito ultimo l'anno scorso in un torneo lampo a Zagabria contro giovanotti imbottiti di teoria ma a ridosso tra i primi nel torneo Fischer Random in Usa.
Giorno: 27/01/2022, 16:17:35
Link sponsorizzati
Giorno: 05/01/2022, 11:16:43
Si era fatto un gran parlare di Komodo come il piu' forte programma a Fischer Random Chess, e Kaufmann piu' volte ha espresso considerazioni in merito pur senza mai affermarlo esplicitamente.

In effetti nella semifinale Komodo e' giunto a ridosso dei due mostri.

Lc0 e Stockfish 14 punti su 22
Komodo 13
con il quarto qualificato, Scorpio, a far da materasso con appena 7 punti. Gli altri programmi erano stati eliminati gia' nelle batterie.

I piu' forti a FRC sono quindi sempre questi tre leader, che sono i piu' forti anche nel gioco con aperture "busted", sebbene Stockfish sia nettamente il piu' forte dei tre nelle aperture "busted" preparate da Jeroen Noomen.

Nelle aperture non "busted", quelle comuni che giocano i grandi maestri in cui l'exit point non deve essere mai superiore a +0,30 per il bianco, invece i tre programmi si equivalgono perfettamente in quanto le partite finiscono nel 99,9% dei casi tutte patte.

Solo il FRC puo' a questo punto fornire una corretta rappresentazione della forza dei rispettivi programmi.
Giorno: 05/01/2022, 12:38:35
Per il momento, 9-6 a favore di questa nuova versione del motore di Leela, la 0,29, di cui non c'e' traccia sul sito

https://github.com/LeelaChessZero/lc0/releases

Molti nella chat del TCEC, in particolare i fan di Stockfish, sono esterrefatti del deludente comportamento del loro protege e si stanno interrogando su quali siano stati i cambiamenti introdotti da Leela con la 0,29.

Io ne ho notato uno, di certo: a differenza del passato Leela pensa adeguatamente sulle prime mosse, in un caso che ho notato persino 5 minuti sui 30 complessivi a disposizione. Durante il TCEC 21 invece notavo che pur con addirittura 120 minuti a disposizione Leela giocava in appena 1-2 minuti soli la prima delicatissima mossa in uscita dal book preparato da Noomen.

Sicuramente la 0,29 introduce un migliore time management rispetto alle versioni precedenti, poi non so se ci sara' dell'altro ancora.

La mia osservazione e' condivisa:
sparkleofdiego: "i think this time around i even like Leela's time management. It seems far more reasonable than the last time i checked"

Se miglioramenti importanti sono avvenuti - e potremmo osservarli al termine della sfida se ci saranno davvero stati - questi sono da attribuire non certo alla rete, la cui forza secondo Pohl e' stabile da mesi e non mostra piu' alcun miglioramento apprezzabile.
Giorno: 05/01/2022, 14:18:04
Fischer Random altrimenti detto Scacchi 960

https://it.wikipedia.org/wiki/Scacchi960
Giorno: 05/01/2022, 14:41:32
Trovo che sia incredibile la capacita' dei GM come Kasparov ed altri di trasformare una posizione di partenza assurda in una posizione "normale" in sole pochissime mosse. Penso che giocatori come Karpov o Smyslov, famosi per la loro ricerca dell'armonia dei pezzi, sarebbero ancora piu' versati di Kasparov per questa variante del gioco.
Giorno: 05/01/2022, 16:50:56
Penso che FRC sia una curiosita' divertente per passare il tempo in attesa del TCEC e nulla piu'...
I libri possono essere assurdi, ma le stesse aperture le usano entrambi i motori (come scegli, scegli male), se non si giunge allo stesso punteggio dopo tot partite...
I motori sono fatti per gli scacchi classici e dovrebbero interpretare il modo di continuare implementando gli algoritmi adatti dalle posizioni degli scacchi classici, altre posizioni non gli appartengono e in un match classico farebbero in modo di non raggiungerle

Questo FRC dimostra solo che un programma di scacchi classico si adatta meglio di un altro all'FRC
Ma a me l'FRC non interessa, non sto nemmeno seguendo

Per me Lc0 sara' piu' forte quando vincera' un match classico (su un HW da "utente medio", per cui gia' il TCEC classico conta poco, figuriamoci FRC), per ora non lo fa
Giorno: 05/01/2022, 18:19:46
Vediamo come evolve il match.

E' possibilissimo che questa versione di Stockfish, fortemente ottimizzata per i match classici con le varie patch, fatichi di piu' in FRC.

Al TCEC l'FRC riserva spesso sorprese. Al TCEC-20 il motore piu' accreditato era SF eppure vinse Komodo (attuale campione) per appena un punto. Al TCEC 19 SF stravinse 29-21 contro Lc0 nonostante la differenza di forza tra i due motori all'epoca non fosse così elevata come il punteggio sembra suggerire (SF era dato comunque favorito).

Io resto dell'idea che 50 partite sono comunque poche, la barra di errore con disposizioni casuali dei pezzi e' enorme, sono sufficienti un paio di aperture un po piu' sbilanciate verso lo stile di uno dei due motori per determinare l'esito del match.
Giorno: 05/01/2022, 23:45:09
sono sufficienti un paio di aperture un po piu' sbilanciate verso lo stile di uno dei due motori per determinare l'esito del match.

In un certo senso hai centrato il punto...
Se negli scacchi classici basta una diversa disposizione iniziale dei pezzi (aperture), per determinare la vittoria di uno dei contendenti, figuriamoci ad un cambiamento molto piu' radicale come i FRC...
Che poi i motori hanno algoritmi (sicurezza del re, occupazione del centro, ecc) che non sono adatti ad uno stravolgimento dei pezzi come nel FRC...

Credo che questo match dira' chi e' il migliore dei due nell'frc, il che significa poco o nulla su chi e' il migliore negli scacchi classici...
L'unico modo sono i classici superfinali fatti negli ultimi anni...
Che poi non e' piu' nemmeno vero, dato che ora il risultato dipende pure dall'HW (sapete come la penso, non fatemi fare gli stessi discorsi ad ogni nuovo TCEC... biggrin.gif)
Giorno: 06/01/2022, 07:19:38
E' interessante notare (senza offesa per nessuno, ho imparato che gli scacchisti ci mettono un attimo a offendersi e andarsene biggrin.gif) che chi si lamenta dei libri di aperture (che darebbero un vantaggio decisivo a uno dei motori secondo loro) ora accettano senza problemi uno stravolgimento nelle posizioni raggiungibili ben piu' radicale come l'FRC che stravolge le strategie per le quali i motori sono creati... confused.gif

La verita' su chi e' piu' forte la sappiamo: finora e' Stockfish che vince i TCEC, nelle varie liste elo dei siti scacchistici e mediamente sull'HW medio dell'utente comune...
il metodo Montecarlo e' troppo lento e a meno di grosse differenze nell'hardware (che secondo me influiscono ben piu' del libro di aperture per questo assurdo RL da mantenere a tutti i costi per imitare il super Hw di google dove girava alphazero contro il pc scrauso dove c'era Stockfish 8)...

Lc0 potrebbe benissimo essere migliore nell'frc, negli scacchi classici no, almeno finora

La miglior dimostrazione di questo sono motori come Crystal e Crystallite...
Risolvono molte posizioni che Stockfish classico non risolve, eppure in un match perderebbero senza dubbio...
Paradossalmente perdere questo match potrebbe far bene a Stockfish e danno a lc0: se i programmatori ci lavorassero per renderlo piu' forte nell'frc potrebbero risolvere certe limitazioni nel gioco strategico dello stoccafisso e allora...
Giorno: 06/01/2022, 08:35:09
@ Masticone

La comunita' che segue Stockfish e' assurdamente compatta e coesa su rilievi insignificanti, ma finisce spesso per guardare il dito anziche la luna.
Scrive per mesi e mesi dei posti logorroici su presunti aumenti di forza Elo di 0.000x, quando sarebbe onesto ammettere che

1) il piu' sostanziale incremento della forza di gioco, di centinaia di punti Elo e non di 0,000x e' dovuto ad un risultato che i programmatori di Stockfish non sono stati capaci di compiere autonomamente in molti anni di studio e lavoro, cioe' una funzione di valutazione ripresa di sana pianta dal Go.

Questo e' il primo risultato di ammissione da parte dei programmatori di Stockfish: hanno buttato via anni di sforzi e lavori indefessi culminati nella versione HCE per farli sostituire con qualcosa di "pronto" preparato da altri

2) Il secondo passo di questo lavoro di ripresa dei lavori altrui (non lo chiamo "plagio" per rispetto) ha comportato il trasferimento ( e non lo chiamo la "predazione" per lo stesso motivo precedente, il rispetto personale di tanta fatica inutile compiuta in passato) degli elaborati ottenuti esclusivamente dalle valutazioni di Leela Lc0 per l'immissione di questa conoscenza superiore del gioco nelle reti di Stockfish.

Da rilevare non tanto il punto 1 quanto il punto 2: e' un implicito riconoscimento non che Leela giochi meglio di Stockfish, ma che Leela conosca gli scacchi molto meglio di quanto siano riusciti a far conoscere i programmatori di Stockfish al loro giocattolo, nemmeno con il passaggio importantissimo della NNUEE di cui ho detto alla 1.

Per quanto riguarda invece la polemica dei libri "busted", essi sono funzionali a far emergere vincitore il programma con una migliore ricerca operativa nell'albero delle varianti. Altrimenti se si scegliessero le aperture che scelgono i grandi maestri, le partite tra Komodo Leela e Stockfish finirebbero tutte patte. Con buona pace di tutti queste patch che migliorano Stockfish di 0,00x punti Elo a patch.

Lo dico chiaro: l'impatto delle patch future di Stockfish e' insignificante rispetto alla possibilita' di Stockfish di vincere qualche partita in piu' in condizioni di torneo con hardware adeguato, in quanto il gioco degli scacchi ha una tendenza sostanzialmente patta secondo la teoria dell'algoritmo mini-max.
Le patch servono unicamente a velocizzare il processo algoritmico per permettere a Stockfish di diventare il dominatore assoluto a cadenze medie e veloci.

Mi piacerebbe seguire un TCEC22 non costruito su 20 siciliane e 30 altre aperture "minori", ma un TCEC costruito sulle aperture del recente mondiale Carlsen Nepomntichi, integrato dalle aperture giocate alla World Cup o comunque aperture in cui il bianco non parta con un vantaggio > di 0,3/0,4. Sono pronto a scommettere con te o chiunque altro che in condizioni di hardware TCEC finirebbero tutte patte, anche perche' esperimenti simili sono gia' stati largamente condotti.

Infine, la testimonianza che Leela giochi meglio di Stockfish e' fornita da Carlsen stesso. La mossa novita' teorica Ca5 che comporta la perdita del pedone "e5" nella spagnola che si e' giocata nella prima partita dell'ultimo mondiale e' la prima linea di Leela, ma la seconda di Stockfish 14.
Guarda caso, dopo aver "succhiato il sangue" alle reti di Leela (permettetemi la metafora...) ora anche Stockfish versione successiva a 14.1 gioca ..Ca5 !
Che Leela giochi posizionalmente meglio di Stockfish, in particolare che le valutazioni di Leela sono in assoluto molto piu' precise di Stockfish, non lo dico io: e' l'evidenza del team del campione del mondo a suggerire questo che io considero un assoluto dato di fatto, non una semplice ipotesi da sottoporre a verifica. Basti osservare la deviazione standard delle valutazioni di Stockfish, molto piu' erratiche rispetto a quelle di Leela che delle volte, in certe fasi delle partite, sembrano addirittura poter essere descritte da una linea retta.

Ultima controversia: Leela non gioca bene la siciliana per via della ricerca Montecarlo non altrettanto efficiente dell'Alpha Beta? Vero, ma non sarebbe un problema insuperabile: e' sufficiente che si inizi di nuovo un processo di apprendimento con gli stessi hardware di AlphaZero con il vincolo delle mosse iniziali 1e4 c5 e Google dopo appena 4-5 ore di allenamento sfornerebbe un mostro nella siciliana che gioca altrettanto bene quell'apertura come la spagnola.

Masticone, cio' che da tempo ti suggerisco di considerare e' il motivo per cui Leela non puo' giocare correttamente la siciliana, in quanto la stessa apertura viene scartata ad uno stadio molto iniziale di allenamento come si e' letto nel paper di Nature su Alpha Zero.

Tutto l'allenamento che viene svolto sulle reti di Leela oramai da anni viene svolto esclusivamente sulle mosse 1 e4-e5, in quanto "la temperatura", ovvero il parametro di casualita', e' settato a livelli troppo bassi per permettere che il programma casualmente giochi la siciliana o altre aperture diverse dalla simmetria iniziale 1 e4 e5.

Io comunque comprendo il libro "busted" del TCEC: la siciliana esteticamente e' un piacere da osservare, perche' si presta ad arrocchi eterogenei, sorprese tattiche e attacchi alla baionetta.

In questo caso il TCEC assolve alla necessita di divertimento della platea di scacchisti che troverebbero noiosissime delle lunghe manovre di cavallo via f1-e3-f5 che originerebbero nella apertura Spagnola.

Per questo motivo anch'io apprezzo molto il lato estetico del TCEC, ma non riconosco ad esso alcun valore indicativo dell'asserito primato di Stockfish su Leela in merito all'ipotesi di un gioco "migliore"..

Attribuisco invece molto piu' significato esplicativo alla variante Fischer, a cui assistiamo adesso alla fase finale del campionato 2021

Ciao e complimenti nonche' un sincero apprezzamento per la tua vigile osservazione a tutte le novita'