Forum pubblico/privato: Pubblico
Permessi di scrittura: Utenti registrati
Giorno: 07/05/2019, 20:24:59
Lc0 Dev
Pur non essendo il mio "programma preferito" (per usare un eufemismo biggrin.gifbiggrin.gif), per par condicio con SF, credo che sia il caso di aprire un apposito Topic per discutere periodicamente sugli aggiornamenti di Leela e cercare di capire, di volta in volta, quale potrebbe essere la versione più forte in circolazione, visto che il grafico riportato sul sito ufficiale non sembra ancora molto attendibile. mmmm.gifmmmm.gifmmmm.gif

Secondo l'autorevole

Stefan Pohl

la versione di gran lunga migliore, fra quelle da lui testate, dovrebbe essere la 42100, che ha fatto registrare un notevolissimo +31 sulla 41800.

Teniamo però sempre presente che, sul campione di 700 partite da lui utilizzato, l'errore statistico è di 20 punti Elo, e potrebbe aver in parte influenzato il dato finale.

Questa 42100 dovrebbe essere più forte di SF10 e sostanzialmente alla pari con le ultime dev di SF, almeno con l'hardware e il libro di aperture utilizzato da Stefan ... mmmm.gifmmmm.gifmmmm.gif

Deludentissima, invece, la tanto strombazzata versione "manualmente migliorata" Lc0 JH T6.532 che, come tanti cloni ritoccati che promettono faville rispetto agli originali da cui derivano, mentre spesso non fanno altro che sovraccaricare il già arduo lavoro dei tester, è risultata ben 50 punti più debole! dho.gif biggrin.gif

Ora il buon Stefan sta testando la 42243, che secondo la pagina ufficiale di Lc0 dovrebbe essere 37 punti più forte della 42100; fra qualche giorno ne sapremo di più ...

ciao.gifciao.gif
"TB or not TB..."
Giorno: 21/08/2019, 16:41:49
Link sponsorizzati
Giorno: 07/05/2019, 21:51:06
Ottimo!
La proverò...
Giorno: 11/05/2019, 21:19:59
Per quanto "debole" secondo Stefan, la versione T6.532 è riuscita a vincere, con merito e grazie a un pizzico di fortuna, la finalissima della terza edizione della TCEC Cup, sconfiggendo il Baccalà per 2 vittorie a 1 e 7 patte.

Decisiva la vittoria al nono turno:


You need Javascript enabled to view it.










In un finale a 7 pezzi, patto secondo le TB7, SF riesce a sbagliare la 155ma mossa (avrebbero pattato 155...Rb5 e 155...Dg5), regalando vittoria e titolo all'avversario.

E poi c'è chi dice che ai motori più forti le TB non servano quasi a nulla ... biggrin.gifbiggrin.gif

Leela sembra decisamente migliorata nella gestione del finale; se le cose stanno davvero così, questa volta sarà difficilissimo per SF riuscire a strappare un'ennesima vittoria nella finalissima del TCEC 15. mmmm.gifmmmm.gifmmmm.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 12/05/2019, 02:50:53
Sarà...
Intanto sto facendo un torneo tra Stockfish 10 Dev, Cfish, Lc0 NN-41800 e lc0 NN-41971

30 sec a mossa, nessuna posizione d'apertura predefinita, no TB

Dopo 9 partite

Cfish 6.0/9
Lc0 NN 41971 4.5/9
Stockfish dev 4.0/9
Lc0 NN 41800 3.5/9

Alcune considerazioni:

1) Continua a non essermi chiaro come prendere le reti migliori, anche perchè sono troppe
La NN 41971 l'ho presa semplicemente perchè era quella col punteggio più alto sul sito quando ci sono andato, ma tiene botta con la 41800 del TCEC, anzi!

2) mi sembra chiaro che alcuni derivati di Stockfish siano migliori di Stockfish Dev, perchè non prendere il migliore tra loro per i TCEC, magari dopo mini-torneo tra loro ?

3) Ho scaricato la rete usata per la finale di questo TCEC e farò un match di 20 partite con Cfish...
Non sono tante ma il Pc mi serve pure per lavorare biggrin.gifbiggrin.gif
Magari chi vince tra i due potrei confrontarlo con la vincente tra Lc0 NN 42100 (o 42243) e Corchess che su buildtester è eccezionale
Giorno: 18/05/2019, 19:30:45
Nessuno sa davvero quale sia la Rete più forte fra le svariate migliaia ultimamente rilasciate.

Il motivo è sempre lo stesso: poche decine, o anche centinaia di partite di test servono davvero a poco, a causa dell'elevatissimo rumore statistico.

Nessuno garantisce che, a dispetto del grafico di progressione, l'ultima versione ufficiale sia sicuramente migliore delle precedenti, anzi, pare che capiti spesso il contrario. dho.gif

Un'altra strana caratteristica del gioco di Leela è che tende ad essere, per così dire, "forte con i forti e debole con i deboli" biggrin.gifbiggrin.gif nel senso che tende a sotto performare contro i motori più deboli, battendoli meno facilmente di quanto faccia il Baccalà (che in questo è enormemente avvantaggiato da un contempt davvero esagerato), mentre tiri fuori il meglio di se quando gioca con quelli più forti.

È quanto ha rilevato anche Stefan Pohl, che ha testato la versione che sta punendo abbastanza chiaramente SF nella finalissima del TCEC.

Dai suoi dati

link

questa versione non sembrerebbe la più forte in assoluto, essendo dietro di 34 punti rispetto alla 42100.

Notiamo tuttavia che su 700 partite il rumore statistico è ancora di 20 punti e quindi può anche darsi che le due versioni siano in realtà quasi pari.

Notiamo anche che questa JH T8 610, pur essendo 35 punti dietro una delle ultime dev di SF sul campione complessivo che tiene conto anche dei risultati contro i motori più deboli (e quindi sarebbe per definizione "secondo" in tale graduatoria), è riuscito a battere il Baccalà con un +6 nei 100 scontri diretti, con 22 vittorie, 16 sconfitte e 62 patte, e quindi con uno score del 53% a cui corrisponde un vantaggio Elo di 20 punti (ancora all'interno dell'oscillazione statistica), e da quest'altro punto di vista sarebbe effettivamente "primo".

Nella finalissima in corso alla CCC, un quadrangolare a 4 motori, con SF e Houdini contro Lc0 42282 e Leelenstein, il Baccalà sta invece recitando ancora la sua parte di favorito, avendo un vantaggio, sia pure risicatissimo, dopo le prime 80 partite.

Lo scontro diretto è finora in perfetta parità (2 a 2 e 24 patte) mentre SF sta facendo meglio di Leela contro gli altri due motori.

Aperture molto più equilibrate e tempi di riflessione decisamente inferiori, direte voi, e forse è davvero così ... mmmm.gifmmmm.gifmmmm.gif

ciao.gifciao.gif
"TB or not TB..."