Forum pubblico/privato: Pubblico
Permessi di scrittura: Utenti registrati
Giorno: 07/10/2020, 10:24:52
Una "Finalicchia"!
Le tante perplessità (su più core e a tempi lunghi) sul nuovo approccio NNUE di SF mi hanno spinto a tentare un interessante esperimento, con un match fra lo SF "classico" del 17 Giugno, campione del TCEC 18 (col suo bravo contempt impostato a zero) e la versione NNUE che sta affrontando Leela in questa nuova edizione, col suo contempt di default.

Stesso tempo di riflessione della sfida ufficiale, 120 minuti a partita + 10" a mossa, SyzygyBase a 6 pezzi su SSD e stesso libro di aperture di questa 19ma edizione.

Purtroppo, però, gli 8 core fisici del mio laptopino mi forniscono una velocità che è circa 1/15 di quella della macchina del TCEC e anche la RAM a disposizione per le hash table è fortemente ridotta.

Nonostante ciò i due motori riescono a raggiungere profondità davvero notevoli, dalle 40 semimosse o più in apertura alle 60 o più nel finale.

Si potrebbe definire senz'altro una "Finalicchia" biggrin.gifbiggrin.gif ma è tutto quello che mi passa il convento.

Se alla fine SFfin19 riuscirà a prevalere in maniera convincente su SFfin18 SULLA MIA MACCHINA (come giustamente dice Masticone biggrin.gifbiggrin.gif) allora mi inchinerò alla portata epocale della nuova rivoluzione; se non dovesse riuscirci, beh, lasciatemi continuare a sostenere che questo nuovo NNUE potrebbe essere solo una ca..ta pazzesca! biggrin.gifbiggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 26/10/2020, 11:13:23
Link sponsorizzati
Giorno: 07/10/2020, 10:37:23
biggrin.gifbiggrin.gif

Sai, io trovo che il tuo pc sia molto più "rappresentativo" dei pc dei normali utenti delle bestie assurde del TCEC...

Se ti interessa, sto facendo un minimatch tra Crystal classico e la versione nnue, dopo 4 partite il secondo conduce 3-1 (+2 =2 -0)

Cmq anche il contempt di Stockfish nnue dovrebbe essere messo a 0...

Può darsi cmq che lo Stockfish attuale non prevalga nettamente come si pensi, ma non necessariamente è una fregatura: voglio dire se Stockfish attuale trova la mossa migliore in 10 secondi e quello di un anno fa in 30 secondi, alla fine fanno le stesse cose
Forse dovrebbero essere rivisti i tempi, non troppo brevi come nei test, ma quelli attuali sono esagerati

Pure Sargon sul mio vecchio Amiga giocherebbe come Stockfish se gli dessi sufficente ram e tempo di due anni a mossa biggrin.gif
Non so se si capisce quello che voglio dire...
Giorno: 07/10/2020, 10:54:06
Ciao Masticone:

Ho usato gli stessi contempt utilizzati per il Baccalà dagli organizzatori nelle due finalissime.

Se davvero l'NNUE è così forte come dicono, allora a maggior ragione è giusto fargli adottare un contempt elevato in confronto allo "0" per la più debole versione classica.

Pubblicherò solo le partite decisive, a meno che qualcuno non mi faccia un'esplicita richiesta per le tante patte che sicuramente ne verranno fuori. dho.gif

La doppia sfida sulla linea N°1, la Siciliana Najdorf vista all'opera nelle prime due partite del TCEC, è terminata, come prevedibile, con due belle patte.

In realtà è stata giocata addirittura 4 volte con 4 pareggi, visto che al primo tentativo avevo lasciato sulla GUI le impostazioni di default sull'accettazione delle patte, e i motori si erano "accordati" dopo appena una trentina di mosse (stanno diventando sempre più "umani" sotto tutti i punti di vista biggrin.gifbiggrin.gif), quando in teoria c'era ancora qualcosa da dire.

Ora invece se la dovranno giocare fino al Re contro Re! biggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 07/10/2020, 11:13:55
Grazie per il test Luigi!
Non vorrei sbagliarmi ma il valore di contempt è quasi inutile quando si usa NNUE perché va a influire solo nella valutazione classica, che rappresenta solo una piccola parte della ricerca quando la posizione è vicina a 0.00
Giorno: 07/10/2020, 11:16:19
@ Marcus9: credo che tu abbia perfettamente ragione per quanto riguarda il contempt, che dovrebbe effettivamente influenzare solo la valutazione classica.

Intanto è terminata in parità anche la terza partita, la classica Est Indiana della seconda linea utilizzata al TCEC.

La versione detentrice del "titolo" ha il Bianco nelle partite dispari, cosicché toccherà ora all'NNUE cercare di far valere il suo presunto vantaggio di apertura valutato in circa 7 decimi di pedone.

Sarà poi la volta della linea "bacata" con cui entrambi gli sfidanti si sono già imposti di Bianco nel match ufficiale, e qui credo che vedremo almeno una vittoria ...

ciao.gifciao.gif
"TB or not TB..."
Giorno: 07/10/2020, 11:37:03
Ok, niente contempt allora...
Ma rimane valida una osservazione fatta un paio di giorni fa: se si deve mettere in discussione Stockfish 12 nnue, allora si devono ridiscutere pure le reti di Lc0...
Altrimenti Lc0 farebbe a pezzi il suo avversario ma non è così, anche lui non sarebbe migliorato granché
Questo TCEC è stato come quello passato: Stockfish primo nettamente e Lc0 secondo (con un bel vantaggio sul terzo), poi negli scontri diretti SF ha più difficoltà...
Giorno: 07/10/2020, 18:26:34
Termina in parità anche il quarto incontro. L'NNUE, col Bianco, prova a far sua la gara e giunge a una valutazione di 1.74 unità di pedone, solo per accorgersi alla fine che la valutazione di 0.47 dell'avversario, basata sulla costruzione di una fortezza difensiva, era molto più realistica:


You need Javascript enabled to view it.










Per vedere all'opera la superiorità dell'NNUE dovremo ancora attendere.

Fra poco farò partire la doppia sfida con la Francese "bacata" e domani vi dirò com'è andata a finire ...

ciao.gifciao.gif
"TB or not TB..."
Giorno: 07/10/2020, 19:20:31
Molto interessante questa sfida.
Ma hai intenzione di fare un confronto su 100 partite o ne farai di meno?
Giorno: 07/10/2020, 19:34:56
Avrei intenzione di giocarle tutte e 100, a meno che l'NNUE non dimostri una superiorità così netta dopo le prime decine di partite da rendere del tutto scontato il resto del confronto; ma naturalmente mi ci vorranno un bel po' di settimane ... dho.gif

Se poi qualcuno volesse ripetere l'esperimento, potremmo suddividerci le linee di apertura e scambiarci le partite per arrivare prima alla conclusione, o magari anche confrontare i risultati ottenuti.

Osservando la prima coppia di partite, che sono state rigiocate per il motivo esposto in precedenza, ho potuto infatti notare che esiste una notevole casualità nella scelta delle mosse, e che quindi è facile che, rigiocando una partita, escano poi fuori linee completamente diverse ... mmmm.gifmmmm.gifmmmm.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 07/10/2020, 20:40:13
E' un esperimento interessante e, come ha scritto Masticone, molto più rappresentativo per noi poveri mortali rispetto a quello del TCEC.
Complimenti per l'impegno!
Sono una carota in cerca di sè stessa...