Forum pubblico/privato: Pubblico
Permessi di scrittura: Utenti registrati
Giorno: 05/09/2020, 11:00:58
SF12 dev
Neanche il tempo di rilasciare la versione ufficiale, e nel giro di un paio di giorni siamo già stati sommersi da numerose patch funzionali, fra cui addirittura un cambio della Rete di default che, a parte la sigla più complicata

nn-308d71810dff.nnue

dovrebbe essere l'equivalente della 1739, come chiarito dallo stesso Sergio Vieri.

Sul nostro Forum nutriamo ancora qualche perplessità sulla totale bontà del nuovo approccio NNUE, soprattutto in modalità di analisi profonda, e a quanto pare non siamo i soli, visto che l'ultima patch rilasciata va decisamente nella direzione di un approccio ibrido, in quanto recita: "If there is a moderate imbalance, use classical eval with small probability (1/16)".

In pratica, anche quando il motore è impostato su NNUE, utilizza casualmente la funzione di valutazione classica fino al 6% del suo tempo di ricerca.

In realtà già il 30 Agosto sul Forum del FishCooking qualcuno si lamentava del fatto che la ricerca NNUE non fosse più "pura", ma ormai già "ibridata" con quella classica e richiedeva a gran voce l'inserimento di un comando UCI per poterla riavere, pura al 100%, come pare si possa fare con Cfish, ma non so se con le ultimissime versioni il suo autore abbia conservato tale opzione ... mmmm.gifmmmm.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 23/09/2020, 04:32:29
Link sponsorizzati
Giorno: 09/09/2020, 17:15:40
La politica degli ibridi sembra stia dando i suoi frutti.

L'ultima patch di ieri ha aumentato fino al 12,5% la percentuale massima di tempo di analisi da destinare casualmente alla funzione di valutazione classica.

È in corso il primo test di regressione e dopo le prime 10000 partite il guadagno su SF12 sarebbe già di 8 punti, ben al di fuori della banda di errore!

A quanto pare la rivoluzione non è ancora terminata, anche se c'è stato un po' di ritorno all'antico. zizi.gifzizi.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 12/09/2020, 10:20:02
Per diletto ho provato uno scontro tra Stockfish 12 e il vecchio Houdini 1.5a, 20 secondi per mossa, 1 CPU a testa.

Dopo 20 partite lo score è 19 vittorie e 1 patta in favore di SF12.
E pensare che 10 anni fa H1.5a e Rybka erano considerati da diversi GM quasi la perfezione dal punto di vista tattico e al livello di un GM da 2700 elo per la parte strategica zizi.gif

I motori odierni se li mangiano a colazione zizi.gif
Giorno: 12/09/2020, 11:08:13
Però in rete ho trovato un test che mi rende perplesso

Score of Crystal 3.0 vs CFish 050920: 1 - 14 - 25 [0.338]
Elo difference: -117.2 +/- 63.3, LOS: 0.0 %, DrawRatio: 62.5 %

40 of 200 games finished.
Giorno: 12/09/2020, 12:01:40
Perfettamente normale se il test fra Crystal e CFish è stato effettuato a tempi bullet o comunque abbastanza ridotti.

Crystal non è un motore da competizione, soprattutto a tempi brevissimi, ma essenzialmente da analisi: allarga l'esplorazione dell'albero delle varianti piuttosto che andare subito in profondità; non sempre è un fulmine nel trovare le soluzioni delle posizioni tattiche più semplici, ma prima o poi arriva in quasi tutte quelle più complesse.

L'unica seria lacuna di questo bel motore è in alcuni tipi di finale (e purtroppo per lui si sa quanto sia importante una perfetta conduzione dei finali nel decidere il punteggio complessivo di una sfida), che tende a considerare troppo spesso patti quando invece, con manovre che richiedono un'orizzonte di notevole profondità, uno dei Re riesce magari a portarsi dalla parte opposta della scacchiera in posizioni solo a prima vista bloccate, forzando così il risultato ...

ciao.gifciao.gif
"TB or not TB..."
Giorno: 12/09/2020, 12:44:19
È interessante quando prendo Cfish o Crystal (o...) sul tablet, prendo una partita di qualche mondiale e le esamino, vedendo le differenze tra versioni classiche e nnue
Giorno: 12/09/2020, 14:16:06
Sì, stavo notando anch'io la differenza fra la valutazione Classica e quella NNUE di Crystal su alcune posizioni della mia raccolta tattica.

Ad esempio nella Nikolic - Fisher la mossa vincente non figura affatto nella pv a 4 linee con la valutazione classica, mentre è subito fra le prime due con la NNUE ...

ciao.gifciao.gif
"TB or not TB..."
Giorno: 15/09/2020, 21:31:57
Le patch dell'8 Settembre guadagnano alla fine "solo" 6,5 Elo su SF12, ma va segnalato oggi un nuovo cambio delle Rete di default, modificata in

nn-03744f8d56d8.nnue

e che in realtà è la 1520 di Sergio Vieri.

La modifica ha passato il test coi soliti 2.94 punti, ma secondo l'ormai "conservativa" NCM si configurerebbe l'ennesimo salto di qualità con un ulteriore incremento di almeno una ventina di punti a tempi brevi! mmmm.gifmmmm.gifmmmm.gif

Se fosse davvero così e se si riuscisse ad andare avanti ancora di un altro po', mi sa che per fine anno ci potrà essere anche lo SF13; altro che numeretti magici! ... biggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 16/09/2020, 12:03:07
Finalmente alla CCC cominciano a fare le cose sul serio. La nuova Rete di SF è impegnata a tempi extra lunghi contro Leela in versione v0.26.1 J92-70. Sarà di fatto un anticipo della finalissima del TCEC ma con aperture che qui dovrebbero essere molto più equilibrate.

Le prime due partite sono terminate entrambe in parità.

ciao.gifciao.gif
"TB or not TB..."
Giorno: 16/09/2020, 13:11:14
Mah...
In base a quali criteri hanno scelto l'hardware ?
Perché se hanno imposto un RL (o un prezzo di Gpu e Cpu da bilanciare) è una sfida falsata in partenza visto che uno dei due motori viene penalizzato biggrin.gif