Forum pubblico/privato: Pubblico
Permessi di scrittura: Utenti registrati
Giorno: 28/10/2021, 09:26:00
Quindi il mio personale metodo di conteggio delle patch dovra' ripartire dalla 14.100, quella ufficiale appena rilasciata.

Peccato per la quindicina di patch mancanti all'appello ... biggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 30/11/2021, 00:59:34
Link sponsorizzati
Giorno: 07/11/2021, 10:06:57
Il rilascio ufficiale della versione intermedia 14.1 e' stato, quasi sicuramente, motivato dall'uscita in commercio di KomodoDragon 2.5, oltre che dei vari Fat Fritz & Co.

Rilascio forse un tantino prematuro, visto che il motore appariva in fase di leggera regressione.

Positiva, comunque, la decisione di continuare a testare le nuove dev. contro l'ormai "vecchio" SF14, il che servira' a decidere il momento in cui si dovra' rilasciare la versione 15 con tutti i sacri crismi.

Quest'ultimo mese e' servito solo a riguadagnare il poco terreno perduto, visto che la dev. numero 14.109, ultima del 5 Novembre, ha fatto registrare, almeno su un solo core, un +18.7 su SF14, praticamente lo stesso risultato ottenuto nel test di 30 giorni fa.

Ben magra consolazione! dho.gif senzasperanza.gif rollo.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 09/11/2021, 19:12:37
Le ultime dev di SF sono strane... su NCM appaiono in calo, su altri siti come quello di Pohl sembra esserci qualche miglioramento, al di là del margine di errore.

Forse le ultime patch migliorano il motore a tempi più lunghi penalizzandolo un pò a tempi brevi?mmmm.gif
Giorno: 10/11/2021, 10:16:21
Bisogna sempre tener conto del fatto che i margini di errore nei test di Pohl e della NCM sono decisamente piu' elevati rispetto a quelli dei test ufficiali, e si attestano sui 6 o 7 punti, a causa del piu' ridotto numero di partite (Pohl), o perche' quelli della NCM si ostinano ad utilizzare l'ormai obsoleto SF7 come termine di paragone, il che comporta un raddoppio della banda d'errore.

Mettiamoci i libri di apertura e le altre condizioni completamente diverse in questo tipo di test, e la frittata e' fatta, col risultato che nessuno ci garantisce se un'apparente recessione fra una versione e la successiva sia reale o solo rumore di fondo.

Non ci resta che valutare la tendenza generale su intervalli di tempo di qualche settimana, e questa, purtroppo, non sembra promettere nulla di buono, almeno nell'immediato futuro. rollo.gifrollo.gifrollo.gif

Forse i motori sono diventati troppo forti rispetto a quanto si potrebbe ancora ottenere e magari faremmo meglio ad accontentarci di cio' che gia' abbiamo. Chissa' ... mmmm.gifmmmm.gifmmmm.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 22/11/2021, 08:29:54
E' la crisi... biggrin.gif

link
Giorno: 23/11/2021, 18:12:11
Dopo un periodo di stasi, una nuova patch mirabolante aggiunge di colpo quasi 15 punti elo a SF (nei test di NCM).

Hanno introdotto una sorta di tuning "adattivo" alla valutazione data dalla rete neurale, che ne migliora notevolmente il mediogioco.
Giorno: 23/11/2021, 22:32:20
Buttato via dalla porta principale, il contempt e' rientrato dalla finestra sotto forma del cosiddetto "ottimismo": la prima patch del giorno 21 di Stephane Nicolet (non vi do il numero, visto che ho ormai perso il conto...), nonostante sembrasse poco significativa in autotest, ha prodotto un notevole balzo in avanti di una quindicina di punti nella NCM, come gia' rilevato da Geralt.

Nulla di strano da spiegare, trattandosi di un test contro un motore nettamente piu' debole, come il vecchio SF7.

Questa variante del contempt, che tende a trattenere piu' a lungo i pezzi sulla scacchiera quando SF pensa di essere in vantaggio, potra' dare sicuramente i suoi frutti contro i motori minori ...

ciao.gifciao.gif
"TB or not TB..."
Giorno: 25/11/2021, 17:34:44
Com'era ampiamente prevedibile, la nuova patch basata sull'ottimismo si rivela pressoche' ininfluente contro un avversario della forza di SF14.

I mirabolanti 15 punti trovati dalla NCM scompaiono come d'incanto in autotest: l'ultima dev. 14.118 fa registrare un +19.35 contro SF14, appena sei o sette decimi in piu' di quanto mostrato una ventina di giorni fa.

Nel panorama asfittico di questi ultimi mesi, solo qualche approccio radicalmente nuovo, come ad esempio l'algoritmo di trattamento delle fortezze di Crystallite, potra' portare una ventata di freschezza rendendo i motori piu' versatili nell'analisi dei finali, anche se non necessariamente piu' forti, rispetto all'attuale Baccala' ... mmmm.gifmmmm.gifmmmm.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 26/11/2021, 11:00:38
Anche Stefan Pohl conferma l'efficacia relativa del nuovo "ottimismo": nella sua graduatoria generale, dove la media degli avversari incontrati e' circa 200 punti piu' debole, l'ultima dev. testata guadagna ben 9 punti, e raggiunge ora i +30 su SF14, mentre in autotest perde un punto contro la versione precedente.

Si conferma ancora una volta che la performance complessiva di un motore dipende anche dagli avversari contro cui viene testato ...

ciao.gifciao.gif
"TB or not TB..."
Giorno: 28/11/2021, 08:08:57
La NCM continua a muoversi in contro tendenza: ormai sta diventando davvero il Bastian Contrario! biggrin.gifbiggrin.gif

La nuova Rete (SF14.120) e le due patch successive, in autotest promettevano qualcosina di interessante ai tempi piu' lunghi (e magari e' davvero cosi'...mmmm.gifmmmm.gif) ma, secondo la NCM avrebbero prodotto un po' di regressione complessiva, anzi la numero 14.121 (Tune NNUE scaling params) sembrerebbe addirittura una fantozziana ca..ta pazzesca! biggrin.gifbiggrin.gif

Ma sara' poi vero? confused.gifconfused.gifconfused.gif

ciao.gifciao.gif
"TB or not TB..."