Forum pubblico/privato: Pubblico
Permessi di scrittura: Utenti registrati
Giorno: 20/10/2019, 17:24:48
Questi motori NN non usano gpu, giusto?
Giorno: 30/11/2020, 03:40:18
Link sponsorizzati
Giorno: 05/11/2019, 14:09:39
13 patch sono state aggiunte nelle ultime 2 settimane, molte delle quali di semplificazione del codice, e con l'ultima dev rilasciata ("Rook PSQT Tuned") i test della NCM hanno fatto registrare il nuovo record assoluto sfiorando i +240 su SF7 (+239,90 per l'esattezza), con margine di indeterminazione di poco meno di 4 punti sulle solite 20000 partite.

Purtroppo il dato non trova conferma nel test ufficiale di regressione, che al momento è a poco più di 18500 delle 40000 partite previste, dove non sembra esserci alcun miglioramento significativo rispetto a quello precedente. mmmm.gifmmmm.gifmmmm.gif

Per SF11 ci sarà forse da attendere qualche altro mesetto, ma alla fin fine sarà pur sempre "meglio tardi che mai" ... biggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 09/11/2019, 00:03:24
Terminati i test ufficiali che non mostrano nessun sostanziale progresso nell'ultimo mese, e forse addirittura una lieve regressione rispetto a 2 settimane fa (ma siamo proprio ai limiti delle barre di errore): +42.20 su 1 thread e +52.90 su 8 thread rispetto a SF10.

Per fortuna ci sono i nuovi super processori amd Ryzen di terza generazione, che potrebbero far volare il Baccalà sempre più in alto, ma forse è il caso di riparlarne a proposito della guerra dei core ...

ciao.gifciao.gif
"TB or not TB..."
Giorno: 24/11/2019, 15:10:44
Finalmente, dopo ben 35 giorni, un altro piccolo passo in avanti verso il rilascio di quello che sarà lo SF11.

L'ultimo test di regressione della patch del 21 Novembre (quella di Vizvezdenec "Do lmr for more captures") ha fatto registrare +46,56 su SF10 con un margine di errore di appena un punto e mezzo, in virtù della decisione di aumentare il campione a ben 60000 partite.

E su 8 threads (test ancora in corso) si dovrebbero alla fine superare i +55.

SF10 venne rilasciato giusto un anno fa, e a questo punto direi proprio che siamo a una versione etichettabile come "SF10.9", in attesa del piccolo incremento finale che dovrebbe finalmente giustificare il rilasio ufficiale ...

ciao.gifciao.gif
"TB or not TB..."
Giorno: 24/11/2019, 15:10:45
Per errore avevo postato due volte lo stesso testo, così ho deciso di "automoderarmi" ... biggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 24/11/2019, 16:27:47
Qualche considerazione...
Nonostante tutto, sembra quindi che lo stoccafisso (e derivati) abbia ancora margini di miglioramento...
Quindi è una gara a chi migliora più velocemente, i motori classici o le reti di Lc0/Allie...
A quanto mi pare di capire, con l'inevitabile avanzamento della tecnologia e della potenza di CPU e GPU, saranno i motori che utilizzano quest'ultime ad avere maggiori miglioramenti...
Poi essendo motori "nuovi" magari si escogiteranno nuovi algoritmi per migliorarli e fare un vero e proprio balzo in avanti
Ma è da vedere se e quando succederà
Infine ci sono i motori NN tipo Sugar-NN e simili ma non so bene come funzionano, cmq anche loro cresceranno...
Tutto dipende da chi migliorerà più velocemente
Saranno i motori alla Lc0 ?
A mio avviso sono i più probabili, ma non ne sono assolutamente certo
Giorno: 24/11/2019, 19:44:10
Sì, Masticone, sarà davvero una sfida all'ultimo sangue (o all'ultima patch, se SF continuerà a migliorare, sia pur lentamente, e se i motori NN si troveranno realmente in prossimità dell'asintoto mmmm.gifmmmm.gifmmmm.gif).

Sarà interessante vedere nei prossimi mesi e nei prossimi anni chi riuscirà a spuntarla, sempre che un nuovo motore "ibrido" non riesca a metterci lo zampino, facendo di colpo diventare obsoleta tutta la concorrenza ... zizi.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 08/01/2020, 18:56:13
Finalmente ci siamo; il rilascio di SF11 sembra stavolta davvero dietro l'angolo.

La piccola manciata di punti che occorreva per superare la fatidica "quota 50" è stata raggiunta grazie alle patch rilasciate ieri e il test di regressione su un solo core sta per concludersi (mancano poco più di un centinaio di partite su un totale di ben 60000) con un +51,5 ± 1,5 su SF10, mentre quello a 8 threads ha fatto registrare +58,15 su un campione di 40000 partite, e anche l'indipendente NCM conferma il progresso, visto che l'ultima dev strappa il primato con +244,59 su SF7 in un campione di 20000 partite.

Negli ultimi 14 mesi la progressione media è stata di circa 3,5 punti/mese, in calo rispetto ai circa 5 a cui ci eravamo abituati qualche annetto fa, ma ancora in grado di fornire risultati apprezzabili nel lungo periodo.

Saranno sufficienti questi lenti miglioramenti a rintuzzare l'impetuosa avanzata di Leela & Co?
Il TCEC 17, già iniziato col torneo di qualificazione dei motori della fascia più bassa, potrà forse aiutarci a tastare meglio la situazione.

Restiamo poi in attesa degli ulteriori sviluppi che senz'altro arriveranno nel corso dei prossimi mesi ...

ciao.gifciao.gif
"TB or not TB..."
Giorno: 09/01/2020, 20:02:39
Il Team si sta preparando al rilascio ufficiale di SF11 e la dev di oggi si è limitata ad aggiornare la lista degli autori e dei contribuenti di tempo macchina.

Una patch più "non funzionale" di così non si sarebbe potuta immaginare, eppure l'immancabile test della NCM ha prodotto un calo di 5,34 punti Elo (equivalente in pratica al duro lavoro di un mese e mezzo da parte degli sviluppatori) rispetto a quella di 2 giorni fa, che è praticamente la stessa cosa! dho.gif

Ciò dimostra per l'ennesima volta che, anche su campioni di ben 20000 partite, oscillazioni di 5 - 6 punti Elo possono essere soltanto rumore statistico: una corsa particolarmente "fortunata" seguita da una particolarmente "sfortunata" potrebbe far pensare a una patch davvero fallimentare, mentre nel caso contrario potrebbe sembrare fenomenale; eppure magari non è cambiato assolutamente nulla, proprio come nella patch di oggi! dho.gifdho.gifdho.gif

E se ciò può accadere su ben 20000 partite, pensate un po' a cosa potrebbe capitare con un campione statistico 100 - 1000 volte più ridotto ... senzasperanza.gifsenzasperanza.gifsenzasperanza.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 09/01/2020, 20:33:46
Ok, ma chi ha il tempo di fare 20000 partite biggrin.gif
Quindi alla fine devi fidarti di chi le fa, con un Hw diverso dal tuo e tempi di riflessione diversi da quelli che usi tu, per cui alla fine se anche fai 2 milioni di partite...
... a che servono ?
Specie se confronti una Cpu-engine con una Gpu-engine...

Magari va bene x versioni diverse dello stesso motore, ma alla domanda chi più forte tra Stockfish e "famiglia" e Lc0/Allie e famiglia rispondi con un bel "boh!"

L'unica soluzione che mi viene in mente è usare per gli engines le stesse regole degli umani per tornei generici e tornei dei candidati senza tener conto del RL
Cmq per me l'hw di un CCCC o di un TCEC deve essere quello di un utente medio, non cose assurde...
Finché non si fa così e si toglie il RL io considero questi tornei molto interessanti ma di nessun valore quando si confronta un motore-cpu con uno gpu