Forum pubblico/privato: Pubblico
Permessi di scrittura: Utenti registrati
Giorno: 25/04/2021, 20:48:21
In alcuni test, Lc0 ha ancora problemi nel valutare, soprattutto con lo zugzwang link

Era una partita nettamente vinta dallo stoccafisso...
Giorno: 08/05/2021, 00:32:01
Link sponsorizzati
Giorno: 26/04/2021, 11:21:47
Mi attendo importanti novita' dal punto di vista strettamente informativo con il test programmato da Pohl tra la piu' recente versione di Stockfish e la migliore di Lc0, che dovrebbe uscire completato in queste ore

Dovremmo essere sui 30 punti Elo soli a favore di Stockfish, se le mie proiezioni fossero attendibili.

Questi i test passati

Stockfish 210406 bmi2 vs Lc0 0.27.0 68002 : 300 (+ 60,=219,- 21), 56.5 % (+45 Elo)
Stockfish 210226 bmi2 vs Lc0 0.27.0 67741 : 300 (+ 75,=205,- 20), 59.2 % (+65 Elo)
Stockfish 201225 bmi2 vs Lc0 0.26.3 66680 : 300 (+ 60,=223,- 17), 57.2 % (+50 Elo)
Stockfish 201022 bmi2 vs Lc0 0.26.3 J92-260 : 300 (+ 75,=207,- 18), 59.5 % (+67 Elo)
Stockfish 200928 bmi2 vs Lc0 0.26.3rc2 J92-190: 300 (+ 68,=215,- 17), 58.5 % (+60 Elo)
Stockfish 12 bmi2 vs Lc0 0.26.2 J92-130: 300 (+ 74,=203,- 23), 58.5 % (+60 Elo)
SF 200823 82215d0fd0df vs Lc0 0.26.1 t60-4619: 300 (+ 85,=199,- 16), 61.5 % (+82 Elo)
SF 200810 112bb1c8cdb5 vs Lc0 0.26.1 LS 15: 300 (+ 78,=196,- 26), 58.7 % (+62 Elo)
Giorno: 26/04/2021, 11:29:29
Comprendo ad ogni modo le frustrazioni dei programmatori di Stockfish, a cui va il mio plauso di incoraggiamento. Essi debbono faticare tremendamente per guadagnare appena qualche punto Elo e, a loro sconforto, il programma da un paio di mesi non ne sta assolutamente piu' guadagnando. Dopo la rivoluzione NNUEE ogni piccolo progresso e' meritevole del nostro piu' ampio apprezzamento per lo sforzo retrostante di cui possiamo solo immaginare la difficolta' di programmazione.

A differenza di Stockfish che faticosamente arranca, Leela aggiunge punti su punti senza fatica alcuna.

E' come se uno che fa fatica su un sentiero con una MTB muscolare venisse superato da un altro con la E-MTB, che pero' utilizza la modalita' Eco e non quella Turbo, cosi' da progredire quasi impercettibilmente.

L'aspetto straordinario di Leela e' il suo progredire metodicamente, senza dar mai dimostrazione di progressi enormi come quelli avvenuti con le tecniche NNUEE. I suoi progressi diventano visibili solo quando si paragonano le nuove varianti su dei match in modalita' TECE bonus" con delle versioni di programmi tradizionali con cui in precedenza perdeva.

Esempio il match giocato tra Leela e la versione classica di Stockfish senza NNUEE, risoltosi in un match davvero a senso unico quando appena pochi mesi prima Leela aveva perso nettamente la finale SUFI.
Giorno: 28/04/2021, 21:57:12
Alla fine la Rete 68695 non si e' rivelata affatto migliore della piu' vecchia 68002, almeno a giudicare dall'esito della sfida contro SF nei test di Pohl.

I 21 punti di vantaggio della nuova Rete nella lista di Stefan delle migliori versioni di Lc0 potrebbero non essere altro che rumore statistico, e in effetti nel suo campione le differenze misurate sono ancora all'interno delle bande d'errore.

Il problema, purtroppo, e' sempre lo stesso: per evidenziare piccoli miglioramenti, anche 1000 partite potrebbero non essere sufficienti dho.gif

Lo stesso accade per le dev di SF nei test della NCM: qui addirittura test sulle 20000 partite mostrano oscillazioni fino a 10 punti e piu' fra una dev e quella immediatamente successiva, differenze che non stanno assolutamente ne' in cielo ne' in terra ...

ciao.gifciao.gif
"TB or not TB..."
Giorno: 29/04/2021, 09:45:11
Forse dobbiamo prendere atto del fatto che, dopo il gran balzo in avanti dei motori a GPU e nnue, ora ci sara' un periodo di calma piatta...
Lo trovo pure normale...
Giorno: 29/04/2021, 19:37:35
Lo credo anch'io.

L'incremento nella forza di gioco dei due motori al top in quest'ultimo anno e' stato davvero sensazionale, e nel caso di SF si e' verificata un'accelerazione incredibile nel giro di due soli mesi.

Non vorrei pero' che l'avvento dell'NNUE fosse solo il canto del cigno per il Baccala'.

Credo sia stato un errore abbandonare completamente tutto il lavoro di sviluppo sulla versione classica, che stava fornendo progressi decisamente piu' lenti, ma con una progressione ancora abbastanza graduale.

Con le enormi risorse a disposizione del Team dei tester di SF si sarebbe potuto ripartirle equamente, procedendo su due binari paralleli e prevedendo degli scambi periodici fra le due carreggiate, in maniera tale da controllare separatamente i progressi dell'uno e dell'altro approccio e trasferire al meglio le strategie di ricerca classiche con le migliori Reti NNUE. Magari sarebbe stato tempo ben speso e avrebbe dato ai programmatori stimoli maggiori a portare avanti il loro lavoro ... mmmm.gifmmmm.gifmmmm.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 30/04/2021, 10:03:51
D'accordo sull'evitare di porre troppa enfasi su miglioramenti di LC0 di qualche punto che poi non vengono confermati dai test di Pohl.

Tuttavia l'ultimo test su aperture SUFI effettuato su 76 partite si e' chiuso in parita', nonostante il vantaggio di Stockish di disporre di un time management nettamente superiore e di giocare in condizione di tempi ridotti di 1/4 rispetto alla Superfinal, condizione che l'avvantaggia di molto rispetto a Leela. E'sufficiente osservare il distacco nei test ripetuti su ccc.computerchess a 60 secondi per capire che Stockfish e' nettamente ancora il piu' forte quando non si gioca sull'hardware TCEC o simili.

Vogliamo proprio dirla tutta ?

I miglioramenti di Stockfish negli ultimi tempi ci sono stati e ci saranno ancora, ma riguarderanno principalmente il cd. STC, cioe' tempi di riflessioni short, non piu' tanto l'LTC (dove "L" sta per long).

Ovvero, i miglioramenti introdotti dai programmatori di recente producono ricerche piu' veloci nell'esplorazione dell'albero varianti che comunque vengono trovati ugualmente con l'hardware monstre usato nel TCEC.

La mission attuale dei programmatori di Stockfish e' volta a renderlo piu' veloce e quindi piu' forte sugli hardware comuni, non tanto a renderlo piu' forte nella modalita' analisi, sebbene dei miglioramenti piccolissimi possano emergere spontaneamente anche in modalita' analisi per aver introdotto una marea di semplificazioni e di nuove idee.

Purtroppo se non emergono nuove idee sensazionali come l'NNUEE, l'impressione e' che si cerchi di levare gocce ad un limone assai spremuto :)
Giorno: 30/04/2021, 16:49:19
Proprio cosi'! dho.gifdho.gif

Mi auguro di essere smentito al piu' presto da una ventata di nuovi approcci rivoluzionari ai motori ma, al momento, l'unica speranza sembra rivolta piu' ad eventuali miglioramenti nell'hardware che nel software.

Ma quanti anni credete che dovranno trascorrere affinche' anche un comune mortale possa disporre di macchine con potenze di calcolo paragonabili a quelle attuali del TCEC senza doversi impegnare tutto il proprio patrimonio?

Dove sei finita, vecchia Legge di Moore? biggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 01/05/2021, 09:45:37
Ho molte speranze nella sibillina dichiarazione che appare sul sito di Stock, dove annunciano che i due team di programmatori (di Stock e di Leela), hanno unito le forze per fare un nuovo motore.
Se e' cosi', ci vorra' del tempo, ma dovrebbe essere qualcosa di fenomenale... Immagino quanto sara' imbattibile l nuovo Fat Fritz 3! biggrin.gif
Sono una carota in cerca di sè stessa...
Giorno: 01/05/2021, 09:56:09
Beh, se per imbattibile si intende nei confronti degli umani i top engines attuali gia' lo sono...
Se si intende nei confronti degli altri motori, penso sara' temporaneo basta studiarsi i sorgenti e poi gli altri sforneranno motori simili in tempi brevi...
Se si intende acquisire la capacita' strategica umana penso dovremo aspettare FatFritz 12 zizi.gif

L'unica mia paura e' che saltino il fosso e rendano commerciale il nuovo motore, ma lo trovo improbabile