Forum pubblico/privato: Pubblico
Permessi di scrittura: Utenti registrati
Giorno: 15/06/2019, 20:47:28
ultmo baccala'
http://abrok.eu/stockfish/
Molto probabilmente l'avete gia' notato. Uscito ieri. Domani lo faccio girare anche se non sono un grande estimatore dello stoccafisso. Ne apprezzo solo la forza di gioco. Mi potete spiegare quale versione del suddetto sta vincendo (o ha vinto?) al TCEC? E qual è quello che ad oggi ha l'elo maggiore?
Buona serata
Giorno: 16/07/2019, 18:42:45
Link sponsorizzati
Giorno: 15/06/2019, 22:54:22
In teoria l'ultima versione rilasciata dovrebbe sempre contenere un miglioramento nel codice del programma e quindi essere, per definizione, "la migliore".

In pratica però non è affatto così, e, come mostrano anche i test indipendenti della

NCM

negli ultimi 4 mesi, i progressi del Baccalà sono risultati praticamente nulli. dho.gif

Purtroppo la barra di errore delle misure NCM è di 4 punti Elo e non si riesce a capire se il grafico che ottengono è solo rumore di fondo con oscillazioni casuali attorno a un valor medio ormai irrimediabilmente piatto, o se in questi 4 mesi vi sia stata ancora qualche buona patch, che avrebbe potuto far crescere ulteriormente il motore, ma il cui guadagno è stato però completamente vanificato dalle tantissime patch di semplificazione del codice, che essendo spesso considerate "non funzionali", vengono fatte passare senza controlli particolarmente rigorosi. dho.gif

Sarebbe il caso che quelli della NCM si decidessero a passare da 20000 a 40000 partite di test e a utilizzare come motore di riferimento una versione più aggiornata di SF7.

Ciò consentirebbe di dimezzare le barre d'errore e potrebbe portare ad identificare in maniera più chiara eventuali patch di regressione ...

ciao.gifciao.gif
"TB or not TB..."
Giorno: 16/06/2019, 11:48:35
Ciao Luigi,
grazie per le delucidazioni. Tra gli ultimi 30 engines del sito che mi hai indicato il 20190515-0923 risulta il piu' forte in termini di elo. Fermo restando che il margine di errore si aggira intorno al 4% per tutti. Si puo' saricare? E, se si, dove? Te lo chiedo perché vorrei testarlo col mio pc, che e' potente ma non certo come quelli del NCM.
Giorno: 16/06/2019, 13:27:33
La versione a cui ti riferisci dovrebbe essere l'ultima delle 10 rilasciate il 15 Maggio:

"Author: xoto 10
Date: Wed May 15 11:23:07 2019 +0200
Timestamp 1557912187
Update failedHighCnt rule # 2063"

La trovi verso la parte bassa della prima pagina del sito

Abrok

che tu stesso hai già linkato ...

ciao.gifciao.gif
"TB or not TB..."
Giorno: 16/06/2019, 14:03:30
Cmq pure qui (link) puoi scaricare lo stoccafisso e le sue varianti
Giorno: 18/06/2019, 10:33:21
Grazie ragazzi, siete gentilissimi. Ieri ho fatto una piccola ricerca perche' i test di NCM e quelli di Abrok hanno parametri temporali differenti. Dopo una piccola ricerca sono arrivato alla variante piu' performannte degli ultimi 4 mesi secondo NCM:

Author: Stefan Geschwentner
Date: Sun May 5 23:18:17 2019 +0200
Timestamp: 1557091097

sito Abrok, ovviamente
Giorno: 18/06/2019, 19:54:08
Un'altra versione che, secondo l'autorevole Stefan Pohl, si comportò benissimo, fu quella del 10 Marzo 2019.

Link

Il problema è che, in corrispondenza di tale data, il sito Abrok riporta due versioni, la prima di xoto10 e la seconda di protonspring.

Stefan ha sempre dichiarato che, quando in una stessa giornata vengono rilasciate più versioni, quella che va a testare è sempre l'ultima, per cui dovrebbe trattarsi di quella di protonspring, anche se è una semplice modifica non funzionale. mmmm.gifmmmm.gifmmmm.gif

Questa versione fece registrare un notevolissimo +31 su SF10 in un campione di 5000 partite, con barra di indeterminazione pari a 8 punti.

Sarebbe davvero un bel risultato se il dato venisse confermato da qualche altro tester, ma ormai, fra decine e decine di versioni più recenti, chi si prenderebbe di nuovo la briga di testarne una di oltre 3 mesi fa?

E se poi davvero si rivelasse migliore delle ultime dev, chi si prenderebbe la responsabilità di cancellare 3 mesi di sviluppo, seppure inconcludenti? dho.gif biggrin.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 19/06/2019, 09:33:04
Ho sbagliato!! Ho fatto male conti e la versione che ho postato sopra non e' quella che cercavo. Chiedo venia.
Aveva ragione Luigi335, e' quella di xoto. Grazie mille per le preziose informazioni. In effetti non ha molto senso testare con un pc normale versioni testate con multiprocessori, ma il mio modesto scopo e' quello di trovare la combinazione(engine+book) che prevalga su tutte facendola giocare 100 o 200 games lampo (3,5,10 min) con un pc "ordinario" come il mio. Processore Xeon 3300/3700 e 16 di ram. Non mi eì piaciuto il test che ho letto che aveva il mio stesso scopo ma aveva Hodini come pietra di paragone e con l'elo dichiarato dalla Chessbase che usa apparati hardware strtosferici. Io come pietra di paragone prendo Sockfish 10, quello che scaricano tutti e l'elo manco0 lo guardo nei miei piccoli test. Guardo solo vittorie, sconfitte e pareggi.
Giorno: 19/06/2019, 10:14:30
Esatto Eclex, la pensiamo allo stesso modo biggrin.gif

Se vuoi un motore veramente forte cerca Cfish al sito che ho linkato in questo post...
Usa la libreria polyglot e mi pare veramente forte, lo uso come pietra di paragone per testare le reti di Lc0
Giorno: 19/06/2019, 10:23:05
Ciao Masticone, ache a me interessano molto gli engines nn (Lc0, ma ne nasceranno altri), ma per ora voglio capire qual'e' l'engine algoritmico da battere. Tu dici CFish? Io trovo che amsbrainfish, quello indicato da te, sia il piu' forte. Ma sono solo all'inizio.
PS: Masticone ma dov'e' il link del Cfish che usi tu?