Forum pubblico/privato: Pubblico
Permessi di scrittura: Utenti registrati
Giorno: 23/05/2017, 19:08:13
Superate le 500 partite, lo score di K11 contro i due motori più forti sta migliorando sensibilmente.

La doppia batosta iniziale sembrerebbe solo un incidente statistico, visto che il motore sta pian piano recuperando.

Contro SF8 è ancora sotto per 16 a 22, ma conto H5 il divario è stato completamente colmato.

La performance complessiva (sicuramente sottostimata) è di 3265 punti; con i 20 - 30 punti che gli verranno "restituiti" alla fine (la IPON funziona così ... biggrin.gifbiggrin.gif) potrebbe anche riuscire a strappare la prima posizione al Baccalà ... mmmm.gifmmmm.gifmmmm.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 18/08/2017, 12:38:39
Giorno: 24/05/2017, 08:01:01
Superati i due terzi del test, la situazione sembra ormai chiaramente delineata:

K1101

Komodo 11.01 - Stockfish 8 (3293) 64.0 - 83.0 43.54% Perf=3248
Komodo 11.01 - Houdini 5.01 (3281) 76.0 - 72.0 51.35% Perf=3290
Komodo 11.01 - Shredder 13 (3120) 101.0 - 46.0 68.71% Perf=3256
Komodo 11.01 - Fizbo 1.9 (3065) 110.5 - 36.5 75.17% Perf=3257
Komodo 11.01 - Gull 3 (3060) 122.0 - 25.0 82.99% Perf=3335
Komodo 11.01 - Ginkgo 1.9u (3043) 120.0 - 28.0 81.08% Perf=3295
Komodo 11.01 - Jonny 8.00 (3027) 120.0 - 27.0 81.63% Perf=3286
Komodo 11.01 - Andscacs 0.90 (3027) 122.5 - 24.5 83.33% Perf=3306
Komodo 11.01 - Equinox 3.30 (3004) 121.5 - 23.5 83.79% Perf=3289
Komodo 11.01 - Chiron 4 (3003) 127.5 - 19.5 86.73% Perf=3329
Komodo 11.01 - Fritz 15 (2995) 125.5 - 21.5 85.37% Perf=3301
Komodo 11.01 - Critter 1.6a (2993) 127.5 - 18.5 87.33% Perf=3328
Komodo 11.01 - Hannibal 1.7 (2962) 126.5 - 21.5 85.47% Perf=3269
Komodo 11.01 - Booot 6.1 (2943) 130.5 - 16.5 88.78% Perf=3302
Komodo 11.01 - Protector 1.9.0 (2929) 135.5 - 11.5 92.18% Perf=3357
1730.5 - 474.5 78.48% Perf=3273

2205 out of 3300 games played

Il nuovo Komodo le prende solo da SF8 ma, strapazzando tutti gli altri "motori minori", alla fine sarà quasi sicuramente primo nella IPON ... biggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 24/05/2017, 17:15:56
Sono appena terminate le 3300 partite di test per la IPON coi seguenti risultati finali:

K1101

Komodo 11.01 - Stockfish 8 (3293) 97.0 - 123.0 44.09% Perf=3252
Komodo 11.01 - Houdini 5.01 (3281) 114.0 - 106.0 51.82% Perf=3293
Komodo 11.01 - Shredder 13 (3120) 154.0 - 66.0 70.00% Perf=3267
Komodo 11.01 - Fizbo 1.9 (3065) 168.5 - 51.5 76.59% Perf=3270
Komodo 11.01 - Gull 3 (3060) 177.0 - 43.0 80.45% Perf=3305
Komodo 11.01 - Ginkgo 1.9u (3043) 178.0 - 42.0 80.91% Perf=3293
Komodo 11.01 - Jonny 8.00 (3027) 182.5 - 37.5 82.95% Perf=3301
Komodo 11.01 - Andscacs 0.90 (3027) 188.0 - 32.0 85.45% Perf=3334
Komodo 11.01 - Equinox 3.30 (3004) 185.0 - 35.0 84.09% Perf=3293
Komodo 11.01 - Chiron 4 (3003) 189.5 - 30.5 86.14% Perf=3320
Komodo 11.01 - Fritz 15 (2995) 190.5 - 29.5 86.59% Perf=3319
Komodo 11.01 - Critter 1.6a (2993) 194.0 - 26.0 88.18% Perf=3342
Komodo 11.01 - Hannibal 1.7 (2962) 186.0 - 34.0 84.55% Perf=3257
Komodo 11.01 - Booot 6.1 (2943) 192.5 - 27.5 87.50% Perf=3281
Komodo 11.01 - Protector 1.9.0 (2929) 200.5 - 19.5 91.14% Perf=3333
2597.0 - 703.0 78.70% Perf=3276

3300 out of 3300 games played

La reale performance è in realtà più alta di quella indicata di 21 punti, che verranno sicuramente "restituiti" nel momento dell'inserimento in graduatoria, e probabilmente anche con gli "interessi". biggrin.gifbiggrin.gif

Il Lucertolone sarà così il nuovo leader della graduatoria, e la scelta di adottare un contempt elevato ha dato ancora una volta i suoi frutti.

Ma, come ho già detto e ripetuto fino alla nausea, non lasciamoci ingannare dal dato finale. Il risultato della sfida col Baccalà parla chiaro: nel confronto diretto il Lucertolone è sotto di una quarantina di punti. Se poi teniamo conto che, da Novembre ad oggi SF ha accumulato un ulteriore miglioramento di 25-30 punti, ci rendiamo conto che il Baccalà può contare su un vantaggio pari ad almeno un anno di sviluppo.

E poi, come dicevamo, c'è anche asmFish.

Sulla chat della TCEC il tester ssj100 sta conducendo una sfida su 10000 partite fra l'ultima versione del 22 Maggio e quella dello scorso 4 Novembre (la stessa di SF8).
Dopo le prime 4250 partite la nuova versione era in vantaggio di 41 punti (con un margine d'errore di 6), e ricordiamo che asmFish è una ventina di punti più forte di SF ... zizi.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 10/06/2017, 22:45:30
Komodo n1
E alla prima uscita sulla CCRL Komodo 11 conquista il primo posto, superando di 15 p. Elo SF8:
image 1577

Sui tempi lunghi (CCRL 40 min x 40 mos) ora è il motore più forte non solo sulla IPON:

image 1578
Giorno: 11/06/2017, 09:20:58
Solo per dare a Cesare (SF) quel che è di Cesare, negli scontri diretti fra SF8 e K11 per la CCRL 40/40 4CPU i due motori sono in perfetta parità (+2, =16, -2).
Ma un campione di appena 20 partite è del tutto irrilevante, per cui è meglio guardare anche i dati delle altre associazioni a tempi medio-lunghi.

Nella graduatoria generale della CEGT 40/20 K11 è terzo, staccato di 32 punti da SF8, e addirittura 15 punti dietro la versione precedente 10.4
Il campione complessivo è anche qui abbastanza modesto (319 partite), e per avere conclusioni più affidabili bisognerà attendere che superi almeno il migliaio.

Nella FastGMs a 60 minuti a partita, ma su un solo core, K11 è riuscito a strappare a SF8 il primato generale per soli 2 punti, ma ancora una volta, è stato battuto negli scontri diretti per 72,5 a 77,5.

Difficile da interpretare esattamente è invece il dato di Stefan Pohl, nel suo triangolare "permanente" a 20 minuti a partita + 5 secondi a mossa su 4 core fisici.
In questo triangolare, il Baccalà viene sempre sostituito dall'ultima versione di sviluppo di asmFish, mentre Houdini 5 (che ha ormai disputato, complessivamente, oltre 3000 partite) viene preso come motore fisso di riferimento.
Ebbene qui K11 figura all'ultimo posto, 7 punti sotto H5 (la versione precedente 10.4 era invece 10 punti sopra dopo oltre 1200 partite), mentre il distacco da asmFish del 22 Maggio assume valori abissali, essendo addirittura di 103 punti (+43, =70, -9 per asmFish negli scontri diretti), che sono una vera enormità!

Anche qui il campione (243 partite per asm, 244 per K11) è ancora abbastanza modesto, ma l'impressione che si ricava è che, per poter insidiare l'ultimo Baccalà ultra anabolizzato, il Lucertolone abbia ancora tantissima strada da fare ... biggrin.gif mmmm.gifmmmm.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 14/06/2017, 06:19:43
@Luigi: "Nella graduatoria generale della CEGT 40/20 K11 è terzo, staccato di 32 punti da SF8, e addirittura 15 punti dietro la versione precedente 10.4"

Per chi non lo sapesse nella CEGT 40/20 sta per 20 minuti x 40 mosse, la CEGT usa la notazione americana come per le date al contrario di noi.
Così i tornei CEGT 40/120 sono di 2h x 40 mosse e i tornei 40/4 sono di 4 min x 40 mosse.

Quindi le partite della CEGT 40/20 durano esattamente la metà della CCRL 40/40.

Comunque le partite per ora sono pochine, ma se nei prossimi mesi fosse confermata la classificazione ottenuta oggi, non andrebbe proprio bene noncisiamo.gif
Un motore che è annunciato dalla casa fornitrice come almeno + 20 p. elo che in realtà è più debole della versione precedente, non è una cosa seria per un programma commerciale. Sarebbe un vero smacco per la Chessbase che lo vende a 80 Euro... Un'altro flop dopo quello di Fritz 15 da V. Rajlich.
Giorno: 18/06/2017, 19:28:00
Kaufman e Lefler fanno quello che possono, così come Robert Houdart. Ma, per quanto possano "prendere spunto" dagli sviluppi del Baccalà, è difficile per un team formato solo da 1 o 2 persone riuscire a tenere il passo di un motore che, come SF, può contare su decine di tester e programmatori.

La ChessBase metterebbe ben volentieri le grinfie sul Baccalà per farne il prodotto di punta della sua scuderia, ma, purtroppo per lei, e per fortuna per noi, il suo codice è libero, gratuito e, soprattutto "protetto commercialmente". biggrin.gifbiggrin.gif zizi.gifzizi.gif

Tuttavia, anche per il Baccalà non sarà semplice mantenere la sua leadership: nell'ultimo mese ci sono state 2 sole patch funzionali che, come mostrato chiaramente dai test di Nextchessmove, non hanno prodotto alcun incremento significativo nella forza di gioco del motore. dho.gif

Inoltre Houdart o Lefler e Kaufman potrebbero sempre ingaggiare qualcuno (se non riusciranno a farlo loro direttamente) per riscrivere in Assembler i loro motori e recuperare, in tal modo, un'altra ventina di punti sul Baccalà ... mmmm.gifmmmm.gifmmmm.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 21/06/2017, 17:35:56
Il campione di partite di K11 per la CCRL 40/40 a 4 core è salito da 272 a 374 partite, e ciò è bastato a far calare la sua quotazione di 14 punti.
Il nuovo Lucertolone ha ora un solo punto di vantaggio su SF8, ma è leggermente indietro nei pochi scontri diretti (+2, =22, -4).
Il vantaggio sulla versione precedente 10.4 è di soli 7 punti, ben all'interno della barra d'errore.

Anche per la CEGT 40/20 il numero di partite sta crescendo (827), e può iniziarsi a considerare statisticamente significativo.
Qui K11 è terzo, 20 punti dietro K8 e un solo punto sotto K10.4

Non sembrano quindi esserci incrementi tali da giustificare l'acquisto della nuova versione da parte di coloro che già possiedono la 10.4 mentre, rispetto a Komodo 10, uscito esattamente un anno fa, il miglioramento a tempi brevi è quantificabile in una cinquantina di punti, per cui, "l'onore commerciale" della ChessBase sembra essere, almeno stavolta, salvo ... biggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 23/06/2017, 16:24:43
Un'interessante sfida in diretta fra SF dev e K11 è in corso di svolgimento per la fastgm, e può essere seguita al seguente

link

Il tempo di riflessione è di 60 minuti a partita + 15" a mossa, e l'hardware un dual amd Opteron per un totale di 32 core.

Al momento il Baccalà è in netto vantaggio (+16, =67, -5)

ciao.gifciao.gif
"TB or not TB..."
Giorno: 24/06/2017, 23:10:59
Dopo le prime 100 partite delle 150 previste, SF conduce abbastanza nettamente per 19 vittorie a 6 e 75 patte.

Se sulla superiorità complessiva del Baccalà non sembrano esserci dubbi, c'è però da lamentare ancora una volta il fatto che il motore non riesca a valutare correttamente la potenza dei pedoni passati e sostenuti.

Nella 100ma partita, la sesta vittoria di Komodo


You need Javascript enabled to view it.










la condotta in apertura di SF è stata da vero suicida. All'11ma mossa avrebbe dovuto giocare 11...exd5 e invece con 11...Cxd4 ha regalato a Komodo la possibilità di piazzare un pedone sostenuto in sesta senza colpo ferire! dho.gif

Il Team di SF dovrebbe trarre insegnamento dalle continue lezioni strategiche che gli impartisce il Lucertolone di Kaufman ... biggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."