Forum pubblico/privato: Pubblico
Permessi di scrittura: Utenti registrati
Giorno: 14/07/2014, 12:57:17
Chi sale e chi scende...
Komodo non è compatibile con la modalità Fischer Random Chess, e perciò non partecipa all'edizione estiva del TCEC6, ma a quanto pare i suoi autori stanno lavorando davvero sodo per poter battere SF e chiunque altro al prossimo TCEC7, che si svolgerà in autunno col regolamento "ortodosso".

Le nuove versioni di sviluppo sono state consegnate ai responsabili della CCRL 40/40 e stanno dando ottimi risultati.

La prima sfida contro H4 si è conclusa con la vittoria del Drago per +6, =17, -4

Anche il match di rivincita, dopo che Houdini era riuscito a portarsi sul 5 a 3, è stato deciso da tre vittorie consecutive di Komodo, che ha ribaltato il risultato, aggiudicandoselo con la prestazione finale di +6, =14, -5

È ora in corso la prima sfida fra la versione 1252 (subito aggiornata dalla 1257 dopo le prime due partite) e l'ultima versione di sviluppo dell'11 Luglio di SF.
Dopo tre patte iniziali, Komodo è passato in vantaggio vincendo di Nero la quarta partita.

Per saperne di più...

Pare proprio che Mark Lefer e Larry Kaufman stiano mettendocela tutta per onorare al meglio il grande lavoro fatto in precedenza da Don Dailey!

ciao.gifciao.gif
"TB or not TB..."
Giorno: 07/08/2020, 23:31:11
Link sponsorizzati
Giorno: 15/07/2014, 12:54:48
La sfida fra le ultime versioni di SF e Komodo si sta rivelando molto equilibrata e interessante.

Graham Banks aggiorna frequentemente la situazione sul sito linkato nel post precedente (salvo ovviamente quando in Nuova Zelanda è notte fonda...), e le partite possono essere seguite in diretta anche su:

Cumnor Chess

Dopo le prime 19 i motori sono sul 2 a 2, senza contare le 15 patte, alcune delle quali davvero combattute.

I tempi di riflessione sono di 29 minuti per 40 mosse, che secondo me è il giusto compromesso fra spettacolarità e qualità di gioco; al confronto quelle del TCEC somigliano a delle vere maratone...

Intanto nell'ultima versione di sviluppo di SF, rilasciata poche ore fa, il contempt è stato innalzato di default al valore 20; dalle verifiche fatte questa scelta non dovrebbe penalizzare il motore contro gli avversari più forti, ma fargli guadagnare qualcosina contro quelli più deboli.
In due test paralleli su 40000 partite contro il vecchio SF3, la nuova master ha guadagnato 6 punti rispetto alla versione con contempt 0 mmmm.gifmmmm.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 17/07/2014, 11:30:50
Komodo batte SF 6 a 4
Dopo un'estenuante maratona di ben 45 partite, l'ultima versione sperimentale (1257) di Komodo si aggiudica la prima sfida contro SF con un

+6, =35, -4

È ora iniziato il match di rivincita, che si annuncia altrettanto combattuto.

È bene restare ancora coi piedi per terra, perché un centinaio di partite (quelle delle due sfide con H4 e la prima con SF) sono poche per una solida base statistica, l'hardware e i tempi di riflessione utilizzati non sono certo a livello di quelli del TCEC, eccetera. Tuttavia fa una certa impressione vedere SF relegato di nuovo al ruolo di inseguitore dopo mesi di indiscussi trionfi.
E se il buon giorno si vede dal mattino, Komodo sembra decisamente in ascesa; nel caso in cui dovesse essere confermato un sensibile incremento rispetto alla versione 7 i suoi autori potrebbero anche decidere di battere il ferro finché è caldo e rilasciare la nuova versione commerciale addirittura entro l'inizio di Settembre (anticipando così anche l'eventuale uscita di Houdini 5), in concomitanza con l'inizio e non con la fine del TCEC7.

Se poi dovessero vincere anche quello, ci sarà sempre tempo per un'ulteriore versione successiva...biggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 21/07/2014, 15:47:27
Stockfish batte nella sfida di ritorno Komodo per 6-5
Il drago sebbene abbia mostrato un gioco brillante e originale ha ancora qualche difetto che non gli consente di diventare il numero uno. COmunque ottimo il lavoro dei due sviluppatori e sicuramente Komodo è uno dei favoriti del prossimo TCEC. Personalmente lo torvo un ottimo motore, putroppo ha bisogno di un harware molto potente per sfoderare tutta la sua forza al contrario di stockfish e houdini che sono ottimi motori anche su hardware medi
Giorno: 21/07/2014, 18:54:29
In realtà l'hardware di Graham Banks non è proprio il massimo: si tratta sì di uno Xeon ad 8 core fisici, ma è un modello di diversi anni fa, e come potenza non può assolutamente competere con un buon i7 a 4 core di ultima generazione.

Nell'arco delle 78 partite del doppio match con SF la performance complessiva di Komodo è stata di

+11, =57, -10

L'indeterminazione statistica è di oltre 50 punti, cosicché non possiamo affermare nulla con certezza, ma si ha l'impressione che i due motori siano ora molto più vicini di quanto visto al TCEC appena qualche mese fa.

Se il dato provvisorio che parla di un sostanziale equilibrio sarà confermato, davvero non so come abbiano potuto migliorare la loro creatura così rapidamente. mmmm.gifmmmm.gifmmmm.gif

Credo che ci sia materiale più che sufficiente per imbastire un'intera puntata di un programma di alta divulgazione scientifica come "Voyager" o "Misteri" biggrin.gifbiggrin.gif

Di sicuro i loro conduttori ci mostrerebbero le prove che le menti di Lefer e Kaufman sono cadute sotto il controllo di un'Intelligenza Aliena, che li ha illuminati sulla Verità Scacchistica...biggrin.gifbiggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 21/07/2014, 21:54:06
Comunque KOmodo nella tattica ha ancora molto da imparare, ho visto molte posizioni dove stochfish gli da molta polvere. A proposito ques'tultimo sta superando il mago houdini nella tattica. Sarebbe interessante provare una delle ultime versioni con delle liste di mosse tattica da trovare. Qualcuno sa se qualcuno lo ha già fatto?
Giorno: 22/07/2014, 02:17:35
Ecco una posizione dove stockfish vede la mossa vincente g4 mentre komodo da sostanziale parità


You need Javascript enabled to view it.








Giorno: 22/07/2014, 07:25:25
abcdefgh
8
8
7
7
6
6
5
5
4
4
3
3
2
2
1
1
abcdefgh
Fen: r4rk1/p1q2ppp/1pb1p3/2ppPnB1/P1nP4/2PB1N2/2P2PPP/R1Q1R1K1 w - - 0 1

Balor propone 17.Af6. Probabilmente non è forte come 17.g4, ma penso che sia ugualmente vincente.
Sono una carota in cerca di sè stessa...
Giorno: 22/07/2014, 10:17:57
Beh! Se Komodo tatticamente valesse quanto Houdini, sarebbe un motore quasi perfetto! Purtroppo non si può avere tutto! biggrin.gifbiggrin.gif

Per quanto riguarda SF, è forte, sì, ma secondo me nella tattica pura non è all'altezza di Houdini 3 e 4, e in molte posizioni nemmeno del vecchio Spark 1.0 (che nella ricerca dei matti e nei tatticismi con centinaia di diramazioni ha ben poco da invidiare al Mago).

Le ultime versioni di sviluppo, pur migliorando qualcosina, non hanno cambiato di molto la situazione.
Gli oltre 150 punti guadagnati in quest'ultimo anno e mezzo rispetto alla versione 2.3.1 sono stati conseguiti soprattutto affinando le conoscenze strategiche del motore e rendendolo molto più aggressivo e selettivo.
Ma dal punto di vista prettamente tattico, l'esplorazione dell'albero delle varianti e gli algoritmi di taglio sono rimasti sostanzialmente quelli del "Padre di tutti gli stoccafissi", e cioè Glaurung, da cui Marco Costalba e Joona Kiski iniziarono i loro esperimenti quasi 6 anni fa.
All'epoca questo programma mi sorprese moltissimo per la sua grande forza tattica, ma da allora sono un po' vissuti sugli allori.

Volendo cercare il pelo nell'uovo, si potrebbe dire che i limiti tattici di SF si trovano principalmente nell'algoritmo di ricerca dei matti, che non è all'altezza di tanti altri programmi.
Può darsi che ciò sia dovuto al modo in cui il motore gestisce la "null move", con enormi difficoltà nelle posizioni di zugzwang.

Inoltre, l'estrema selettività degli algoritmi di taglio, fa sì che nelle posizioni in cui esistono due o tre mosse buone, il motore si concentri solo sulla prima che incontra, mancando spesso completamente altre ancora più forti. A livello pratico ciò non ha grosse conseguenze: di solito la mossa scelta dal motore si rivela più che sufficiente per la vittoria; se però lo si utilizza per verificare uno studio o una combinazione famosa, potrebbe non trovare la soluzione artisticamente più spettacolare.

Se riuscirò a trovare un po' di tempo libero illustrerò con qualche esempio pratico, tratto dalla mia raccolta di test tattici, quanto sopra detto.

I miei risultati sono comunque in buon accordo con la lista pubblicata l'anno scorso da un utente di vecchia data del Rybka Forum, Werewolf, che si basa su una serie di 100 posizioni, purtroppo però mai elencate in dettaglio (o almeno credo...mmmm.gif).

link

(per avere la graduatoria bisogna scaricare il file TRes.xlsx dal primo post del topic linkato)

L'ultima versione testata di SF, quella del 25 Novembre 2013, aveva fatto un buon passo in avanti rispetto alle versioni precedenti, ma era ancora ben al di sotto di H3 e H4, e da allora non credo che sia cambiato granchè...mmmm.gifmmmm.gifmmmm.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 22/07/2014, 12:19:31
Ecco una posizione, tratta dalla partita per corrispondenza Riccio Donnefeld, che esemplifica molto bene quanto detto nel post precedente:

abcdefgh
8
8
7
7
6
6
5
5
4
4
3
3
2
2
1
1
abcdefgh
Fen: r1r3k1/1b1nbp1p/p3p1p1/q2pP3/Np3PP1/1P1BB2R/P1PQ3P/2KR4 w - - 0 1


La conclusione di Riccio, trovata solo dalle ultime versioni di Houdini e da Spark 1.0, si basa su uno spettacolare sacrificio che sgombera la diagonale c1-h6 all'azione della Donna Bianca:

1.Ab6!!, Cxb6 2.f5!, ecc.

La prudente continuazione suggerita da SF, 1.R1!?, non sarà altrettanto brillante, ma l'appuntamento con la spinta in f5 è solo rimandato, e alla fine credo che il Nero avrebbe avuto comunque ben poche speranze di salvezza...

ciao.gifciao.gif
"TB or not TB..."