Forum pubblico/privato: Pubblico
Permessi di scrittura: Utenti registrati
Giorno: 11/07/2021, 08:50:29
La finalissima
Per la finalissima, che dovrebbe iniziare dopo i test dei prossimi giorni, Jeroen ha chiesto aiuto al GM Sadler e le 50 linee di apertura saranno equamente distribuite e intervallate fra i due.

La prima coppia di partite si giochera' su una linea scelta da Sadler, la seconda coppia con una linea di Jeroen, e cosi' via.

Vedremo chi riuscira' a proporre le linee piu' interessanti, senza pero' esagerare con gli squilibri iniziali ... mmmm.gifmmmm.gifmmmm.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 28/10/2021, 09:30:41
Link sponsorizzati
Giorno: 14/07/2021, 08:34:47
Adesso sparatemi pur tutti addosso, per quanto di spiacevole andro' a scrivere.

A me non piace che si inventino "superfinaline" per il terzo e quarto posto con il chiaro obiettivo di temporeggiare nella partenza della finalissima.

A pensare male ci si azzecca, diceva Andreotti, e la mia sensazione e' che permettano dei tempi suppletivi a Stockfish per perfezionare delle nuove reti in zona Cesarini, tali da permettere di acquisire un miglior margine di sicurezza per la auspicata vittoria di Stockfish.

Se nella divisione Premier il vantaggio di Stockfish su Leela fosse stato ben maggiore di quello risicato che si e' visto, come accadeva in passato, sarebbero partiti subito senza questa "superfinalina" che davvero interessa a nessuno. Troppo ampio e' il divario di forza del lucertolone rispetto a Stoofleeves per risparmiarci di assistere a questo autentico ed inutile massacro.
Giorno: 14/07/2021, 11:32:57
Condivido l'inutilita' di questa sorta di "medaglia di bronzo".

Non credo pero' che qualche giorno in piu' potra' dare a SF vantaggi apprezzabili nelle condizioni di gioco della finalissima ...

ciao.gifciao.gif
"TB or not TB..."
Giorno: 14/07/2021, 12:04:48
C'e' un test in corso specifico proprio sulle "biased openings" che costituiscono il dominio del TCEC21

https://tcec-chess.com/misc/10x_odds/

il test finira' verso il 15-16 luglio, quindi in attesa del risultato del test sorbiamoci questo antipasto della medaglia di bronzo.
Giorno: 14/07/2021, 12:27:17
Sono d'accordo che la finalina non serva a niente...
Detto questo, bisogna vedere chi e' avvantaggiato dalla situazione: reti per Stockfish e Lc0 escono tutti i giorni per entrambi i motori, poi bisogna vedere se si crea una rete piu' forte delle altre che diventa il nuovo standard
Ma il fatto che su siti come questo dicano che la miglior rete e' sempre l'ultima uscita, mi viene da pensare che la situazione semmai avvantaggi Lc0...
Giorno: 14/07/2021, 14:29:57
forse la finalina e' stata chiesta da Komodo, per testare una nuova versione che pare assai forte.
Giorno: 14/07/2021, 14:31:51
.. e vincendola nettamente guadagnerebbe sicuro appeal commerciale.

dice il proverbio: quando manca il gatto, i topi ballano ciao.gif
Giorno: 14/07/2021, 17:16:08
Mah, non penso che 2-3 giorni di differenza possano avvantaggiare SF o Lc0.

Nella divisionP, se prendiamo per buoni i punteggi elo che mostrano in tabella, entrambi i motori hanno mostrato piu' o meno lo stesso margine di miglioramento in tempi lunghi pari a 7-8 elo, rispetto all'edizione precedente. Sono miglioramenti mediati sugli ultimi mesi, quindi e' probabile che effettivi siano qualcuno in piu'. Questo ci dice tuttavia che un ipotetico miglioramento di uno dei due in questi 2-3 giorni pesera' mezzo elo a dir tanto...
Giorno: 15/07/2021, 08:35:32
I 7-8 punti di miglioramento indicati dal metodo Aloril sul TCEC sono irrealistici, sono molti di piu'.

Spiego il bias statistico.
Come sappiamo, il TCEC calcola l'ELO sulle sole partite giocate nei vari TCEC e non considera fonti esterne. Leela e Stockfish giocano troppo poche partite nella Division premier (56 quest'anno) per fotografare il loro congruo miglioramento rispetto alle versioni che giocarono nel campionato precedente.

Finita la Division, a quel punto il campionato prevede ben 100 partite, nelle quali i due programmi si scambiano le variazioni Elo tra di loro, ma non possono piu' incrementarlo nei confronti sia dei loro concorrenti, ma solo incrementarlo/diminuirlo nei confronti del loro singolo avversario.

L'ELO TCEC verrebbe migliorato e reso attendibile se fosse modificato da un fattore correttivo, che tenesse conto della necessita' he il numero di partite dovrebbe venire stabilito anche in relazione al criterio di ridurre la deviazione standard (le fasce di oscillazione). Se la sufi prevede 100 partite tra 2 competitor, la division premier con 8 competitor per fornire risultati attendibili dal punto di vista Elo dovrebbe registrare almeno un numero di partite proporzionato, non un numero minore. Di fatto le variazioni ELO nella Divisiion sono calcolate su solo 8 partite contro le 100 della Sufi.

Che il miglioramento di soli 7-8 punti indicato da ALoril sia irrealistico, e contrario persino al senso comune, e' confermato da due importanti considerazioni:

A) finora ogni versione che ha giocato un bonus post SUFI contro le versioni dei campionati precedenti ha mostrato miglioramenti molto importanti, ben piu' consistenti della manciata di punti attribuita dal metodo ELo di Aloril. Ogni programma nuovo ha sempre sconfitto con facilita' i programmi utilizzati nelle versioni precedenti mostrando miglioramenti importantissimi anche a livello di hardware TCEC oltre che nei test di Pohl.

B) obiettivamente, Leela non puo' essere aumentato di soli 8 punti da un TCEC all'altro se consideriamo che:
b1) la 0.28 e' molto piu' veloce della 0.27
b2) la versione j94-100 precedente era da considerarsi un ibrido, un tentativo di Jhortos che e' stato abortito per l'insuccesso dimostrato e dichiarato da Jhortos stesso rispetto alla "main run" dell'autoapprendimento non rinforzato, che continua ad incrementare L'Elo con successo, anche secondo Pohl

I timori del team di Stockfish di perdere la SUFI derivano possibilmente da informazioni da insider migliori di quelle che possediamo noi e da qui nasce il sospetto di un attivismo nel creare versioni su versioni nuove proprio all'inizio della Superfinal, con l'effetto di ritardare la partenza e quindi sconfinare nel campo della tattica antisportiva.

Ricordo che in passato tutte "le finaline" si giocavano dopo la sufi, mai prima come e' accaduto adesso.

Preciso: lo considero antisportivo il comportamento del team di Stockfish di non far partire subito la sufi tediandoci con questa superfinalina per il bronzo perche' io avrei voluto veder competere nella Sufi due programmi che ricalcano piu' o meno i due programmi che hanno giocato nella Division Premier, per stabilire un'uniformita' di giudizio sui progressi registrati negli ultimi mesi.

Per le nuove versioni di Stockfish sarebbe stato sportivamente irreprensibile attendere la nuova versione 15 e il TCEC 22 per metterla a confronto con i competitori

Alla luce di queste considerazioni, considero quandi antisportivo rilasciare con grande enfasi la versione 14 e poi furiosamente cercare di modificarla. Noi tutti aspiravamo a capire come si sarebbe comportata nella SUFI la 14 contro il suo storico avversario.
Non alla confusione che si e' creata con questo ritardo.

Ciao
Giorno: 15/07/2021, 09:23:35
@ Masticone

Ma il fatto che su siti come questo dicano che la miglior rete e' sempre l'ultima uscita, mi viene da pensare che la situazione semmai avvantaggi Lc0...

=======
Non e' come dicono sul sito, ovvero che nella main run ogni rete sia sempre migliore della precedente.

L'autoapprendimento di Leela di fatto puo' essere considerato e rappresentato da una funzione monotona crescente solo sul lungo periodo, non rete dopo rete.
In tutta certezza, esistono nella direzione tendenziale del grafico Elo delle variazioni con il raggiungimento di punti di minimo locali.

Se ho ben capito il criterio di scelta di Pohl per testare le reti LCO, egli sperimenta le sole versioni che nell'ambito dei diversi comportamenti erratici di breve periodo presentano un punto di massimo locale.

Ad ogni modo non e' che nei test di Pohl ogni nuova versione si mostri migliore delle precedenti, bensi' dopo un certo periodo di test esce una nuova versione di LCO che e' sempre migliore di tutte le precedenti e cio' avverra' fino a quando non si raggiungera' davvero l'asintoto della funzione.

Secondo gli scienziati di ALpha Zero l'asintoto era stato gia' raggiunto dopo poche ore, ma l'esperienza di Leela, con il perfezionamento del codice informatico e l'introduzione di nuovi parametri, ha dimostrato che non e' cosi'. I progressi rispetto ad Alpha Zero continuano.

Spero di essere stato chiaro, l'argomento non e' semplice neppure per chi compie dele scelte e agisce spesso in base al buon senso ed alla pratica.