Forum pubblico/privato: Pubblico
Permessi di scrittura: Utenti registrati
Giorno: 25/02/2023, 19:59:50
Un'altra patch "maledetta", che fara' sicuramente discutere, nel bene o nel male, e' stata rilasciata nella giornata di ieri.

A tempi ultra rapidi farebbe perdere al motore ben 6 Elo, mentre a tempi normali sarebbe sostanzialmente neutra.

Perche' diavolo l'hanno buttata dentro, allora? confused.gifconfused.gifconfused.gif

Secondo l'autore farebbe guadagnare 5 punti a tempi tripli (3' a partita + 1.8 secondi a mossa), mentre l'incremento su 8 core sarebbe addirittura di 12 Elo. mmmm.gifmmmm.gifmmmm.gif

Le esperienze passate mi hanno insegnato a dubitare di queste patch "miracolose", e speriamo che gli sviluppatori sappiano davvero cio' che stanno facendo.

I primi test ufficiali di regressione della nuova master non promettono nulla di buono, con una perdita di un Elo su un solo core.

Dove sono i tester non ufficiali?

Quelli della NCM e' da un po' che non si fanno sentire; speriamo che ci pensi allora il buon Stefan Pohl ... biggrin.gifbiggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 28/03/2023, 11:11:04
Link sponsorizzati
Giorno: 26/02/2023, 09:47:54
Le partite giocate a tempi lunghi della patch non sembrano molte, probabile che il guadagno effettivo sia minore. +6 in single core e +12 in multicore con una sola patch sembra effettivamente fantascienza.

Va anche detto che i tempi "lunghi" considerati dagli sviluppatori di SF sono poca cosa rispetto al tempo che uno dedica nell'analizzare una posizione, o ai tempi anche blizt dei tornei per computer online. Sotto questo punto di vista la scelta intrapresa dagli sviluppatori di spostare i test verso tempi piu' lunghi mi trova concorde.

Comunque vedremo sicuramente presto nei testi di Pohl se questa patch e' cosi' incredibile come sembra dai test, o se sara' il solito +1 elo di incremento. Pohl testa a 3 min + 1 secondo in single core, piu' o meno l'equivalente del VLTC usato dagli sviluppatori, quindi in teoria dovremmo aspettarci +5-6 elo...
Giorno: 26/02/2023, 10:45:54
Quelli del Team dovrebbero standardizzare le procedure di test sottoponendo tutte le nuove patch allo stesso numero di partite.

Se l'intenzione e' davvero quella di migliorare il motore a tempi "exta lunghi" (come li intendono loro ... biggrin.gifbiggrin.gifbiggrin.gif), allora si potrebbe eliminare completamente la fase di test a 10" a partita (tanto, poi, non tengono conto del risultato neanche se fosse fortemente negativo, come e' successo in questo caso! dho.gif) e partire direttamente con quella da 60"; le pochissime patch verdi dovrebbero poi essere tutte testate a 180" prendendo infine per buone solo quelle che superano chiaramente entrambi, e aspettando comunque che vengano giocate tutte e 40000 le partite del campione.

Certo, ci vorrebbe un'infinita' di tempo in piu', ma almeno si avrebbe la ragionevole sicurezza di far passare solo modifiche davvero migliorative, invece di rischiare di buttare dentro tanta spazzatura che poi diventera' quasi impossibile da rimuovere ... mmmm.gifmmmm.gifmmmm.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 26/02/2023, 11:16:04
Il buon Stefan Pohl ha appena finito di testare, in soli 2 giorni (ben 7000 partite!), la versione del 23 Febbraio (trovando un +12 su SF15, in perfetto accordo con i dati ufficiali!).

Puo' darsi che attacchi subito con la versione incriminata e che, fra qualche giono ci possa quindi fornire le prime indicazioni indipendenti.

Ben fatto, Stefan! Continua cosi'! zizi.gifzizi.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 26/02/2023, 12:22:35
Ho provato l'ultimo Stockfish su una posizione che uso di default per vedere come analizza...
Sul mio pc settato con 2 threads ci mette poco piu di 1 minuto a trovare la soluzione, che non saranno i 15 secondi di crystal ma prima mi pare gli ci volesse molto molto di piu', almeno 5 minuti...
Giorno: 01/03/2023, 19:04:52
Stefan Pohl ha iniziato a testare la Rete del giorno 27, probabilmente l'ultimo rilascio di Linmiao Xu.

Nei prossimi giorni dovremmo finalmente capire se c'e' stato qualche sostanziale progresso, o se e' stato solo fumo ... mmmm.gifmmmm.gifmmmm.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 02/03/2023, 14:43:42
Buone nuove, intanto dalla NCM.

Il motivo per cui hanno sospeso i loro test e' che hanno espresso l'intenzione di cambiare lo sparring partner.

In futuro l'avversario di riferimento per le nuove dev. di SF non sara' piu' l'ormai obsoleto SF7, ma il ben piu' recente SF14.

Con una differenza di meno di 50 Elo nella forza di gioco, le barre d'errore promettono di essere sensibilmente piu' contenute (entro i 3 o 4 punti), e quindi i nuovi test decisamente piu' attendibili.

Era davvero ora che lo facessero! zizi.gifzizi.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 02/03/2023, 14:49:17
Ecco la nova pagina per i test:

New NCM

Peccato solo che il numero di partite sia stato ridotto da 20000 a 10000 ... dho.gifdho.gifdho.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 02/03/2023, 18:54:29
Dai nuovi dati della NCM si nota l'assoluta inconsistenza della discussa patch del 24 febbraio, che, tenuto conto delle barre d'errore, sembra senza infamia e senza lode; ma cio' non deve meravigliarci, tenuto conto che, alla NCM, i tempi sono di 30" a partita su 2 core.

Non ci resta, quindi, che affidarci al nostro Santo Stefan ... biggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 04/03/2023, 18:01:31
Santo Stefan Pohl ci ha fatto il miracolo, testando l'ultima patch del 27 Febbraio, che risulta sostanzialmente neutra rispetto alle precedenti anche a 3 minuti a partita (campione di 10000 partite con barra d'errore di 5 punti).

Cosa dire? Tanto rumore per ... nulla! dho.gifdho.gifdho.gif biggrin.gifbiggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."