Forum pubblico/privato: Pubblico
Permessi di scrittura: Utenti registrati
Giorno: 29/05/2017, 17:53:15
Iniziativa lodevole.
Come ho già accennato nel topic "SF8 developments", un Anonimo tester, dotato di una macchina di tutto rispetto (dual Xeon E5-2670 a 16 core fisici), si sta "divertendo" a testare tutte le versioni di sviluppo di SF, rilasciate a partire da un paio di anni a questa parte.

Come motore di riferimento ha scelto SF7 contro cui, tutte le versioni rilasciate con una nuova patch, disputano 10000 partite con tempi attorno ai 30" + 0.3" a mossa.

Disputando 8 partite contemporaneamente, grazie alla potenza della sua macchina, il nostro Anonimo riesce a concludere il test di ogni nuova patch (comprese quelle cosiddette "non funzionali", che gli sviluppatori buttano nel calderone senza alcuna verifica) in meno di 24 ore, il che gli consente di stare tranquillamente al passo con l'evoluzione del motore.

Consiglio a tutti di salvarsi il

Link

del sito fra i preferiti e di controllarlo di tanto in tanto per avere il polso della situazione in casa SF.

L'indeterminazione statistica su ogni misura è di circa 4 punti, e ciò spiega l'andamento "a dente di sega", semplice rumore statistico di un grafico di progressione che, che per il resto, è ancora sostanzialmente rettilineo, senza fasi di stasi ne brusche impennate.

Basta però una patch particolarmente "fortunata" che si sussegue a una statisticamente più sfortunata per dare l'illusione di uno sbalzo di 6-7 punti fra una versione e la successiva, che potrebbero erroneamente essere attribuiti a patch "miracolose" che avrebbero fatto fare un salto di qualità.

Sarebbe bello se, in questo tipo di test, le barre d'errore potessero essere ridotte a 2 soli punti ma, per far ciò, occorrerebbero ben 40000 partite (che è proprio il valore utilizzato dagli sviluppatori di SF).

È auspicabile che, con la prossima commercializzazione dei nuovi server "Naples" della amd, il nostro appassionato (e, probabilmente, anche "danaroso" biggrin.gifbiggrin.gif) Anonimo possa disporre di una macchina 4 volte più potente, e riuscire così a concludere nell'arco delle 24 ore il test di ogni nuova patch con un errore di soli 2 punti.

Ciò offrirebbe finalmente la possibilità di una contro verifica rigorosa e accurata, del tutto indipendente da quelle ufficiali, di ogni nuova patch, funzionale o non funzionale che sia, che viene aggiunta alla "master".

Le patch che ancora dovessero mostrare regressioni di 3 o 4 punti potrebbero allora essere sottoposte a ulteriori controlli e si potrebbe anche perseguire un serio progetto di fork alternativo a quello ufficiale: basterebbe rimuovere le patch che sembrano far regredire la curva di progressione e verificare, di tanto in tanto, se il nuovo motore diventi col tempo davvero più forte di quello ufficiale ... mmmm.gifmmmm.gifmmmm.gif

Una prospettiva decisamente interessante! zizi.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 25/06/2017, 19:21:43
Iniziativa lodevole.