Forum pubblico/privato: Pubblico
Permessi di scrittura: Utenti registrati
Giorno: 31/07/2021, 19:26:56
Troppa grazia!

San Gennaro deve essersi preso una bella cotta per Santa Francese e Santa Siciliana! biggrin.gifbiggrin.gifbiggrin.gif

ciao.gifciao.gif
"TB or not TB..."
Giorno: 28/10/2021, 09:04:17
Link sponsorizzati
Giorno: 01/08/2021, 07:17:41
Purtroppo uno dei problemi nell'auto apprendimento e' proprio dovuto al fatto che la rete neurale tende a convergere su pesi basati su dati precedenti, e se questi non contemplano quasi mai una siciliana, diventa difficile per Lc0 imparare a giocarla a dovere.

Non farei invece piu di tanto affidamento sui dati di Alphazero, essendo basati su un programma che oramai e' almeno 150-200 Elo inferiore a Lc0 e di alcuni anni fa. Di Alphazero abbiamo visto poche partite gestite da chi ha creato il programma proprio per evidenziarne i vantaggi e i risultati raggiunti ma se fosse fatto giocare con SF e Lc0 verrebbero fuori tutti i difetti.
Giorno: 01/08/2021, 08:25:54
@ Geralt
Non farei invece piu di tanto affidamento sui dati di Alphazero,
=============

Inizialmente Lc0 aveva il proposito di replicare esattamente il paper di AlphaZero, non si era posto l'obiettivo di essere utilizzato come sparring partner di Stockfish come - di fatto - il progetto LC0 e' relegato adesso.

La rigorosita' di seguire le linee guida del paper inizialmente e' stata massima, da cui deduciamo che le preferenze per determinate aperture di LC0 siano le stesse di ALphaZero e - come hai scritto giustamente - non vengono modificate in seguito dall'autoallenamento.

Il percorso di selezione per alcune aperture come risposta ad 1 e4 e' stato il seguente e lo riporto direttamente dal paper di Nature che ho sotto'occhio:

- Francese --> scartata
- c5 e d6 ---> scartata
- c5 e Cc6 ----idem
- c5 ed e6 ---idem
- c6 ---idem
- Ruy Lopez --- accettata


Nel seguito non sappiamo come si sia evoluta la cernita di aperture da parte di LC0, perche' non ci sono disclosure sulle preferenza di LC0 e il progetto di creare un programma forte piu' di Stockfish e' praticamente abbandonato, con i progetti degli ultimi che ci lavoravano, Hjorthos e Dkappe, terminati senza dare spiegazioni.

Ho gia' fornito le mie personali ipotesi per questa scelta di abbandono del progetto di sviluppo di LCO, mentre continua il progetto di autoallenamento di LC0, che non comporta interventi umani.,

L'unificazione dei due progetti non poteva che portare alla morte di LC0, perche' nessuno dei fondatori (Nicolet, Costalba) ha interesse a sviluppare un programma piu' forte di Stockfish in quanto tale esito "certo" comporterebbe l'abbandono da parte di molti volenterosi che da anni si impegnano faticosamente.

Affermo senza timore di smentita che l'esito di una vittoria di una rete neurale adeguatamente preparata contro Stockifh sarebbe certo, e tutti lo possono rilevare dalle valutazioni di Lc0 che sono molto piu' precise e realistiche di quelle di Stockfish

Basterebbe che Google mettesse a disposizione il suo hardware, correggesse i vizi di gioventu' di Alpha Zero ed un nuovo AlphaZero 2.0 con MLH ed altri tecnicismi che nel frattempo si sono evoluti avrebbe vita facilissima contro Stockfish, persino contro Stockfish 16,17,18, etc


Per il momento e' meglio che le cose procedano in questa direzione opposta, ovvero che in questo match Sufi21 vengano giocate tonnellate di un'apertura che non e' nel DNA di Lc0, la siciliana, e nessuna partita dell'apertura preferita da LC0 per fare in modo che emerga alla fine una vittoria schiacciante di Stockfish, che motivera' ancora a lungo i propri programmatori.

Come se non bastasse, questa notte si e' giocata un'altra coppia di siciliane, con il solito risultato di 1-0 1/2 per Stockfish.
Giorno: 01/08/2021, 08:36:09
Di Alphazero abbiamo visto poche partite gestite da chi ha creato il programma proprio per evidenziarne i vantaggi e i risultati raggiunti ma se fosse fatto giocare con SF e Lc0 verrebbero fuori tutti i difetti.

===========
Alpha Zero cosi' come l'abbiamo conosciuto non potrebbe giocare ne' contro SF ne' contro LC0 nel TCEC.

Non era stata implementata alcuna funzione di time management, per cui nelle sue partite pubblicate nel paper si accettava come eseguita la mossa che era nella linea d'analisi in quel momento allo scadere di tempi prefissati (esempio 1 minuto)
Giorno: 01/08/2021, 18:34:14
SF allunga ancora portandosi sull'11 a 5 grazie al solito erroraccio di Leela nel finale.

La partita si avviava stancamente verso l'ennesima patta quando Leela, alla sua 42ma mossa sbaglia tutto:


You need Javascript enabled to view it.










Spettacolare, invece, la partita d'andata, terminata patta ma ben degna di figurare in manuali tipo "Difesa e contrattacco ... "

ciao.gifciao.gif
"TB or not TB..."
Giorno: 01/08/2021, 18:41:39
La ricerca di Leela, basata sul metodo Montecarlo, continua purtroppo a soffrire delle stesse difficolta' delle origini, rischiando di sprecare malamente quanto di buono fatto vedere in un'intera partita.

Se non fosse per queste sviste, i due sfidanti se la giocherebbero davvero alla pari o giu' di li' ...

ciao.gifciao.gif
"TB or not TB..."
Giorno: 02/08/2021, 08:49:06
Il problema a mio avviso non e' solo del metodo montecarlo in se, ma del concetto introdotto da Alphazero di avere un approccio di apprendimento non supervisionato e di come viene applicato per Lc0.

Se le generazioni di reti precedenti (tutte quelle di serie 6X) non hanno imparato a giocare bene la siciliana, per esempio perche' giocata raramente nelle loro partite, anche quelle successive, che si basano sui dati di quelle precedenti, difficilemente colmeranno il buco, perche' non hanno molti dati da cui partire.

Questi stessi difetti li avrebbe sicuramente palesati anche Alphazero, ma all'epoca SF 8 aveva anche lui i suoi bei buchi di conoscenza essendo un motore A/B di vecchia generazione.

Gli sviluppatori potrebbero risolvere questo problema "perturbando" i dati a disposizione, per esempio aggiungendo partite giocate da SF, o introducendo dei correttivi a mano, ma a quel punto non sarebbe piu' un progetto che mira a riprodurre Alphazero ma diventerebbe uno Stockfish con GPU. Inoltre temo dovrebbero ripartire con una nuova serie di reti (1-2 anni di nuove reti per ritornare a questo livello di forza).

Cio' nonostante, e' indubbio che entrambi i programmi sono molto migliorati rispetto all'edizione precedente, Lc0 di adesso probabilmente e' alla pari con SF13 che ha vinto il TCEC 20.
Giorno: 02/08/2021, 09:23:18
Un tentativo potrebbe essere quello di allenare una rete forzandola a giocare un alto numero di siciliane...
Sono una carota in cerca di sè stessa...
Giorno: 02/08/2021, 09:26:13
Tutte giuste e condivisibili le osservazioni di Geralt.
Aggiungo che da qualche tempo Stockfish gioca davvero molto bene le posizioni in cui esplora attraverso delle serie composte da una cinquantina di mosse (senza muovere pedoni !) tutte le potenzialita' recondite di una posizione. Le vecchie versioni di Stockfish parevano piu' "dirette", mentre questa versione 14 mostra una pazienza infinita nel torturare e far emergere i punti deboli di Leela in difesa, in particolare quando non si accorge di potenziali tatticismi che decidono rapidamente le partite in suo sfavore.

Nel frattempo il TCEC si avvia verso la fine e nessuna partita spagnola o italiana e' ancora apparsa.
Giorno: 02/08/2021, 09:34:29
Un tentativo potrebbe essere quello di allenare una rete forzandola a giocare un alto numero di siciliane...
==========

Occorrerebbero allora tante reti quante sono le aperture iniziali. E se poi si verificasse una trasposizione di mosse, per cui ad esempio la siciliana Rossolimo si trasforma in uno schema "spagnoleggiante" ?
Il programma continua ad usare la rete siciliana o passa a quella spagnola? E in base a quale input autonomo lo comprende se non e' un umano a suggerirlo ?

Alpha Zero, cosi' come LCO, e' nato non per vincere il TCEC.

In particolare, non e' nato per vincere il TCEC se il suo principale avversario, Stockfish, si rafforza metabolizzando le partite di Leela nel proprio DNA ed imparando cosi' anche la tecnica del temporeggiamento ("shuffle" la chiamano sulle chat) che cosi' tanti punti facili gli ha fatto guadagnare in questo TCEC 21.

I Stockfish precedenti che giocavano in modo diretto non avevano avuto tutte queste opportunita' tattiche che Stockfish 14 si e' guadagnato, opportunita' che grazie alla sua precisione analitica concretizza con facilita' nella fase tecnica di realizzazione come anche Luigi ha dimostrato nell'esempio sopra.