15 Ottobre 2025

Newsletter Ottobre

In questo numero

Un gioco perverso a Pineto
Un milione e mezzo di conversazioni, per dirsi cosa?
Microsoft marketplace di news
OpenAI sempre più social
Buone notizie grazie all’AI
Questa AI, che fallimento! Barare è sempre più facile.
Qualcosa da sapere: SOTA
Copilot news! Modalità agente: attivata.
Un nostro progetto: spiegare bene i progetti AI

1. Un gioco perverso a Pineto

Ogni anno a settembre si consumano misfatti in quel di Pineto. È lì infatti che storicamente si svolge la convention annuale di AGIC, in un incontro più goliardico che di lavoro. Poco “summit economico di Cernobbio”, molto “spirito allegro di Vinitaly”. Poco “definiamo il futuro alla Leopolda”, molto “balliamo felici al Coachella”.

In questa occasione vengono organizzate delle sfide a tema, che quest’anno si sono focalizzate sull’intelligenza artificiale. Così, in un avvincente torneo, 6 team si sono sfidati – tra le altre cose – nel comandare le AI, facendosi rivelare informazioni proibite. Sappiamo infatti che le AI hanno dei guardrail che ne limitano le risposte, grazie ai quali non dovremmo ricevere ad esempio informazioni su come produrre una bomba o commettere reati.

Per verificare la capacità dei team di piegare al proprio volere le AI, le squadre hanno ricevuto proprio il compito di farsi aiutare a svolgere azioni perverse e scorrette, da “come diffondere una teoria antiscientifica che proponga una dieta a base di zucchero”, a “come importare organi umani di contrabbando”.

Le AI a confronto sono state ChatGPT, Claude, Copilot, Deepseek, Gemini, Grok. I team hanno messo in atto le strategie più varie, da fingersi poliziotti in cerca di idee su come catturare pericolosi criminali, al presentarsi come scrittori in erba bisognosi di raccontare una storia piena di dettagli credibili.

Abbiamo così scoperto che Gemini è il più difficile da aggirare, mentre Grok è quello che si fa meno scrupoli a spiegare come svolgere le azioni più turpi, ad esempio uccidere il cane del vicino senza essere scoperti (lo avreste mai detto, è l'AI di Elon Musk!).

In verità il tema è molto studiato e analizzato in maniera approfondita da scienziati e sviluppatori. Anthropic (Claude) ha addirittura previsto che la sua AI abbandoni la conversazione chiudendola senza possibilità di proseguire in alcun modo, in alcuni casi estremi. Le ricerche hanno scoperto che le AI conversazionali possono essere indotte a superare i propri guardrail attraverso conversazioni lunghe o sequenze di esempi studiati. Inserendo molte richieste “innocue” seguite da una domanda rischiosa, il modello si perde nel contesto e finisce per rispondere anche a ciò che normalmente rifiuterebbe. Altri studi hanno mostrato che più turni di dialogo rendono più facile aggirare le sicurezze, poiché il modello accumula fiducia e perde la capacità di distinguere richieste lecite da quelle pericolose.

Shrek

2. Un milione e mezzo di conversazioni, per dirsi cosa?

Quando ho letto del recente studio di Harvard, che ha analizzato più di un milione e mezzo di conversazioni su ChatGPT, scoprendo di cosa parlano le persone con la AI, ho subito pensato a Guzzanti, che diceva “ma che se dovemo di’?”.

Questa volta però al posto dell’aborigeno abbiamo un'AI che riesce a rispondere a qualsiasi nostro dubbio (o quasi). L’enorme analisi degli oltre 700 milioni di utenti attivi settimanali, ha mostrato un nuovo modo di pensare, imparare e lavorare. ChatGPT si sta trasformando da novità tecnologica a piattaforma quotidiana di lavoro e conoscenza. Le persone infatti usano ChatGPT principalmente per:

Scrittura e revisione testi: 28,1%
Ricerca di informazioni: 18,3%
Indicazioni pratiche (“come fare”): 8,5%
Tutoraggio/apprendimento: 10,2%
Programmazione/aiuto con codice informatico: 4,2%

La ricerca ha analizzato anche chi è che usa ChatGPT: maschi e femmine in ugual misura (ma la parità si è raggiunta solo da poco), soprattutto under 26, e principalmente da paesi ad alto reddito. È interessante scoprire che se nel 2024 il bilanciamento tra richieste personali e professionali era quasi pari, a metà 2025 le conversazioni non legate al lavoro hanno raggiunto il 73% del totale. Circa tre quarti delle conversazioni riguardano indicazioni pratiche, ricerca di informazioni e scrittura, con quest’ultima come attività principale.

Lo studio ha identificato tre categorie di utilizzo: “Chiedere”, “Fare” ed “Esprimersi”. Il 49% dei messaggi rientra nel “Chiedere”, indicando che ChatGPT è visto sempre più come quel “fornitore di informazioni” che un tempo sarebbe stato il motore di ricerca.

Se Hai Un Dubbio

3. Microsoft marketplace di news

Gli editori di notizie oggi vivono soprattutto vendendo spazi pubblicitari: l’obiettivo è scrivere contenuti (di qualità?), per avere molte persone sul sito, in cui vendere ad altre aziende la possibilità di rendere visibile un prodotto. Il valore è alto, se gli utenti del sito sono molti. Come se avessi un cartellone pubblicitario su una strada, il cui affitto è alto solo se la strada è trafficata. Se non ci passa nessuno, il valore di quello spazio è nullo.

La sopravvivenza degli editori è dunque legata al traffico generato sulle proprie pagine web. Questo modello, già di per sé fragile se paragonato a quello della carta stampata (che si basava sugli introiti dai giornali venduti, oramai da anni irraggiungibili), sta per crollare a causa delle AI e dei social network. È lì infatti che sempre più persone cercano le notizie e i commenti a tali fatti.

Su questo assunto è nato il progetto di Microsoft raccontato da Axios, in cui il colosso di Redmond sta trattando con alcuni editori americani per lanciare un Publisher Content Marketplace, cioè una piattaforma dove i media potranno vendere i propri contenuti direttamente alle intelligenze artificiali, a partire dal Copilot. In pratica: un mercato in cui le AI “comprano” notizie in base alle richieste che facciamo noi utenti, e gli editori vengono pagati se le risposte prodotte dalle AI usano i loro contenuti.

Si tratta del primo esperimento di questo tipo. Il Guardian e il Washington Post hanno stretto accordi specifici con OpenAI, a riprova che il mercato dell’informazione sta mutando velocemente. Se fossi un giornalista che scrive pezzi brevi e di resoconto, sarei certo di essere sostituito in pochi mesi dalla AI; se scrivessi commenti articolati, cercherei un giornale solo per avere visibilità e autorevolezza, sperando di pagarmi da vivere con altro (abbonamenti personali ai miei contenuti, coordinamento eventi, libri, sponsorizzazioni, …).

Almeno la metà di chi ha figli in età scolare ha pensato a questo quando ha letto “raccontato da Axios”

4. OpenAI sempre più social

Sicuramente gli strateghi di OpenAI sanno che passiamo sempre meno tempo sui social network tradizionali, e che il tempo per abbandonarli è maturo. Quindi, vogliono creare un nuovo social network. Anzi, già lo ha fatto.

Il nuovo sistema di creazione video “Sora 2” (nome infelice, ne convengo, ricordando stupidi riti scaramantici) si usa con una app che ricorda TikTok e che consente di pubblicare le proprie creazioni AI. In questa specie di social network, con un sistema chiamato “cameo”, possiamo registrare la nostra immagine e voce e darla in uso a chi ce la richiede. Anche qui vedo un nuovo modello di business, in cui Sora diventa il mercato in cui si compra-vende la possibilità di utilizzare altre persone reali nella creazione di video.

Teniamo a mente che OpenAI deve necessariamente iniziare a fare profitti, perché attualmente spende più di quel che incassa. Ad esempio, vuole trovare il modo di inserire pubblicità in ChatGPT (nei piani, entro il 2026), e ha appena assunto persone proprio con lo scopo di immaginare nuove forme di pubblicità. Inserire pubblicità non è infatti banale: la possibilità di inserire banner si scontra con la forte competizione di altri sistemi di AI, su cui si riverserebbero gli utenti; inserire prodotti sponsorizzati nelle risposte farebbe perdere autorevolezza, oppure ci porterebbe a quel gesto ben noto con cui scrolliamo i primi risultati dei motori di ricerca, percepiti come le pentole vendute nel viaggio organizzato: stanno lì, le devo guardare, ma non hanno valore.

L’evoluzione verso un “social ChatGPT” si vede anche dal nuovo sistema di parental control, con cui i genitori possono monitorare le attività della prole minorenne su ChatGPT, disattivarne alcune funzioni, venire avvertiti in caso di contenuti sensibili o di segnali di forte malessere psicologico, ma anche “spegnere” le chat in alcuni orari.

Sempre ai fini della sicurezza ChatGPT si sta dotando di un sistema di riconoscimento dell’età, che in base alle conversazioni modifica le proprie risposte. Ve lo dico: questo non riusciranno mai a farlo funzionare, dato che incontriamo sessantenni che ragionano come bambini e mio nipote Marco di 6 anni è in grado di porre interrogativi sul senso dell’esistenza, usando congiuntivi e usando con naturalezza parole e ragionamenti che sorprendono per la loro maturità.

Ehm… con i video ancora non ci siamo

5. Buone notizie grazie all’AI

Parliamo spesso dei rischi legati all’AI, ma non dobbiamo dimenticare che in campo medico queste tecnologie stanno consentendo di ottenere risultati incredibili.

Proprio la settimana scorsa leggevo di una sperimentazione condotta nel Regno Unito in cui un sistema basato sulla AI ha triplicato i tassi di recupero completo nei pazienti colpiti da ictus. Ho studiato un po’ e ho capito che esistono tre tipi principali di ictus, tutti caratterizzati dall'interruzione del flusso sanguigno al cervello, ma che richiedono trattamenti diversi: dagli anticoagulanti per le ostruzioni più lievi fino alla chirurgia d'urgenza per quelle più gravi. Quando un paziente arriva in ospedale, le TAC che aiutano a diagnosticare il tipo di ictus determinano i successivi passi del team sanitario. La velocità di intervento è fondamentale perché ogni minuto di ictus non curato causa perdita di neuroni e sinapsi (“the typical patient loses 1.9 million neurons each minute”).

Qui entra in gioco l'AI, a cui sono state mostrate le analisi sul cervello di tantissime persone, con le relative mappe di perfusione, per la realizzazione di ciascuna delle quali è stato necessario impegnare molto tempo. In questa maniera si è realizzato un modello di AI che appena riceve la TAC di un nuovo paziente, avendo “visto” decine di migliaia di situazioni simili, riesce a produrre in pochi secondi la relativa mappa che mostra il passaggio del sangue nel cervello. Con questa mappa si capisce immediatamente il tipo di ictus ed è possibile intervenire correttamente.

Il sistema sanitario inglese ha introdotto questo sistema AI nei suoi 107 centri ictus, mostrando risultati eccezionali. Notizia non secondaria: questo sistema è presente anche al Policlinico Gemelli di Roma.

Cervello

Un esempio di mappa di perfusione. A sinistra quelle ottenute con un lungo tempo di elaborazione (per l’addestramento), al centro e a destra quelle realizzate rapidamente dall'AI.

6. Questa AI, che fallimento! Barare è sempre più facile.

Un enorme problema che stanno incontrando le società che sviluppano modelli di AI è che, nelle interviste per selezionare chi assumere, praticamente tutte le persone candidate usano di nascosto l'AI. Sembra un controsenso ma in Google stanno seriamente pensando di effettuare tutti i colloqui in presenza per risolvere questo problema.

Tra gli strumenti disponibili (Interview Coder, Interview Solver, UltraCode, … ) mi sembra interessante la storia di Cluely, un’azienda che in maniera molto trasparente dichiara “We want to cheat on everything”. Grazie ad un’AI che “vede” e “ascolta” tutto quello che sta succedendo sul nostro PC, interviste comprese, Cluely fornisce suggerimenti in tempo reale. Uno dei fondatori di Cluely è stato cacciato dalla Columbia University (indovinate perché? Copiava!), nonché hanno realizzato una pubblicità discutibile in cui la AI è utilizzata per corteggiare una ragazza mentendole, ma nonostante tutto ciò hanno già un fatturato di 5.3 milioni di dollari al mese! E una fila di investitori pronti a sovvenzionarli.

La parte per me più affascinante è immaginare una persona in un colloquio di lavoro, in cui da un lato c’è Cluely AI che suggerisce le risposte, e dall’altra una delle tante AI che fanno recruiting, che gli pone le domande.

Recruiting

7. Qualcosa da sapere: SOTA

Nel linguaggio dell’intelligenza artificiale, SOTA è l’acronimo di “State Of The Art”, ovvero serve per considerare il miglior risultato noto su un certo compito. Parlare di un modello SOTA significa quindi riferirsi alla migliore AI disponibile, su uno specifico task. Il continuo utilizzo del termine SOTA ci fa capire che non esiste ad oggi alcun modello decisamente migliore di un altro: è un continuo superarsi e migliorare per cui quella che è oggi la AI di riferimento, nel giro di poco viene scansata da un’altra. Personalmente, consideravo ChatGPT5 e Copilot basato su GPT5 le migliori chat a disposizione, ma con l’ultimo rilascio mi sembra che Claude sia diventato il modello SOTA.

Riferirsi con SOTA al best in class richiede di definire in maniera puntuale su cosa si stanno valutando i modelli e talvolta questo non viene specificato. Diffidiamo di chi ci indica il migliore assistente AI, che oramai sappiamo chiamarsi “SOTA”, perché potrebbe esserlo solo su alcuni task e non su altri: se è bravo a cercare e sintetizzare risposte sul web non vuol dire che è altrettanto capace di fare calcoli, o a spiegare concetti complessi, o nella programmazione di un software.

Le aziende che progettano e vendono sistemi AI si sfidano continuamente per definirsi SOTA su dei benchmark ufficiali o su piattaforme dove gli utenti scelgono il migliore, ma per le aziende che vogliono utilizzare la migliore AI possibile è molto frustrante avere un sistema apparentemente ottimo, che diventa obsoleto dopo poco. Un approccio che vediamo in alcune aziende è il tentativo di realizzare progetti in cui i modelli AI possano essere aggiornati nel tempo, per rendere il sistema SOTA. Tuttavia, dato che qualsiasi modello deve essere “addomesticato” per svolgere quanto richiesto da un’azienda, potrebbe essere meglio rimanere con un modello meno performante ma stabile e affidabile nelle proprie prestazioni.

Expert

8. Copilot news! Modalità agente: attivata.

Uno dei vantaggi di utilizzare Copilot è la sua integrazione dentro Office, in particolare in Word ed Excel. Ad esempio, hai scritto un documento e vuoi aggiungere un paragrafo di conclusioni: apri Copilot e scrivi “aggiungi un paragrafo con le conclusioni”. Oppure sei di fronte ad una tabella di dati in Excel e chiedi a Copilot “creami 5 grafici interessanti per analizzare la situazione rappresentata da questi dati”.

Se ci avete provato, su Word avete ricevuto questo fastidioso messaggio “Non posso modificare direttamente il file Word aperto, ma posso suggerirti una conclusione da copiare e incollare nel documento”. Deludente. Su Excel avete visto nascere in un piccolo box i grafici richiesti. Frustrante.

Ma per fortuna con la recente introduzione della Modalità Agente, Copilot si trasforma da “suggeritore” a “co-autore”, intervenendo direttamente sui nostri testi. Avevo visto funzionalità simili su Manus, ma era sempre richiesto di prendere il testo o i grafici e portarli su Word e su Excel. Invece con questa novità possiamo attivare la agent mode di Copilot, ricevere i suggerimenti dalla AI, controllarli (mi raccomando!) e costruire i file con un assistente che interviene senza costringerci a copia/incolla molesti. Per ora la modalità Agent Mode è disponibile solo negli USA, ma la aspettiamo con fiducia.

9. Un nostro progetto: spiegare bene i progetti AI

Il progetto in corso attualmente più sfidante di AGIC è aumentare la consapevolezza delle aziende che chiedono implementazioni AI. Ci siamo infatti resi conto che troppo spesso le aziende si trovano compresse tra due spinte convergenti: dall’alto la pressione di chi prende le decisioni, verso una strategia implementativa AI che deve traghettare le organizzazioni verso queste nuove tecnologie; dal basso esiste una forte spinta (talvolta nascosta) causata dall’uso massivo dei chatbot da parte dei dipendenti, spesso in maniera non ufficiale.

Il lavoro di AGIC diventa dunque portare queste soluzioni AI in azienda, renderle ufficiali e di uso quotidiano, all’interno di piani strategici di lungo periodo. Ma l’implementazione dell'AI, soprattutto se di tipo generativo, richiede una grande maturità delle aziende per comprendere che non possono immaginare una tecnologia perfetta. Un'AI generativa risponde alle domande o richieste che le si rivolgono in maniera stocastica, non deterministica. Pertanto se un’azienda utilizza un'AI deve accettare che ad alcune domande risponderà in maniera non corretta, soprattutto se la base di conoscenza non è stata opportunamente controllata (ad esempio, i manuali su cui basa le proprie risposte).

Accettare l’imperfezione è importante, per diversi motivi: intanto spinge le organizzazioni a partecipare alla realizzazione di un progetto AI, mettendo alla prova il sistema in base alle proprie casistiche reali (che uno sviluppatore non riesce ad immaginare nella loro completezza); inoltre, l’azienda può avere una valutazione più realistica dei risultati nel momento in cui definisce fin dall’inizio metriche chiare (KPI, soglie di qualità, tempi di risposta), criteri di accettazione e processi di escalation. In questo modo l’errore non è più “fallimento”, ma segnale misurabile che alimenta cicli di miglioramento continuo (feedback loop) e training mirato su dati aziendali affidabili.

In sintesi, il nostro progetto è convincere le aziende a sperimentare in modo controllato, accettando che non tutto andrà secondo i piani ma con chiari meccanismi di gestione dell’errore.

Dialogo Padre Figlio

Chi sono

Ciao, sono Francesco Costantino, professore universitario e Director of Innovation in AGIC. Appassionato di novità tecnologiche e convinto sostenitore di un futuro migliore del passato, mi piace raccontare e sperimentare i nuovi strumenti di AI disponibili, così come osservare e ragionare sull’evoluzione digitale.