E' appena stato presentato Grok 3, il sistema di Intelligenza Artificiale di Elon Musk, che presenta degli aspetti caratteristici che meritano un approfondimento.
Innanzitutto questo modello non solo supera i suoi concorrenti LLM in termini di potenza di calcolo e precisione, ma introduce anche caratteristiche innovative che lo distinguono nettamente da ChatGPT-4, Gemini 2 Pro o Claude 3.5 Sonnet. I suoi contributi unici includono il supporto DeepSearch per la trasparenza nel ragionamento, la capacità di risolvere complessi problemi scientifici, l'uso di dati sintetici nella sua formazione e un approccio di "risposte non filtrate" che ridefinisce l'interazione uomo-IA.
Grok 3 rappresenta un salto di qualità nell'infrastruttura tecnica. Secondo i dati rivelati da xAI, il sistema opera con una capacità di elaborazione dieci volte superiore a quella della versione precedente, ottenuta attraverso una combinazione di hardware specializzato e algoritmi ottimizzati. Questa potenza si traduce in velocità di risposta più rapide del 40% rispetto a GPT-4 nelle attività di codifica.
Il modello utilizza un duplice approccio alla formazione: oltre a utilizzare set di dati convenzionali (pagine web, articoli scientifici, ecc), incorpora dati sintetici generati dall'intelligenza artificiale. Questa metodologia consente a Grok 3 di simulare scenari ipotetici e di affinare le sue capacità di ragionamento astratto.
Lo strumento DeepSearch rappresenta un'innovazione nell'interpretabilità dell'intelligenza artificiale. A differenza dei sistemi di ricerca tradizionali, che restituiscono risultati basati su correlazioni statistiche, DeepSearch suddivide il processo di ragionamento passo dopo passo, mostrando come si giunge a ciascuna conclusione. Quando un utente pone una domanda complessa, Grok 3 non solo fornisce una risposta, ma genera un report dettagliato che include:
- Scomporre la domanda in sottoproblemi identificati
- Fonti di dati consultate (articoli accademici, discussioni su X, database tecnici)
- Catene logiche applicate per collegare i concetti
- Livello di certezza calcolato per ogni affermazione
Mentre modelli come Gemini o Claude eccellono in compiti linguistici generali, Grok 3 dimostra capacità eccezionali in ambiti specializzati e in particolare nel risolvere problemi scientifici complessi (nei test condotti da xAI, il modello ha risolto il 92% dei problemi delle Olimpiadi Internazionali di Fisica del 2024, superando il 78% raggiunto dagli specialisti umani), nella generazione di contenuti tecnici (oltre alla creazione di testo, Grok 3 può generare codice funzionale in 15 linguaggi di programmazione, tra cui Rust e CUDA per GPU, progettazione di circuiti quantistici, produrre simulazioni interattive come ad esempio modelli 3D di formazioni stellari)
Ho provato a testare le funzionalità di Deep Search ed è davvero sorprendente verificare le fonti di approvvigionamento di Grok e le valutazioni ricavate dalle fonti stesse (provate, ad esempio ad inserire questa quesry "Come spiegheresti le ragioni dei cambiamenti climatici in atto?", attivando il DeepSearch
Ho poi testato la funzionalità "Think" per la risoluzione dei problemi. E' molto efficace anche se non accetta immagini come allegati (mentra la richiesta non filtrata lo consente), spiegando nel dettaglio ogni passaggio.
In questo contesto ho chiesto di aiutarmi a valutare un saggio breve sull'Illuminismo per uno studente di 16 anni. Il saggio conteneva volutamente errori grammaticali e concettuali per verificare l'efficacia di questo strumento. E' davvero notevole l'fficacia della risposta fornita, con una serie particolareggiata di elementi da prendere in consederazione.
Vi invito assolutamente a provare Grok 3 e a farmi pervenire le vostre impressioni.